六个对工程师有用的资源
6 useful resources for engineers
嗨。我是Alex Goncharik,我已经从事计算机视觉和深度学习工作超过五年了。起初,我是一名.Net开发人员,但在某个时候,我阅读了一篇关于机器学习的文章,并对这个领域产生了浓厚的兴趣。
我有数学和Python的背景,所以我开始积极地自学。起初,我观看视频课程和阅读文章,然后我开始解决一些简单的问题,后来,我有机会参与与计算机视觉技术相关的项目。
两年前,我加入了iScanner团队,这是一款基于人工智能的扫描和编辑文档的应用程序,我们有可能从零开始开发AI算法。例如,我们实现了自己的算法来消除扫描文档中的曲线和倾斜,并删除手指。
我目前在iScanner, BP Mobile(AIBY Group)担任首席计算机视觉和深度学习工程师职位。我和我的同事经常讨论与我们领域相关的新闻,并交流文章和链接。当你成为一名专业人士时,很难找到有用的资源,所以我决定与VoAGI读者分享我的推荐。一些资源对初学者会感兴趣,而其他资源则对经验丰富的专业人士更有吸引力。
MIT深度学习书(Ian Goodfellow,Yoshua Bengio,Aaron Courville)
这是目前关于深度学习最全面的书籍,以免费的HTML书的形式提供。本书作为了解深度学习复杂性的重要指南,从基本概念到高级应用都有涵盖。它涵盖了广泛的主题,提供了理论和实践见解,并且适用于各种背景的学习者。作者不仅仅是浅尝辄止地介绍深度学习,他们深入探讨了定义神经网络、优化算法和正则化技术的数学基础。
深入理解深度学习(Andrew W. Trask)
这本书在将理论概念与实际理解之间架起了桥梁,使其成为初学者的理想起点。作者巧妙地将复杂的思想分解为易于理解的部分,确保即使没有强大的技术背景,读者也能够跟上。
Trask使用Python代码示例,并侧重于直观的解释,以促进对材料的更深理解。代码示例相对简单,可能不能涵盖所有高级深度学习技术的全貌。
计算机视觉:算法与应用(Richard Szeliski)
这本书是计算机视觉领域的黄金标准。通过案例研究和实际场景,您可以了解计算机视觉在机器人技术、医学成像和增强现实等领域的应用。
Szeliski清晰地解释了复杂的概念,并将复杂的思想转化为易于理解的术语。它涵盖了广泛的主题,从图像形成和相机模型到3D视觉和运动估计等高级技术。此外,该书在处理数学基础方面表现出色。
统计学习导论(Gareth James,Daniela Witten,Trevor Hastie和Robert Tibshirani)
这本书全面介绍了统计学习的基础知识。它从统计学习的基本概念开始,逐步深入到线性回归、分类、重采样方法等更高级的主题。每个概念都配有真实世界的例子和案例研究,巩固理解并阐明这些技术在实践中的应用。
该书的一个突出特点是它集成了R编程进行实际实现。附带的R代码允许您复制示例,操作数据,并尝试所呈现的算法。
斯坦福大学工程学院的讲座系列
这些讲座的编译展示了斯坦福大学在全球范围内分享有价值的见解和培养知识智慧的承诺。这个讲座系列深入探讨了深度学习架构的细节,重点关注学习端到端模型的任务,特别是图像分类。通过这个讲座系列,您将学习如何实现、训练和调试自己的神经网络,以及对计算机视觉领域的前沿研究有详细的了解。这是一个与工程和技术领域最聪明的人才学习的独特机会。
斯坦福大学CS229:机器学习课程(由Andrew Ng教授)
Andrew Ng有能力以易于理解的方式传达复杂的想法。他的实践练习为学习者提供了实现和实验机器学习算法的机会。课程的进展被巧妙地设计,逐步引导学习者从基础概念到更高级的技术。虽然机器学习涉及数学概念,但课程提供了简明的解释。Andrew Ng的专业知识,加上课程的结构良好的课程安排和实际作业,创造了一个宝贵的资源。