回归基础第四周:高级主题和部署

『回归基础:高级主题与部署的第四周』

加入VoAGI,我们的Back to Basics路径可以帮助您开始一项新的职业或提高您的数据科学技能。 Back to Basics路径分为4周,还有一个额外的周。我们希望您可以使用这些博客作为课程指南。

如果您还没有,请查看:

进入第三周,我们将深入研究高级主题和部署。

  • 第1天:探索神经网络
  • 第2天:介绍深度学习库:PyTorch和Lightening AI
  • 第3天:5个步骤入门PyTorch
  • 第4天:使用PyTorch构建卷积神经网络
  • 第5天:自然语言处理入门
  • 第6天:部署您的第一个机器学习模型
  • 第7天:数据科学的云计算入门

探索神经网络

第4周 – 第1部分: 探索神经网络

释放人工智能的力量:神经网络及其应用指南。

想象一台机器像人脑一样思考、学习和适应,并在数据中发现隐藏的模式。

这种技术,神经网络(NN),是模拟认知的算法。我们将在以后探讨神经网络的工作原理。

在本文中,我将向您解释神经网络的基本方面-结构、类型、现实生活中的应用和定义操作的关键术语。

深度学习库介绍:PyTorch和Lightning AI

第4周 – 第2部分: 深度学习库介绍:PyTorch和Lightning AI

对PyTorch和Lightning AI的简单解释。

深度学习是一种基于神经网络的机器学习模型的分支。在其他机器模型中,通过手动处理数据以查找有意义的特征,或者依赖领域专业知识来处理数据;然而,深度学习可以模拟人脑,发现关键特征,提高模型性能。

深度学习模型有许多应用,包括人脸识别、欺诈检测、语音转文本、文本生成等等。深度学习已成为许多高级机器学习应用的标准方法,学习它们是不会有损失的。

为了开发这个深度学习模型,我们可以依赖各种库框架,而不必从头开始。在本文中,我们将讨论两个不同的库,用以开发深度学习模型:PyTorch和Lighting AI。

5个步骤入门PyTorch

第4周 – 第3部分: 5个步骤入门PyTorch

本教程提供了关于使用PyTorch及其高级封装PyTorch Lightning进行机器学习的深入介绍。本文涵盖了从安装到高级主题的基本步骤,并提供了实践的方法来构建和训练神经网络,并强调使用Lightning的好处。

PyTorch是一种流行的基于Python的开源机器学习框架,经过优化以进行GPU加速计算。PyTorch最初由Meta AI于2016年开发,并现在是Linux Foundation的一部分,已迅速成为深度学习研究和应用中最广泛使用的框架之一。

PyTorch Lightning是建立在PyTorch之上的轻量级封装,进一步简化了研究人员工作流程和模型开发的过程。使用Lightning,数据科学家可以更多地专注于设计模型,而不是样板代码。

 

使用PyTorch构建卷积神经网络

 

Week 4 – Part 4: 使用PyTorch构建卷积神经网络

本博文介绍了如何使用PyTorch构建用于图像分类的卷积神经网络,利用卷积和池化层进行特征提取,以及全连接层进行预测。

卷积神经网络(CNN或ConvNet)是一种专门设计用于目标识别关键任务(如图像分类、检测和分割)的深度学习算法。CNN能够在复杂的视觉任务上实现最先进的准确性,驱动着许多现实生活中的应用,如监控系统、仓库管理等。

作为人类,我们可以通过分析图案、形状和颜色轻松识别图像中的对象。CNN也可以通过学习哪些模式对区分很重要来执行此识别。例如,当试图区分猫和狗的照片时,我们的大脑会关注独特的形状、纹理和面部特征。CNN学习识别这些相同类型的区分特征。即使对于非常细粒度的分类任务,CNN也能够直接从像素中学习复杂的特征表示。

 

自然语言处理简介

 

Week 4 – Part 5: 自然语言处理简介

对自然语言处理(NLP)及其应用进行概述。

我们对ChatGPT和大型语言模型(LLMs)有了很多了解。自然语言处理是一个有趣的话题,目前正在AI和技术领域引起轰动。是的,像ChatGPT这样的LLMs推动了它们的发展,但是了解它们的根源是不是也很有意思呢?那么让我们回到基础 – NLP。

NLP是人工智能的一个子领域,它是计算机通过语音和文本检测和理解人类语言的能力,就像我们人类一样。NLP帮助模型处理、理解和输出人类语言。

NLP的目标是弥合人类与计算机之间的沟通差距。NLP模型通常在诸如下一个单词预测之类的任务上进行训练,这使它们能够建立上下文依赖关系,然后能够生成相关的输出。

 

部署第一个机器学习模型

 

Week 4 – Part 6: 部署第一个机器学习模型

只需3个简单的步骤,您就可以构建和部署一个玻璃分类模型,比你说…玻璃分类模型的速度更快!

在本教程中,我们将学习如何使用玻璃分类数据集构建一个简单的多分类模型。我们的目标是开发和部署一个可以预测各种类型玻璃的Web应用程序,例如:

  1. 建筑窗户浮法处理
  2. 建筑窗户非浮法处理
  3. 车辆窗户浮法处理
  4. 车辆窗户非浮法处理(数据集中缺失)
  5. 容器
  6. 餐具
  7. 车灯

此外,我们还将学习以下内容:

  • Skops:分享基于scikit-learn的模型并投入生产。
  • Gradio:机器学习Web应用程序框架。
  • HuggingFace Spaces:免费机器学习模型和应用程序托管平台。

通过本教程,您将亲身体验构建、训练和部署基本机器学习模型作为Web应用程序的实践经验。

云计算入门教程之数据科学

第四周 – 第七部分:云计算入门教程之数据科学

还有现代技术的强大结合。

在今天的世界中,两个主要力量已成为改变游戏规则的因素:数据科学和云计算。

想象一个每秒都在产生海量数据的世界。好吧…不用想象…这就是我们的世界!

从社交媒体互动到金融交易,从医疗记录到电子商务偏好,数据无处不在。

但如果我们无法获得价值,这些数据有什么用呢?这正是数据科学所做的。

那么我们在哪里存储、处理和分析这些数据?这就是云计算的优势所在。

让我们踏上一段旅程,了解这两个技术奇迹之间错综复杂的关系。让我们一起(试着)去发现它们吧!

总结

恭喜您完成第四周的学习!!

VoAGI团队希望《回归基础》路径为读者提供了一种全面和结构化的学习数据科学基础的方法。

下周一将发布额外的一周,请继续关注!

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)****是一名数据科学家和自由技术作家。她特别有兴趣提供数据科学职业建议或教程以及数据科学领域的理论知识。她还希望探索人工智能在延长人类寿命方面的不同方式。作为一名热心的学习者,她希望扩展自己的技术知识和写作技能,并帮助指导他人。