如何使用ChatGPT更快地学习数据科学,即使你已经很高级了
探讨数据科学在人工智能驱动的未来中的相关性,并提供通过利用人工智能工具有效学习数据科学的逐步指南

目录
• 数据科学仍然重要吗?
• 为什么应该使用人工智能来学习数据科学?
• 如何通过利用人工智能来学习数据科学
- 步骤1:制定学习路线图
- 步骤2:设计 ChatGPT 作为我的导师
- 步骤3:制定学习计划
- 步骤4:尝试像 AutoGPT 这样的高级工具
- 步骤5:进行项目
- 初学者项目解析
- 高级从业者项目解析
• 结论
在短时间内,一切都发生了变化。像 ChatGPT 和 GPT-4 这样的人工智能工具正在接管并彻底改变教育和技术技能学习的格局。我觉得有必要撰写这篇文章来解决一些重要问题:
- 在人工智能的新时代,学习数据科学仍然重要吗?
- 如果是的,通过利用现有的新技术,学习这些技能的最佳方式是什么?如果我现在必须重新开始学习,我该如何做?
- 数据科学的未来会是什么样子?
数据科学仍然重要吗?
随着人工智能的不断发展,数据科学家会变得过时还是比以往更加重要?
从个人角度来看,我仍然觉得我给我的客户带来的价值超过了人工智能,而且我能够(至少)将我的工作产出提高一倍。现在,我觉得人工智能不会夺走我的工作,但是,现实情况比以往更加不确定。
在你担心工作消失之前,让我们看一个情景:在未来的某个时候,你经营着一家公司,有人工智能为你做分析工作。
你会希望谁来运行人工智能、指导它并监督它?你希望是有数据科学或软件工程背景的人来监督这些程序,还是喜欢没有受过训练的人?

我觉得答案很明显。你会希望有经验和了解如何处理数据的人来运行这些人工智能系统。
从短期来看,这种情况希望只是假设。但是这确实让我对这些技能的某些方面具有一定的信心。
即使格局发生变化,数据科学家做的编码工作更少了,我仍然觉得通过学习这个领域所培养的这些技能在与人工智能更深度融合的世界中将非常有用。人工智能根植于数据科学,在某种程度上,我们比其他职业更多地与这个系统融合在一起。
此外,人工智能仍然会出现幻觉,我们需要尽可能多地了解这方面知识的人,并充当反馈循环。
虽然我对数据科学家工作的未来感到不确定,但有一件事我非常确定:数据、分析和人工智能将在我们未来的生活中扮演更重要的角色。你不觉得学习这些领域的人将更有相对成功的机会吗?
为什么应该使用人工智能来学习数据科学?
如果我不认为学习数据科学仍然有价值,那么这篇文章就到此结束了。明确地说,我仍然认为学习数据科学仍然是百分之百值得的。但是,坦率地说,仅仅学习数据科学已经不够了。你还需要学习如何使用新的人工智能工具。
有趣的是,学习数据科学和这些人工智能工具比只学习数据科学要容易得多。让我解释一下。
恰好你正好进入了学习这两个领域的最佳时机。

如果你通过利用现有的人工智能工具来学习数据科学,你将获得双重好处:
- 你将通过与人工智能一起学习数据领域获得更个性化和迭代的教育体验
- 你还将同时提升人工智能工具的技能
如果我的计算是正确的,你将获得一倍的好处,但只需付出一半的努力。
如果掌握使用人工智能工具能帮助你找到工作并做得更好,那么与其忽视它们,不如学会如何使用它们。在过去的三个月里,我感觉自己对数据科学的了解比过去三年总和还要多。我将这主要归因于使用ChatGPT。

那么,你该如何做到这一点?你如何真正通过人工智能学习数据科学呢?
如何实际学习数据科学与人工智能
如果我必须从头开始学习,这正是我会做的事情,因为现在有了这些工具。
步骤1:制定路线图
我会制定一份路线图。你可以通过查看其他课程或与ChatGPT进行对话来完成这一点。你可以直接向它询问,让它根据你的学习目标为你制定一份数据科学学习路线图。

如果你没有学习目标,你也可以要求它为你创建一个列表,然后你可以选择你喜欢的。
如果你想了解更多关于制定教育路线图的信息,请查看这篇文章,我在其中更深入地讨论了这个主题。
步骤2:将ChatGPT设计为我的导师
我会设计ChatGPT成为我的导师。你可以使用GPT-4创建人物角色,这可能是我最喜欢的功能之一。你可以使用以下提示:
在这种情况下,你是世界上最好的数据科学老师之一。请以帮助我最好地理解该领域的方式回答我的数据科学问题。请使用许多现实世界的或实践性的例子,并给我相关的练习问题。
步骤3:制定学习计划
我可能有偏见,但我认为免费课程或付费课程,比如我的课程,仍然是创建学习结构的好选择。在学习过程中,你可以要求ChatGPT导师给你举例,深入讲解主题,并给你练习问题。
步骤4:尝试AutoGPT等高级工具
如果你在人工智能方面稍微有些进阶,你可以使用AutoGPT等工具为自己生成课程大纲。我可能会尝试这样做,看看它能给出什么。如果我尝试了,我会在我的GitHub上分享。我还在我的播客中对GPT-4进行了深入的访谈,讨论了GPT-4是什么。
步骤5:做项目
如果你已经熟悉编码,你可能可以直接开始做项目。我个人在与ChatGPT同时进行项目时学到了很多。我在进行房地产Kaggle挑战时就是这样做的。
如果这是你的第一个项目,只要求它完成任务就可以了,但随着你的进步,你希望更有意识地和它进行互动,更有效地利用它。
让我们来比较一下初学者和高级实践者在项目学习上的不同方式。
初学者项目演练
初学者的项目演练可能是这样的:
- 你向ChatGPT提供关于数据的行和列的信息
- 你要求它创建样板代码,用于探索数据的空值、异常值和正态性
- 你询问它应该向这些数据提出什么问题
- 你要求它清理数据并为你构建模型,以便对因变量进行预测
虽然它似乎为你做了所有的工作,但你仍然需要在你的环境中运行这个项目。在此过程中,你也在提问和解决问题。
与复制别人的项目不同,它并不能保证一切都能顺利进行,所以我觉得这是一个非常好的学习平衡点。
高级实践者项目演练
现在,让我们思考一下高级实践者如何使用这个工具:
1. 你可以按照生成样板代码的相同步骤,但应该进行扩展。因此,你可能希望更多地进行数据的实际探索和假设检验。也许,选择一个或两个你想通过数据和描述性统计回答的问题,并开始分析它。

2. 对于那些已经做过几个项目的人,我建议你自己生成一些代码。比如你在plotly中制作了一个简单的条形图,你可以将它传入并要求ChatGPT重新格式化,改变颜色或比例尺等。

通过这样做,你可以快速迭代可视化效果,并实时观察不同的代码调整如何改变图形。这种即时反馈对学习非常有帮助。

3. 我还认为你应该审查这些更改并查看它们是如何进行的。如果你对某些东西不理解,只要在那里向ChatGPT提问,让它进一步解释。
4. 高级实践者还应更加重视数据工程和代码生产线。这些都是你仍然需要亲自动手完成的工作。我发现ChatGPT能够帮我完成部分工作,但我仍然需要进行大量调试。
5. 从那时起,你可能希望让AI运行一些算法并进行参数调整。老实说,我认为这将是数据科学中最快被自动化的部分。我认为参数调整对普通实践者来说将会出现收益递减,但对于最高水平的Kaggler可能不是这样。
6. 你应该把时间放在特征工程和特征创建上。这也是AI模型可以帮助的事情,但不完全能够掌握。当你有一些不错的模型后,看看你可以添加什么数据,创建什么特征,或者进行什么转换来提高结果。
在这个拥有先进AI工具的世界里,我认为做项目比以往任何时候都更加重要。你必须建立东西,并分享你的工作。幸运的是,借助这些AI工具,这也比以往任何时候都更容易。制作一个网页应用程序更容易了。使用以前从未接触过的新软件包也更容易了。

我强烈鼓励您在数据科学工作中创造真实的影响和有形的事物。当他人也在使用这些工具学习和构建时,这将是区分自己的新方式。
结论
世界在变化,数据科学也在变化。您准备好接受挑战并用您的项目创造真实的影响吗?
我之前提到过,但我认为我们所有人的工作方式正在改变。我认为现在对所有领域,包括数据科学来说,都是一个不确定的时期。
另一方面,我认为数据科学是一种优秀的技术和问题解决能力的结合,几乎可以适应任何新的世界或领域。
在我的播客中,我详细讨论了我认为数据科学是最接近纯企业家精神的领域之一。我认为在一个被人工智能改变的世界中,我们需要尽可能利用这种企业家精神。
如果您喜欢这篇文章,请记得在小猪AI上关注我,获取更多类似内容,或通过电子邮件订阅我。您还可以将本文分享和推荐给对数据科学感兴趣的人群!
如果您喜欢有趣且富有信息的关于数据科学、机器学习和人工智能的视频,请查看我的YouTube频道,我在那里提供评论、教程和其他教育视频。
要获取我在内容创作方面的每周更新以及数据科学行业的其他学习资源,请订阅我的通讯,Data Dribble!
此外,考虑通过注册会员来支持我和其他成千上万的作者。
通过我的推荐链接加入小猪AI – Ken Jee
作为小猪AI会员,您会员费的一部分将支付给您阅读的作者,您将获得完全访问所有故事的权限…
小猪AI.com
下次再见,祝您在数据科学之旅中好运!