ChatGPT会取代数据科学家吗？

每个工作都面临风险下面是如何让你的职业免受人工智能的影响

如果您在数据行业工作或渴望从事此行业，您可能会想知道是否是时候进行职业转变了。

生成模型如ChatGPT是否会终结数据科学家的职业？

作为一个从事数据科学工作三年的人，我想提供我的观点。

在我之前写的一篇文章中，我坚决反对自动化AI软件能够取代数据科学家的观点。我的观点是，这些工具在一定程度上可以提高组织效率，但缺乏可定制性，并且在每个阶段都需要人的参与。

但那是在2022年2月之前，也就是在ChatGPT、OpenAI的革命性语言模型发布之前。

当ChatGPT首次公开发布时，它是基于GPT-3.5的，这是一个能够理解自然语言和代码的模型。

然后，在2023年3月，GPT-4发布了。这个算法在逻辑、创造力和推理等问题的解决上胜过了它的前身。

以下是关于GPT-4的一些事实：

它可以编写代码（而且写得非常好）
它通过了律师资格考试
它在机器学习基准测试中胜过了大多数最先进的模型

这个模型可以将一个草图转化为一个完整的网站，并作为编程和数据科学任务的好助手。

它已经被组织机构用来提高效率。

Freshworks的首席执行官Girish Mathrubootham表示，以前需要员工9周时间完成的编程任务现在只需几天时间就能完成，这得益于ChatGPT。

通过生成式AI，这家公司的编码工作流程完成速度约为通常速度的20倍。这将大大缩短交付时间，意味着公司可以更快地完成更多工作。

负面影响 – 为什么你的工作有风险

产品整合

到目前为止，我们只谈到了编程方面。

数据科学家的工作还有其他方面，比如数据准备、分析、可视化和模型构建。

根据我的经验，由于他们被期望具备多种技能，数据科学家目前非常受欢迎。

除了构建统计模型和学习编码外，这些专业人员还需要使用SQL进行数据提取，使用Tableau和PowerBI等软件进行可视化，并有效地向利益相关者传达见解。

然而，随着像ChatGPT这样的语言模型的采用增加，进入数据科学或分析领域的门槛将大大降低。候选人不再需要在各种软件方面具备专业知识，而是可以利用语言模型的力量在几分钟内完成通常需要数小时才能完成的任务。

例如，在我曾经与之合作的一家公司中，我被要求完成一个限时的Excel评估，因为该组织的大部分数据库都存在于电子表格中。他们希望能雇佣一个能够快速提取和分析这些数据的人。

然而，随着语言模型的采用增加，雇佣具有使用特定工具专业知识的候选人的要求将消失。

例如，通过ChatGPT-Excel的整合，您只需突出显示要分析的单元格，并问语言模型一些问题，如“这些销售数字在过去一个季度的趋势如何？”或“你能进行回归分析吗？”

这样的产品整合将使Excel和其他类似软件对于通常不使用它们的人来说更加易于使用，并且对该工具的专家的需求将减少。

代码插件

ChatGPT代码解释插件是另一个例子，说明数据科学工作流正在实现民主化。它允许您在聊天中运行Python代码并分析数据。

您可以上传CSV文件，并让ChatGPT帮助您清理、分析和构建统计模型。

一旦你分析数据并告诉它你想要做什么（例如，预测下个季度的销售额），ChatGPT将告诉你可以采取的步骤来实现最终结果。

然后，它将为你进行实际的分析和建模，并在每个阶段解释输出。

在本文中，作者要求ChatGPT的代码解释器使用联邦储备经济数据（FRED）预测未来的通货膨胀趋势。算法首先通过可视化数据中的当前趋势开始。

然后，它检查数据的平稳性，对其进行转换，并决定使用ARIMA进行建模。它甚至能够找到使用ARIMA生成预测的最优参数：

对于一个数据科学家来说，这些步骤通常需要花费大约3-4个小时的时间，而ChatGPT只需通过简单地摄取用户上传的数据就能在几分钟内完成。

这是一项令人印象深刻的成就，将大大减少实施模型构建过程所需的专业知识。

那么…是否仍然需要人类专业知识？

当然，无论AI在编码和模型构建方面有多么出色，人类专家仍然需要监督整个过程。

在构建统计模型时，ChatGPT经常会生成错误的代码和错误的决策。公司仍然需要雇佣擅长统计和编程的员工来监督数据科学过程，以确保模型被正确推动。

LLMs无法创建全面的数据产品，因为人类仍然需要执行需求收集、调试和验证模型的输出等任务。

然而，公司在执行这些任务时将无需如此多的人员。

由LLMs带来的显著效率提升意味着团队可以开始裁员。

例如，公司可以只雇佣5名数据科学家来完成工作，而不是10名。

我认为，初级数据科学工作将首先受到这一发展的影响，因为LLMs已经能够执行中级编码和分析工作流程。

由于AI的原因，大型科技公司已经冻结了招聘，我们可能正在目睹数据科学劳动力超过对这种技能的需求的情况。

如何在ChatGPT时代保护你的职业

幸运的是，对于我们技术和数据科学专业人士来说，并非一片绝望。尽管LLMs在编程和数据分析等任务上迅速提高，但它们无法取代人类的创造力和决策能力。

以下是在LLMs时代保护你的职业的一些方法：

获得业务专长

组织将继续雇佣为企业创造收入的人。

如果你在某个特定领域具有领域专长，并了解公司的运营和客户需求的复杂性，你就处于独特的位置来识别增长机会。

你最不想做的事情就是在人工智能领域竞争 – 你不想成为管理电子表格的人，或者是每个人都找来创建季度绩效报告的人。这些工作很容易被自动化，将是ChatGPT时代首先被淘汰的工作。

我认为，与其将精力集中在学习LLMs可以比你更快掌握的特定软件上，不如学会看到更大的图景。发展领导和管理技能，了解如何通过数据利用人工智能来实现公司的目标。

拥抱人工智能

根据皮尤研究中心的数据，只有14%的成年人实际上尝试过ChatGPT。如果你正在阅读本文，使用ChatGPT学习新知识，并密切关注人工智能的进展，那么你就是一个早期采用者。

我建议将LLMs融入你的工作流程中，使用与人工智能集成的产品，并学习最佳实践以最大化这些模型的效率。

这样，你就能保持领先，更好地理解你的工作中哪些部分可以被自动化，哪些部分需要人为干预。

这不仅会使你成为一个更好的数据科学家，而且当组织开始将人工智能纳入不同的业务领域时，你将处于最佳位置，以提供建议如何利用人工智能增加生产力。

实际上，最近出现了一种称为”提示工程师”的新角色，年薪高达33.5万美元。提示工程师是擅长让生成型人工智能应用按照他们的意愿工作的专家。

一个优秀的提示工程师是那种可以将人工智能”项目管理”起来完成像设计网页应用这样的任务的人。

无论您是否想从事提示工程师的工作，将人工智能融入到现有的工作流程中将使您比那些目前没有这样做的人具有竞争优势。

多元化收入

随着组织开始开发融入人工智能的新业务战略，它们将很快开始进行重组。

如果这导致大规模裁员，保护自己的唯一方法就是拥有不仅仅依赖全职工作的多个收入来源。

我建议创建一个自由职业者作品集 – 在多个组织工作并获得被动收入将确保您的未来不依赖于单一雇主的决策。

打造个人品牌

最后，哈佛商业评论建议打造个人品牌，使自己与众不同。

例如，像Tim Denning和Jessica Wildfire这样的小猪AI作家，即使人工智能能够模仿他们的写作风格，仍然会拥有忠实的粉丝和消费者。

这是因为归根结底，人们喜欢真实的故事，想要与其他个体建立联系，而这是人工智能无法提供的。

同样，组织将继续聘请在该领域有认可度的行业领导者，作为质量和品牌的象征。建立个人品牌的一些方法包括建立数据科学作品集，创建内容和不断提升技能。

要点

生成模型将改变就业环境，数据科学、分析和编程等领域将因这些工具提供的效率提升而受到影响。

然而，这并不意味着数据科学家的终结。遵循上述策略可以帮助您保持领先，并确保您不与人工智能竞争。Natassha Selvaraj是一位自学成才的数据科学家，对写作充满热情。您可以在LinkedIn上与她联系。

Data Science

ChatGPT会取代数据科学家吗？

负面影响 – 为什么你的工作有风险

产品整合

代码插件

那么…是否仍然需要人类专业知识？

如何在ChatGPT时代保护你的职业

获得业务专长

拥抱人工智能

多元化收入

打造个人品牌

要点

AI登上太空！NASA将推出类似ChatGPT的航天器通信聊天机器人

使用教科书级质量的合成数据训练语言模型

在Databricks中使用自定义Docker容器运行Pytho...

在南美利亚大陆利用降水和气候栅格数据

去噪的黎明：用于表格数据填充的多输出机器学...

使用Hugging Face Datasets工作

在机器学习系统中维护数据质量

帮助数据科学家成长的技能

数据科学