在生成式人工智能时代,数据科学家是否仍然需要?
ChatGPT的兴起
恰好两年前,我写了一篇名为“数据科学家将在10年内灭绝”的观点文章。令我惊讶的是,它成为了我在小猪AI和小猪AI上最受欢迎的文章之一。然而,这篇文章引起了极端的反响。它是我成年以来收到的批评最多的文章。我预言了21世纪最性感(也是最受欢迎的)工作之一的消亡,我的同行们提出了异议,但我接受了反馈,生活继续下去。现在快进两年;两年的差异多么大啊。ChatGPT席卷了整个世界,随之而来的是一个具有更大影响的叙述,即在每个行业中,人力资本的过时。
这场革命似乎一夜之间发生了。但是我们这些密切关注深度学习进展的人都知道,这并不是突然发生的。ChatGPT是几十年研究的积累,不可思议地汇集成了一个不起眼的聊天机器人。在ChatGPT成功的核心是它民主化了人工智能。精通编程和具有深入的技术知识不再是进入门槛,接触前沿的深度学习已经超越了学术研究和大型科技公司,可以随时通过拥有Wifi访问和电子邮件地址的任何人获取。
为什么数据科学家灭绝了?
在我最疯狂的梦想中,我从未想过我们处于一个如此之快、如此之大、如此之自然的技术革命的边缘?在LLMs和文本到图像模型之前,生成式人工智能(GAI)在很大程度上与Ian Goodfellow的生成式对抗网络(GANs)同义。它被誉为近年来最伟大的人工智能研究贡献之一,体现在使用一对神经网络生成合成的逼真照片。我们中的一些人以前曾使用过GANs,知道它们训练起来非常困难,即使正确实施,当时的用例也是有限的。因此,更令人惊讶的是,生成式深度学习已经宣告了最新的进展。
那么为什么ChatGPT(及其GAI同行)会使数据科学家走向灭绝?让我们重新审视两年前的原始论点:
- 只会复制代码和使用软件包将不再定义数据科学家,因为低代码/无代码解决方案已经变得普遍。
- 能够处理和分析数据将成为许多角色的基本技能,就像计算机技能和MS Office知识一样。
- 在这种范式中,能够解决现实世界问题的领域专家将表现出色。数据科学将成为他们工具箱的一部分。
- 在上述情况下,通用数据科学家将被领域专家取代。
鉴于此,我们可以看到GAI几乎实现了上述所有点。它可以根据文本提示生成代码、数据集的分析和查询结果。对于那些能够使用ChatGPT的AI准备就绪的专业人员的需求已经开始渗透到工作描述中,尽管使用GAIs带来了生产力的提高,但AI仍然容易出现幻觉,它仍然可能出错,这强调了深入的领域专业知识来解决这些情况的必要性。总之,这并不需要10年,只需要两年。
然而,数据科学家的灭绝并不意味着从事数据科学的人将变得过时,事实上恰恰相反。当我们回顾历史,过去200年,我们见证了几次技术革命,其中包括蒸汽动力、大规模生产和个人计算机等。每一次革命都使我们比上一次更具生产力,随着我们与技术的角色和关系的演变,这个概念在经济理论(Solow增长模型)中已经根深蒂固。在当前环境下,企业正在创建和捕获比以往任何时候都更多的数据,因此数据科学技能将始终受到需求,但未来的数据科学家将不会被称为数据科学家,而是被称为产品经理、营销专家或投资分析师等名称。数据科学家灭绝了,数据科学万岁。
声明:观点和意见是作者自己的。
Michael Wang是一位投资和数据科学从业者,在金融科技、投资、交易和教学等各种角色中拥有超过10年的行业经验。他是WhyPred的首席顾问和创始人,这是一家专门将金融市场专业知识与人工智能和机器学习相结合的分析咨询公司。