AI正在吞噬数据科学
当一切都已经结束,AI被普遍认可为我们合法的霸主时,数据科学作为一个独立的领域的想法将只是我们集体雷达上的一个短暂闪光点
作为21世纪技术革命的基石,数据科学被视为每个行业的未来。但仔细观察发现,数据科学作为一门学科只存在了很短的时间,是从一个数据贫瘠的过去到一个被智能系统主导的未来的过渡。
不久之前,我们被稀少的数据和高昂的数据存储成本所困扰。快进到今天,由于我们新发现的数字主要设施,包括互联网、社交媒体、电子商务和物联网设备,我们不断被数据淹没。数据科学已经发展成为获取见解、预测趋势和在大数据时代初期做出决策的工具,帮助我们理解这些海量数据集。大数据时代现在已经完全到来,我们已经牢固地定居下来。
然而,随着处理大数据的能力增强,变化正在显现。重点不再是我们不停产生的大量数据;我们已经把注意力转向了不断增多的复杂数据驱动的AI系统。关键问题不再仅仅是“我可以从这些数据中得出什么见解?”而是“我可以用这些数据跑什么AI系统?”过去的十年集中在掌握大数据上。接下来,我们承诺将转向设计和实施更强大的AI系统。
这种新兴趋势标志着数据科学正在与AI职业道路融合:另一个由AI驱动的奇点。这不仅仅是关于分析数据的能力,还包括构建、培训和维护可以学习、适应和做出自主决策的AI系统。这些角色的整合代表着越来越AI中心的局面。
要看到这种变化的实际效果,只需看看OpenAI的ChatGPT项目。最初,该项目重点是收集和组织大量数据以训练模型。然而,重点很快转向尝试创建和改进大规模系统,这些系统能够生成有意义的、上下文自然语言响应。数据和系统之间的交互将变得更加动态,AI将以越来越复杂和创新的方式使用数据。
想象一下一个由AI驱动的智能城市成为常态的未来。从传感器、设备、人类互动等方面产生的大量数据将被AI消耗,以控制交通流量、能源消耗、公共安全等。这超越了数据分析。它是关于开发能够理解和管理复杂城市生态系统的巨型AI系统。
数据科学可能似乎正在演变成为当代AI的一个分支,因为,好吧,它确实是。但不要担心,因为这只是为了跟上不断演变的技术景观所做的一步进化,就像数据科学从统计学中出现来应对曾经出现的“大数据”一样。就像统计学是数据科学的一个重要组成部分一样,数据科学本身将在AI驱动的未来中继续扮演重要角色。
十多年前开始的与数据相关的转型仍在继续,尽管它的目的地尚不明确。然而,方向是清晰的:未来的技术行业职业要求不仅要理解孤立的数据,还要理解数据作为复杂而多才多艺的AI系统的生命线。在这种背景下,数据科学最终将被回顾并被视为通向以AI为中心的未来的重要里程碑。然而,毫不怀疑,数据科学本身最终也会被回顾。
因此,随着人工智能最近的进步开始在世界各地留下它的痕迹,要注意它对数据科学的不可避免的消耗。正如数据现在变得越来越大一样,我们对它所能培育的系统的愿望也是如此。
Vivat data magna!
Matthew Mayo(@mattmayo13)是一位数据科学家,也是小猪AI的主编,这是一份开创性的在线数据科学和机器学习资源。他的兴趣在于自然语言处理、算法设计和优化、无监督学习、神经网络和自动化的机器学习方法。Matthew拥有计算机科学硕士学位和数据挖掘研究生文凭。他的电子邮件是editor1 at 小猪AI[dot]com。