“探索人工智能/深度学习的最新趋势:从元宇宙到量子计算”

Exploring the latest trends in AI/deep learning from metaverse to quantum computing.

 

人工智能(AI)领域不断发展,几种新兴趋势正在塑造着这个领域,有潜力对各行各业和日常生活产生巨大影响。近年来推动AI取得突破的一个重要因素是深度学习(DL),也被称为人工神经网络(ANNs)。DL在自然语言处理(NLP)、计算机视觉、强化学习和生成对抗网络(GANs)等领域取得了显著的进展。

使DL更加迷人的是它与神经科学的密切关联。研究人员经常从人脑的复杂性和功能性中汲取灵感,开发DL技术和架构。例如,卷积神经网络(CNNs)、激活函数和人工神经元在ANNs中都受到人脑生物神经元结构和行为的启发。

虽然AI/DL和神经科学已经掀起了重大波澜,但还有一个领域具有更大的潜力可以改变我们的生活——量子计算。量子计算有潜力革命性地提高计算能力,并在包括AI在内的各个领域实现前所未有的进展。它能够同时执行复杂计算和处理海量数据,打开了新的可能性。

 

深度学习

 

现代人工神经网络(ANNs)因其复杂的架构而被称为“深度学习”。这些网络是一种从人脑结构和功能中汲取灵感的机器学习模型。由多个相互连接的神经元层组成,ANNs在数据流经网络时处理和转换数据。术语“深度”指的是网络的深度,由其架构中隐藏层的数量决定。传统的ANNs通常只有几个隐藏层,相对较浅。相比之下,深度学习模型可以拥有几十甚至上百个隐藏层,使其深度显著增加。这种增加的深度使深度学习模型能够捕捉数据中的复杂模式和层次特征,从而在尖端机器学习任务中具有高性能。

深度学习的一个显著应用是图像到文本和文本到图像生成。这些任务依赖于DL技术,如生成对抗网络(GANs)或变分自动编码器(VAEs),从大规模数据集中学习文本和图像之间的复杂关系。这样的模型在计算机图形学、艺术、广告、时尚、娱乐、虚拟现实、游戏体验、数据可视化和故事叙述等各个领域得到应用。

   

尽管深度学习取得了显著进展,但它也面临着一些挑战和局限性。主要障碍在于计算资源和能源效率。DL模型通常需要大量的计算资源,如强大的GPU(图形处理器)或专用硬件,以高效地进行预测。这种对大量计算基础设施的依赖可能限制了缺乏足够资源的研究人员或组织对深度学习的使用。此外,训练和运行DL模型可能需要大量的计算资源,消耗大量能源。随着模型每年不断增大,能源效率的问题变得越来越重要。

 

大型模型

 

除了与大型语言和视觉模型相关的技术考虑外,全球各国政府还面临一个意外的挑战。这些政府机构正在推动对AI模型的监管,并要求模型所有者(包括ChatGPT等平台)透明地解释其模型的内部工作原理。然而,无论是OpenAI、Microsoft还是Google等主要实体,还是AI科学界,都无法对这些问题给出确切的答案。他们承认对此有一个大致的了解,但无法准确说明为什么模型提供了一个回答而不是另一个回答。最近发生的事件,如ChatGPT在意大利的禁止以及埃隆·马斯克对Microsoft未经授权使用Twitter数据的指控,只是一个更大问题的开始。似乎在知名IT公司之间正在酝酿一场新的争夺,涉及谁能够拥有“最大的模型”,以及哪些数据可以用于这样的模型。

在一篇题为“AI时代开始了”的博文中,微软联合创始人比尔·盖茨称赞ChatGPT和相关的AI进步为“革命性”。盖茨强调了解决当前挑战的“革命性”解决方案的必要性。因此,这促使重新评估“版权”、“大学和学院考试”等概念,甚至对“学习”的本质进行哲学探讨。

 

神经科学

 

在他最近的书籍《千脑理论》中,J.霍金斯提出了一种新颖且不断发展的观点,解释了人类大脑如何处理信息并产生智能行为。千脑理论认为,大脑是由成千上万个独立的微型脑组成的网络,每个微型脑负责同时处理感官输入并产生运动输出。根据这个理论,与高级认知功能相关的大脑外层皮质(新皮质)由许多功能独立的柱状结构组成,可以类比为微型脑。

该理论指出,新皮质中的每个柱状结构都会学习和模拟来自周围环境的感官输入,并对未来的感官输入进行预测。然后,将这些预测与实际的感官输入进行比较,任何差异都会被用于更新柱状结构内部的模型。这种持续的预测和比较过程构成了新皮质处理信息和产生智能行为的基础。

根据千脑理论,来自视觉、听觉和触觉等不同感官模态的输入在独立的柱状结构中进行独立处理。这些柱状结构的输出随后被合并,形成对周围环境的统一感知。这种卓越的能力使大脑能够整合来自不同感官模态的信息,并形成对周围环境的连贯表征。

《千脑理论》中的一个关键概念是“稀疏表示”。这一概念强调了人脑中仅有一小部分神经元在任何给定时间内是活跃或发放的,而其他神经元则相对不活跃或沉默。稀疏编码通过减少冗余或不必要的神经活动,实现了大脑中信息的高效处理和编码。稀疏表示的一个重要优势是它能够实现大脑中的选择性更新。在这个过程中,只有活跃的神经元或神经通路会根据新信息或经验进行更新或修改。

这种选择性更新机制使大脑能够通过将资源集中在最相关的信息或任务上,而不是同时更新所有神经元,从而高效地适应和学习。神经元的选择性更新在神经可塑性中起着重要作用,神经可塑性是指大脑通过学习和经验而改变和适应的能力。它使大脑能够根据持续的认知和行为需求,基于精炼的表征和连接进行优化,同时节约能量和计算资源。

Numenta理论的实际应用已经显现。例如,与英特尔的最近合作在自然语言处理和计算机视觉等各种用例中实现了显著的性能提升。由于这种合作,客户可以实现10倍甚至100倍以上的性能提升。

 

元宇宙

 

虽然许多人关注大型语言模型,但Meta采取了与众不同的方法。在一篇名为“从人类活动和模拟交互的视频中学习的机器人”的博文中,Meta AI团队强调了一个有趣的概念,即“莫拉维克悖论”。根据这个观点,人工智能中最具挑战性的问题与抽象思维或推理无关,而是与感知运动技能有关。为了支持这一观点,该团队宣布了在通用目的体验式人工智能代理领域的两个重大进展。

  1. 首先,他们引入了人工视觉皮层,称为VC-1。这个开创性的感知模型是第一个支持广泛的感知运动技能、环境和具象化的模型。
  2. 此外,Meta团队开发了一种创新方法,称为自适应(感知运动)技能协调(ASC)。这种方法在要求严格的机器人移动操作任务中实现了接近完美的性能,成功率达到了98%。它涉及到寻找一个物体,拿起它,移动到另一个位置,放下物体,并在物理环境中重复这些动作。

Meta的这些进展意味着他们已经偏离了对大型语言模型的主要关注。通过优先考虑感知运动技能和体验式人工智能,他们为能够以更全面和细致的方式与世界互动的代理的发展做出了贡献。

尽管ChatGPT模型引起了极大的炒作,并受到了不成比例的公众关注,但它们主要基于统计方法。相比之下,Meta最近的突破代表了重大的科学进展。这些成就为虚拟现实(VR)和机器人领域的革命性扩展奠定了基础。我们强烈建议阅读完整的文章,以获得洞察力,并为即将到来的人工智能创新浪潮做好充分准备,因为它有望以非凡的方式塑造这些领域的未来。

 

机器人技术

 

目前,该领域中的两个著名机器人是Atlas和Spot(机器狗),它们都可以在线购买。这些机器人代表了工程领域的重大成就,但它们的能力仍然受到先进“大脑”的缺失的限制。这正是Meta人工视觉皮层作为一个潜在的改变游戏规则者的地方。通过将机器人与人工智能相结合,它有能力革新许多行业和领域,包括制造业、医疗保健、交通运输、农业和娱乐等。Meta人工视觉皮层有望增强这些机器人的能力,并为机器人技术领域的前所未有的进展铺平道路。

 

 

人类的新接口:脑机接口/脑脑接口

 

虽然担心被人工智能超越的问题可能会出现,但人类大脑具有一个现代AI所缺乏的至关重要的优势:神经可塑性。神经可塑性,也称为脑可塑性,指的是大脑对经历、学习和环境变化做出反应时,无论是在结构还是功能上,能够以令人惊讶的能力进行改变和适应。然而,尽管具有这个优势,人类大脑仍然缺乏与其他人类大脑或AI系统进行高级通信的方法。为了克服这些限制,发展新的大脑接口是必要的。

传统的交流方式,如视觉、听觉或打字,由于其有限的通信速度而无法与现代AI模型竞争。为了解决这个问题,人们正在追求基于直接脑神经网络电活动的新接口。进入现代脑机接口(BCIs)的领域,这是一种尖端技术,能够实现大脑与外部设备或系统之间的直接通信和互动,绕过传统的外周神经系统通路。BCIs在神经假肢、神经康复、通信、残疾人控制、认知增强和神经科学研究等领域有应用。此外,BCIs最近也进入了虚拟现实娱乐领域,像“Galea”这样的设备已经在视野中,有可能成为我们日常生活的一部分。

另一个有趣的例子是Kernel Flow,这是一种能够从皮层捕捉脑电图和全头覆盖类似功能磁共振成像(fMRI)数据的设备。有了这样的能力,我们有可能最终直接从我们的梦中创造虚拟世界。

与“Galea”和“Kernel”等非侵入性BCIs相比,由伊隆·马斯克(Elon Musk)创立的Neuralink采取了一种不同的方法,提倡一种侵入性的脑植入物。有人将其称为“通往外界的插口”,提供的通信渠道远比任何现代非侵入性BCIs更广泛。侵入性BCIs的另一个重要优势是双向通信的潜力。想象一下未来,信息不再需要我们的眼睛或耳朵,而可以直接传递到我们的新皮质。

 

 

量子计算

 

如果神经科学和人脑还不足以引起兴趣,还有一个令人费解的话题可以探索:量子计算机。这些非凡的机器在某些计算任务上有超越经典计算机的潜力。利用量子叠加和纠缠——现代物理学的前沿——量子计算机可以进行并行计算,并更高效地解决特定问题。这些问题包括分解大数、解决复杂的优化问题、模拟量子系统以及未来概念中的量子传送。这些进展有望彻底改变密码学、药物发现、材料科学和金融建模等领域。要亲身体验量子编程,您可以访问www.quantumplayground.net,并在几分钟内编写您的第一个量子脚本。

尽管未来的走向充满不确定性,但有一点是清楚的:人类未来的轨迹将由个人、社区、机构和政府的选择和行动所塑造。我们必须共同努力实现积极的变革,解决紧迫的全球问题,促进包容性和可持续发展,并共同努力创造一个更美好的未来,造福全人类。     Ihar Rubanau 是Sigma Software Group的高级数据科学家