利用人工智能加速光通信

Credit: Shutterstock.com

光子计算一直经历着研究突破和深度研究冬季,就像人工智能(AI)的历史一样。现在,随着AI的复兴,今天大型神经网络模型在电子计算机上运行时需要的巨大能量量,重新唤起了将两者结合起来的兴趣。

30多年前,在人工神经网络研究繁荣期间,加州理工学院的Demetri Psaltis和他的同事们展示了如何使用全息术的技术进行基本面部识别。该团队成员展示了他们可以使用液晶显示器的核心元素存储多达10亿个两层神经网络的权重。类似的空间光调制器成为了几个试图商业化光计算技术的基础,包括英国初创公司Optalysys,该公司近年来专注于将该技术应用于加速同态加密以支持安全远程计算。

虽然一些团体正在使用空间光调制器进行AI,但它们只代表了适合该工作的一类光学计算机。还有决定哪种形式的神经网络最适合光学计算的决策。有些技术专注于主流深度学习流水线的矩阵算术运算,而另一些则专注于仿真生物大脑的脉冲列。

所有提出的系统共同具有的可能性是,通过使用光子进行通信和计算,它们将在密度和速度方面比纯电信号传输的系统提供主要优势。2021年,Princeton大学的Mitchell Nahmias(现为初创公司Luminous Computing的CTO)和他的同事们对基于矩阵算术的推理进行的一项研究认为,光学领域中AI推理的理论效率可以远远超过现有电子架构的常规加速器。

机器学习的关键问题是移动数据的能量消耗。电子加速器通常采用缓存尽可能多的数据的策略,以减少这种开销,具体取决于模型的结构,关于是否将临时结果或权重保留在缓存中存在重大的权衡。然而,将光子传输到跨越单个芯片跨度以上的距离的能量成本远低于电信号传输的能量成本。

光学AI的第二个潜在优势来自于它可以轻松处理模拟域中的复杂操作,尽管在通信方面可实现的节能效果不太确定。在传统系统中,矩阵算术依赖于高度并行化的硬件电路以实现性能,而仅仅通过光学元件(如Mach-Zehnder干涉仪(MZi)或微环共振器)传递光子就可以执行需要数百甚至数千个逻辑门的算术。

在MZi中,相干光束通过一系列耦合器和相移器。在每个耦合点,光束之间的干涉会导致相移,可以将其解释为矩阵乘法的一部分。4×4矩阵操作仅需要四个输入,这些输入进入六个耦合元件,四个输出端口提供结果。操作的速度仅受相干脉冲可以通过阵列的速率的限制。

在模拟架构中,噪声是一个重要的障碍。许多团队在加速推理操作方面的工作表明,深度神经网络可以在4位有效分辨率下成功工作,但随着分辨率的增加,硬件开销和能量成本会迅速上升。这些效应可能会限制光学设计的实际能量优势。

Queen’s University的助理教授Alexander Tait的估计发现,今天的光学设备的实际限制很容易侵蚀潜在的节能优势。 Tait计算出,使用早期2020年的技术,仅500个充当神经元的微环共振器可以适合单个1cm2的芯片,但在10GHz下,需要1千瓦的功率。 Tait强调,这个例子显示了当前需要加热器来调节光学特性的影响。扩大规模和设计变化可以大大降低能量。 “加热器肯定是一个可解决的问题,”他说。

一个可能的方向是使用相变材料,例如可重写DVD和非易失性存储器中使用的材料。这些材料基于它们在快速加热后冷却的速度,展现出它们的电光特性的变化。但是,由于它们不需要持续加热,如果它们可以可靠地工作,它们将导致更低能量的光学计算机。

“如果你有一个低能量的相位移转器,你可以在集成光子学领域做很多事情,”马里兰大学材料科学与工程教授卡洛斯·里奥斯·奥坎波说。

然而,这些材料的应用方式有所不同。泰特指出,尽管MZi和微环倍增器实现的能量今天相似,但由于MZi设备所需的调谐是动态的,相变材料的非挥发性并不能像微环一样带来太大的好处。

“如果你有一个低能量的相位移转器,你可以在集成光子学领域做很多事情。”

光学处理的另一个优点是,光子处理的高带宽和高速度意味着集成处理不需要到电子处理的水平。

“计算密度是度量标准。如果你使用光子进行向量或矩阵运算,你不需要密集的核心设备:使用更高的速度,你可以递归地使用硬件,”女王大学助理教授Bhavin Shastri说。

光子神经网络可能面临的一个更棘手的问题在于AI算法中需要非线性行为。大多数传统的光子元件完全线性工作,缺乏晶体管的灵活性,晶体管可以在线性和非线性区域操作。

“非线性交互变得非常具有挑战性。你需要新材料来增强非线性,或者进行光电光转换,而且这必须以非常高效的方式完成,”Shastri说。今天,电光转换的延迟降低了光子AI的理论吞吐量优势。

里奥斯·奥坎波指出,可以建造必要的硅光子芯片的半导体制造商不愿意在没有大市场驱动力的情况下引入新材料到他们的工艺中。光子计算还没有提供所需的需求。半导体公司在电子相变存储器的数十年工作中获得的经验可能有所帮助。这可能有助于开发光学非挥发性存储器和其他在这些系统中有用的元件,尽管半导体的重点大多集中在吸收光的化合物上。可用于单独操作相位的透明材料需要进行更多的兼容性测试,以与半导体制造设备兼容。

尽管光子AI处于发展的早期阶段,但有几个初创公司计划建造商业光子加速器,利用迄今为止在硅光子学方面的改进,这主要是为了满足网络和通信部门的需求。通信吞吐量在AI领域仍然是一个重点关注的问题。在这个小的初创公司中,Lightmatter正在研究光子加速器和光学互联技术,可用于改善电子模块之间的通信速度。

Luminous Computing最初计划建造自己的光子AI系统,但公司已决定专注于电子加速器,支持其自己设计的光子互连。

Luminous总裁迈克尔·霍奇伯格表示,经过对光子核心的调查,“我们得出结论,阻止显着改进的瓶颈在系统的其他地方。”

充满希望的光子AI的未来可能在数据中心系统之外,例如Lightmatter和Luminous正在构建的系统。”这个其他社区正在研究电子本质上存在挑战的应用,” Shastri说。 “有一些任务你不能只交给数据中心。那么问题就变成了:那些任务是什么?”

虽然在当时这个趋势短暂,但研究全光路由器的驱动力是相信通过保持数据处于光学领域而不进行电光和数字模拟转换,可以更容易地以线速引导数据包。有许多可能的应用,其中传感器输出可以直接使用,而无需经过模拟数字转换,与存储数据的数据中心系统形成对比。

Shastri指出,最近有关使用模拟光子处理来分离无线电传输的工作。”这是一种鸡尾酒会问题的形式:在拥挤的无线电频谱中,你需要找到并专注于一个信号,并使用智能的处理方式。你不能只使用过滤。电子的带宽是狭窄的,如果你使用电子处理,能源的扩展可能呈二次方增长,这取决于通道或天线的数量。我们展示了你可以处理真正宽带的能力,而且能源的扩展是线性的。”

“有一些任务你不能只交给数据中心。那么问题就变成了:那些任务是什么?”

光子学计算在优化任务、快速移动载具(如高超声速飞行器)的预测控制和稳定性方面具有潜在的应用。 “在需要快速收敛到解决方案的情况下,光子学计算可以具有优势。”

虽然许多内容取决于以经济有效的方式集成多种技术的能力,但在越来越多的应用程序中巨大的数据智能需求可能为光子学计算提供了避免另一次研究和开发冬季所需的条件。

进一步阅读

黄翀等。 “光子学神经网络的前景和应用” 《Advances in Physics: X》, 7:1, 1981155 (2021)

Nahmias, M.A, Ferreira de Lima, T., Tait, A.N., Peng, H.-T., Shastri, B.J, and Prucnal, P.R. “神经网络的光子学乘法累加运算” 《IEEE Journal of Selected Topics in Quantum Electronics》, 卷 26,第 1 期 (2020)

Ríos Ocampo, C.A. 等。 “基于可重编程透明相变材料的超紧凑非易失性光子学” 《PhotoniX》, 3:26 (2022)

Tait, A.N. “硅光子学神经网络中的功率量化” 《Physical Review Applied》, 17, 054029 (2022)

返回顶部

作者

Chris Edwards 是一位位于英国萨里的作家,报道电子、信息技术和合成生物学。

©2023 ACM 0001-0782/23/7

未经费用授权,允许个人或课堂使用本作品的部分或全部数字或硬拷贝,但不得为盈利或商业优势制作或分发拷贝,并且拷贝必须在第一页上带有本通知和完整引用。必须尊重其他人拥有的本作品组件的版权。允许带有署名的摘要。否则,复制、再版、在服务器上发布或列表中重新分发,需要事先获得特定许可和/或费用。从[email protected]或传真(212) 869-0481请求出版许可。

数字图书馆是由计算机协会出版的。版权 © 2023 ACM, Inc。