基于光的计算革命:利用增强的光学神经网络为ChatGPT类型的机器学习程序提供动力
基于光的计算革命:利用增强的光学神经网络为 ChatGPT 类型的机器学习程序提供动力' 'Revolutionizing Computing with Light Empowering Machine Learning Programs like ChatGPT with Enhanced Optical Neural Networks
ChatGPT的能力可以根据几个简单的问题生成精细的文章、电子邮件和代码,引起了国际关注。麻省理工学院的研究人员报道了一种方法,有可能为比负责ChatGPT的那个程序更强大的机器学习程序铺平道路。此外,他们的技术可能消耗的能量比驱动当今机器学习模型的最先进超级计算机要少。
该团队报道了新系统的首次实验演示,该系统使用数百个微米级激光器进行基于光的运算,而不是基于电子。与当前最先进的数字计算机相比,新系统在能量效率方面提高了100多倍,在计算密度方面提高了25倍。
此外,他们指出“未来改进的空间还有相当几个数量级。”科学家们补充说,这“为从数据中心到分散式边缘设备的大规模光电处理器加速机器学习任务开辟了一条途径。”未来,像手机这样的小设备可能能够执行只能在大型数据中心计算的程序。
- 使用Langchain和OpenAI为您的Google文档创建聊天机器人
- ETH Zurich研究人员推出LMQL:一种用于语言模型交互的编程语言
- LG AI研究提出QASA:一种新颖的人工智能基准数据集和计算方法
模仿大脑信息处理的大规模机器学习模型是深度神经网络(DNNs)的基础,例如驱动ChatGPT的模型。尽管机器学习正在扩张,但当今DNNs所使用的数字技术正在停滞。此外,由于其极高的能源需求,它们通常只存在于非常大的数据中心中。这推动了计算架构的创新。
由于深度神经网络(DNNs)的爆炸式扩张,数据科学学科正在发展。为了应对传统计算硬件能力的挑战,光学神经网络(ONNs)最近发展出在高时钟速率、并行执行和数据损失最小化方面执行DNN任务的能力。低电光转换效率、庞大的设备占用空间以及通道串扰导致ONNs的计算密度低,而缺乏内联非线性则导致了显著的延迟。研究人员已经实验性地展示了一种空时复用的ONN系统,以一次性解决所有这些问题。他们使用微米级垂直腔面发射激光器(VCSELs)阵列进行神经元编码,这些阵列可大量生产并具有出色的电光转换性能。
研究人员首次提供了一个小型设计,同时解决了这三个问题。现代激光雷达遥感和激光打印都使用这种基于垂直面发射激光器(VCSELs)阵列的架构。这些措施似乎是未来接近两个数量级的改进。光电处理器为在集中和分布式基础设施上加速机器学习过程提供了新的机会。