英伟达向1亿Windows RTX电脑和工作站引入新的生成式AI功能和突破性性能
生成式人工智能正在迅速带来新的计算时代,为生产力、内容创作、游戏等领域带来变革。生成式人工智能模型和应用程序,如 NVIDIA NeMo 和 DLSS 3 Frame Generation、Meta LLaMa、ChatGPT、Adobe Firefly 和 Stable Diffusion,利用神经网络识别现有数据中的模式和结构,生成新的原创内容。
当优化为 GeForce RTX 和 NVIDIA RTX GPU 时,这些生成式人工智能模型比竞争设备快 5 倍以上,这要归功于 Tensor Core——RTX GPU 中专用的硬件,用于加速人工智能计算——以及定期的软件改进。上周在 Microsoft Build 大会上引入的增强功能将生成式人工智能模型的性能翻倍,例如利用新的 DirectML 优化的 Stable Diffusion。
随着更多的人工智能推断在本地设备上进行,PC 需要强大而高效的硬件来支持这些复杂的任务。为了满足这种需求,RTX GPU 将为人工智能工作负载添加 Max-Q 低功率推断。GPU 在轻量级推断任务中以一小部分功率运行,而对于繁重的生成式人工智能工作负载,性能则可以达到无与伦比的水平。
为了创建新的人工智能应用程序,开发人员现在可以访问运行在 Windows 11 上的完整 RTX 加速的人工智能开发堆栈,从而更容易地开发、训练和部署先进的人工智能模型。这从通过 Windows Subsystem for Linux 提供的优化深度学习框架的模型的开发和微调开始。
然后,开发人员可以无缝地转移到云端,在每个主要云服务提供商都可用的相同 NVIDIA 人工智能堆栈上进行训练。接下来,开发人员可以使用类似于 Microsoft Olive 的工具优化经过训练的模型以实现快速推断。最后,他们可以将启用人工智能的应用程序和功能部署到已经针对人工智能进行优化的超过 1 亿台 RTX PC 和工作站上。
“在未来几年中,人工智能将成为 Windows 客户的最大创新推动力。”微软公司 Windows 硅和系统集成企业副总裁 Pavan Davuluri 表示:“通过与 NVIDIA 在硬件和软件优化方面的协作,我们正在为开发人员提供一种变革性、高性能、易于部署的体验。”
到目前为止,已经发布了超过 400 个 RTX 人工智能加速的应用程序和游戏,并且还有更多的应用程序和游戏即将推出。
在他的 COMPUTEX 2023 主题演讲中,NVIDIA 创始人兼首席执行官黄仁勋介绍了一款支持游戏开发的新生成式人工智能,NVIDIA Avatar Cloud Engine (ACE) for Games。
这项定制的人工智能模型铸造服务通过智能化的自然语言交互,为不可玩角色带来智能化,从而改变了游戏。中间件、工具和游戏的开发人员可以使用 ACE for Games 在他们的软件和游戏中构建和部署定制的语音、对话和动画 AI 模型。
任何地方的 RTX 生成式人工智能
从服务器到云端到设备,运行在 RTX GPU 上的生成式人工智能无处不在。 NVIDIA 的加速人工智能计算是一项低延迟的全栈工作。我们多年来一直在优化我们的硬件和软件架构的每个部分,包括 RTX GPU 上的第四代 Tensor Core——专用于人工智能的硬件。
定期的驱动程序优化确保最佳性能。最新的 NVIDIA 驱动程序与 Olive 优化模型和 DirectML 的更新相结合,为 Windows 11 上的开发人员带来了显著的加速。例如,利用新的 DirectML 优化路径的 Stable Diffusion 性能比以前的推断时间提高了 2 倍。
而且,搭载 NVIDIA Ada Lovelace 架构的最新一代 RTX 笔记本电脑和移动工作站,用户可以随时随地使用生成式人工智能。我们的下一代移动平台带来了新的性能和便携性水平,形态因素可以小至 14 英寸,重量只有约三磅。制造商如戴尔、惠普、联想和华硕正在推动生成式人工智能时代的发展,支持 RTX GPU 和 Tensor Core。
“随着人工智能在各行各业的部署预计年增长率超过 37%,企业和消费者将越来越需要正确的技术来开发和实施人工智能,包括生成式人工智能。联想在从设备到服务器到云端的生成式人工智能方面处于独特的位置,多年来一直为 AI 工作负载开发产品和解决方案。我们搭载 NVIDIA RTX GPU 的 PC,例如选择的联想 ThinkPad、ThinkStation、ThinkBook、Yoga、Legion 和 LOQ 设备,正在为更好的日常用户体验启用生成式人工智能,例如节省时间、创作内容、完成工作、游戏等。” —— 联想 PC 和智能设备副总裁兼首席技术官 Daryl Cromer
“生成式人工智能是跨行业革命性的变革和未来创新的催化剂。HP和NVIDIA共同为开发者提供了令人难以置信的性能、便携性和可靠性,以运行加速的人工智能模型,同时推动生成式人工智能的新时代。” — Jim Nottingham,Z by HP的高级副总裁兼总经理
“我们最近与NVIDIA在项目Helix上的合作,旨在使企业更容易在本地构建和部署可信的生成式人工智能。在这一历史性时刻迈出的另一步是将生成式人工智能带到个人电脑上。想象一下应用程序开发人员试图完善神经网络算法,同时保持训练数据和知识产权在本地控制。这就是我们旨在实现的强大而可扩展的Precision工作站,配备NVIDIA RTX GPU。作为全球工作站领导者,戴尔在帮助用户从边缘到数据中心安全加速AI应用方面处于独特的位置。” — 戴尔科技客户产品组总裁Ed Ward
“生成式人工智能时代已经来临,需要极大的处理能力和完全优化的硬件和软件。通过NVIDIA AI平台,包括现在预安装在许多我们的产品上的NVIDIA Omniverse,我们很高兴看到AI革命在ASUS和ROG笔记本电脑上继续形成。” — 华硕全球消费市场总监Galip Fu
不久,搭载RTX GPU的笔记本电脑和移动工作站将获得最佳性能。AI推理仅工作负载将针对Tensor Core性能进行优化,同时将GPU的功耗尽可能降低,延长电池寿命并保持系统冷静安静。当工作负载要求时,GPU可以动态扩展以获得最大的AI性能。
开发者还可以通过NVIDIA AI加速应用程序开发者网站学习如何从端到端地优化他们的应用程序,充分利用GPU加速。