NVIDIA H100 GPU 现已在 AWS 云上可用
NVIDIA H100 GPU 现已在 AWS 云上可用' can be condensed to 'NVIDIA H100 GPU 在 AWS 云上可用'.
AWS用户现在可以访问AI训练和推理在行业基准测试中所展示的领先性能。
云巨头正式启用了由NVIDIA H100 Tensor Core GPU驱动的新的Amazon EC2 P5实例。该服务允许用户通过浏览器一键扩展生成式AI、高性能计算(HPC)和其他应用程序。
这一消息出现在AI的“iPhone时刻”之后。开发者和研究人员几乎每天都在使用大型语言模型(LLM)发现AI的新应用。将这些新的用例推向市场需要加速计算的效率。
NVIDIA H100 GPU通过包括第四代Tensor Cores、用于加速LLM的新Transformer Engine和最新的NVLink技术在内的架构创新,提供超级计算级别的性能,使GPU之间的通信速度达到900GB/sec。
使用P5实例进行扩展
Amazon EC2 P5实例非常适合训练和运行日益复杂的LLM和计算机视觉模型。这些神经网络驱动着最具挑战性和计算密集型的生成式AI应用,包括问答、代码生成、视频和图像生成、语音识别等。
P5实例可以部署在名为EC2 UltraClusters的超大规模集群中,该集群由云中的高性能计算、网络和存储组成。每个EC2 UltraCluster都是一台强大的超级计算机,使客户能够在多个系统上运行最复杂的AI训练和分布式HPC工作负载。
因此,客户可以运行需要计算节点之间高水平通信的规模应用,P5实例采用由AWS EFA提供支持的PB级非阻塞网络,为Amazon EC2实例提供3,200 Gbps的网络接口。
使用P5实例,机器学习应用程序可以使用NVIDIA Collective Communications Library来使用多达20,000个H100 GPU。
NVIDIA AI Enterprise帮助用户充分利用P5实例。它是一套全套软件,包括100多个框架、预训练模型、AI工作流程和工具,用于调整AI基础设施。
NVIDIA AI Enterprise旨在简化AI应用程序的开发和部署,解决构建和维护高性能、安全、云原生AI软件平台的复杂性。它在AWS Marketplace上提供连续的安全监控、常规和及时的常见漏洞和曝光的修补程序、API稳定性以及企业支持,以及访问NVIDIA AI专家的权限。
客户的评价
NVIDIA和AWS合作超过十年,将GPU加速引入到云中。这种合作的最新例子,新的P5实例,代表了向前迈出的重要一步,以提供创造下一代AI的尖端性能。
以下是一些客户已经说过的话:
Anthropic构建可靠、可解释且可控的AI系统,这些系统将有很多机会在商业和公共利益领域创造价值。
“虽然当今的大型通用AI系统可能具有重大的好处,但它们也可能是不可预测、不可靠和不透明的,因此我们的目标是在这些问题上取得进展,并部署人们发现有用的系统,”Anthropic联合创始人Tom Brown说道。“我们预计P5实例将比P4d实例提供可观的性价比优势,并且它们将以所需的大规模提供能够构建下一代LLM和相关产品的能力。”
作为语言AI领域的领先先驱,Cohere赋予每个开发者和企业以世界领先的自然语言处理(NLP)技术,同时保护其数据的隐私和安全。
“Cohere在帮助每个企业利用语言AI的能力方面处于领先地位,以自然而直观的方式探索、生成、搜索和处理信息,在最适合每个客户的数据环境中在多个云平台上部署,”Cohere首席执行官Aidan Gomez说道。“NVIDIA H100驱动的Amazon EC2 P5实例将释放出企业利用其计算能力与Cohere的先进LLM和生成式AI能力相结合的能力,以加速创造、增长和扩展。”
Hugging Face致力于使良好的机器学习民主化。
“作为机器学习领域增长最快的开源社区,我们现在在我们的平台上提供超过15万个预训练模型和2.5万个数据集,用于自然语言处理、计算机视觉、生物学、强化学习等领域,”Hugging Face的首席技术官兼联合创始人Julien Chaumond说道。“我们期待使用Amazon EC2 P5实例通过Amazon SageMaker在UltraClusters中以EFA加速交付新的基础AI模型。”
如今,全球有超过4.5亿人使用Pinterest作为视觉灵感平台,为了个性化自己的品味而购买产品,寻找创意和发现有启发性的创作者。
“我们在整个平台上广泛使用深度学习,用于诸如对上传到我们平台的数十亿张照片进行标记和分类,以及提供视觉搜索功能,使我们的用户能够从灵感转化为行动,”Pinterest的首席架构师David Chaiken说道。“我们期待使用搭载NVIDIA H100 GPU的Amazon EC2 P5实例,AWS EFA和UltraClusters来加速我们的产品开发,并为我们的客户带来新的基于共情的人工智能体验。”
了解更多由NVIDIA H100驱动的新AWS P5实例。