英伟达新软件能让在所有英伟达GPU上运行程序变得更加简便,即便是对于那些老款GPU,它们虽更适合于部署人工智能应用,而非开发,也能轻松应对。 达斯说:“如果您是开发者,手中有一个备受期待的模型,希望能让更多人采用,只需将其部署在NIM上。我们承诺将兼容所有英伟达GPU,确保模型能触及广泛用户群。” Hopper架构的继任者Blackwell 每隔两年,英伟达都会更新其GPU架构,从而实现性能的显著跃升。在过去一年中,众多发布的人工智能模型均在2022年宣布的Hopper架构基础上进行训练,此架构涵盖了包括H100在内的多款芯片。 据英伟达介绍,基于Blackwell架构的GB200芯片将为人工智能领域公司带来性能上巨大的飞跃,其人工智能计算能力可达每秒20千万亿次,远超过H100芯片的每秒4千万亿次。 这一强大的计算能力将使企业得以训练规模更大、复杂度更高的人工智能模型。 GB200芯片还特别集成了英伟达的高性能Transformer推理引擎,该技术专为运行基于Transformer架构的人工智能设计,正是构成流行聊天机器人ChatGPT核心技术的关键部分。 Blackwell架构的GPU芯片体积庞大,实际上是由两块独立制造的芯片集成于一块台积电代工的芯片上。英伟达同时推出了配套的GB200 NVLink 2服务器,内置72块Blackwell架构GPU,以及其他用于人工智能模型训练的专业组件。 知名云服务提供商,包括亚马逊、谷歌、微软及甲骨文等,均将提供GB200芯片的云服务。每套GB200系统由两块基于Blackwell架构的B200 GPU和一块基于ARM架构的Grace CPU组成。英伟达透露,亚马逊网络服务(AWS)计划建立一个包含2万套GB200系统的超级计算集群。 英伟达表示,亚马逊的服务器集群能够部署达到27万亿个参数的人工智能模型,规模远超目前已知最大的GPT-4模型,后者拥有1.7万亿个参数。许多人工智能研究人员认为,拥有更多参数和数据的超大模型能够展现出更为强大的能力。 虽然英伟达未公布GB200芯片及其系统的具体售价,但根据分析师估计,参照Hopper架构H100芯片的售价范围(每块约2.5万至4万美元),一整套GB200系统的成本可能高达20万美元。 英伟达的推理微服务 英伟达还宣布,在其企业软件订阅服务中新增了一款名为NIM的产品,即英伟达推理微服务(NVIDIA Inference Microservices)的缩写,旨在简化使用旧型号GPU进行人工智能推理和软件运行的过程,使企业能够继续利用现有的数亿块英伟达GPU资源。相较于训练新的人工智能模型,推理计算所需的计算资源更少,因此,企业可以通过NIM更加便捷地运行自己的人工智能模型,而不必依赖于OpenAI等公司提供的计算服务。 作为其战略的一部分,英伟达鼓励购买其服务器的客户订阅英伟达企业服务,并按每块GPU每年4500美元的标准收取许可费。此外,英伟达将与微软、Hugging Face等领先的人工智能企业合作,确保它们开发的人工智能模型能够在所有兼容的英伟达芯片上顺畅运行。开发者可通过NIM服务,无需复杂配置,就能在自己的服务器或基于云的英伟达服务器上高效地运行模型。 “在原本调用OpenAI服务的代码中,仅需替换一行代码,即可将其连接至英伟达提供的NIM服务,”达斯解释说。
英伟达表示, NIM软件不仅能在云服务器上运行,还能使配备英伟达GPU的笔记本电脑上顺畅运行人工智能应用,进一步扩展了NIM服务的应用场景。(辰辰) |