GTC 2023 : NVIDIA 携手云服务商推出 NVIDIA DGX Cloud ,使企业能藉浏览器取得超算级的 AI 运算效能

NVIDIA 在 GTC 宣布与多家云服务供应商合作,推出 NVIDIA DGX Cloud ,使得企业不需采购与拥有伺服器,即可透过云服务供应商合作托管的 DGX Cloud 基础设施,透过浏览器取得超算电脑级的 AI 运算效能。

NVIDIA DGX Cloud 将透过多个云端服务供应商提供,微软 Azure 预计於下一季起托管 DGX Cloud 服务,包括 Google Cloud 等业者也将陆续开始供应服务, DGX Cloud 执行个体价格为每个执行个体每月 36,999 美金起。每个 DGX Cloud 执行个体皆有 8 个 NVIDIA H100 或 NVIDIA A100 80GB Tensor GPU ,单一节点具备 640GB 的 GPU 记忆体,并透过 NVIDIA Networking 技术提供高效能、低延迟网路,使多个执行个体等同一个超大型 GPU 。

DGX Cloud 将 NVIDIA DGX 强大的运算效能搬到云端平台,提供专用的 NVIDIA DGX AI 超算丛集,并同样可使用持续进化的 NVIDIA AI 软体;企业能够透过网路浏览器即可享有 AI 超级电脑的运算力,省却购置、部属与管理的复杂性。 DGX Cloud 包括 NVIDIA AI 平台软体层 NVIDIA AI Enterprise 提供端到端的 AI 框架与预训练模型,同时在此次的 GTC 大会也公布全新的 NVIDIA AI Enterprise 3.1 版本,带来全新预训练模型、最佳化的框架与加速资料科学软体库。

▲ OCI 将成首个 NVIDIA DGX Cloud

NVIDIA 藉由与各大云端服务供应商合作托管 DGX Cloud 基础设施,由 Oracle Cloud Infrastucture ( OCI )开始,并由 OCI 的 OCI RDMA Supercluster 提供专门打造的 RDMA 网路、裸机运算与高效能本地和块储存( Block Storage ),可扩展到超过 32,000 个 GPU 的电脑丛集。

包括生计龙头之一的 Amgen 安进,保险科技领导业者 CCC Intelligent Solutions ( CCC )与数位业务平台服务供应商 ServiceNow 都是首批利用 DGX Cloud 的先行者。 Amgen 将其结合 NVIDIA BioNeMo 加速药物研发,并利用 NVIDIA AI Enterprise 软体的 NVIDIA RAPIDS 资料科学加速涵式库; CCC 则活用 DGX Cloud 加快开发与训练人工智慧模型速度与扩大模型规模,用於支援创新汽车理赔方案,协助推动产业导入智慧自动化; ServiceNow 则透过 DGX Cloud 与企业持有的 NVIDIA DGX 系统进行混合云端 AI 超算作业,用於大型语言模型 LLM 、程式码生成与休闲分析等 AI 研究,并共同管理利用 Megatron-LM 框架训练的开放科学生成式人工智慧 BigCode 计画。

代号诡秘

You may also like

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论