英伟达发布Vera Rubin超级芯片,押注下一代AI计算平台

英伟达发布Vera Rubin超级芯片
2026年1月5日,英伟达发布Vera Rubin超级芯片。(图源:英伟达)

在2026年国际消费电子展(CES)上,英伟达宣布推出新一代Vera Rubin超级芯片及其配套的Rubin平台,旨在应对快速增长的人工智能训练与推理需求。

英伟达周一(1月5日)在拉斯维加斯举行的CES 2026上发布Vera Rubin超级芯片,这是其新一代Rubin平台的核心组件之一。该处理器将一颗Vera中央处理器(CPU)与两颗Rubin图形处理器(GPU)集成在单一芯片中,面向“代理式AI”、高级推理模型以及“专家混合模型”(MoE)等应用场景。

英伟达表示,Rubin平台由六款芯片协同设计构成,除Vera CPU和Rubin GPU外,还包括NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片,用于提升算力互联、网络和数据处理能力。

在系统层面,Rubin平台可封装为Vera Rubin NVL72服务器,将72颗GPU整合为单一系统,多台NVL72进一步组成DGX SuperPOD级别的AI超级计算集群。这类系统已成为微软、谷歌、亚马逊和Meta等大型云服务和科技公司的重点投资方向。

英伟达同时推出名为“推理上下文内存存储”的AI存储方案,用于支撑万亿参数、多步骤推理模型在训练和推理过程中产生的大规模数据。公司称,与上一代Grace Blackwell平台相比,Rubin在训练同类MoE模型时可减少约四分之三的GPU用量,并将推理阶段的“token”成本降低约九成,从而改善能耗和总体拥有成本。

英伟达表示,Rubin平台已向合作伙伴提供样品,并进入全面量产阶段。公司强调,降低GPU需求可使客户将释放出的算力资源用于其他任务,提高整体系统利用效率。

在市场层面,英伟达凭借在AI芯片领域的领先优势,市值一度突破5万亿美元,目前约为4.6万亿美元。尽管近期市场对AI投资强度和潜在泡沫的担忧有所上升,但公司仍保持技术快速迭代的节奏。

与此同时,AMD计划推出Helios机架级系统,与英伟达的NVLink 72方案展开竞争;部分云计算巨头也在加快自研芯片部署。谷歌和亚马逊已宣布扩大其定制处理器在Anthropic等AI平台中的应用,并据媒体报道,谷歌正与Meta等公司探讨在数据中心使用其芯片的可能性。

尽管竞争对手和客户自研芯片的布局正在推进,但在短期内仍难以撼动英伟达在高端AI算力领域的主导地位,而其保持年度产品更新的策略,将继续拉高行业进入门槛。