当地时间1月5日,英伟达CEO黄仁勋在CES演讲上展示了英伟达新一代AI平台Rubin,包含六款新型芯片,分别为Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU及Spectrum-6以太网交换机。其中,Rubin GPU芯片搭载第三代Transformer引擎,NVFP4推理算力是50PFLOPS,是Blackwell的5倍。与Blackwell平台相比,Rubin可将推理代币生成成本降低至多10倍,训练混合专家模型(MoE)所需GPU数量减少4倍。

英伟达Rubin平台已进入全面生产阶段,基于该平台的产品将于2026年下半年通过合作伙伴面市。英伟达表示,包括亚马逊的AWS、谷歌云、微软和甲骨文云在2026年将率先部署基于Vera Rubin的实例,云合作伙伴CoreWeave、Lambda、Nebius和Nscale也将跟进。此外,思科、戴尔、惠普企业、联想和超微预计将推出基于Rubin产品的各类服务器。包括Anthropic、Cohere、Meta、Mistral AI、OpenAI和xAI等AI实验室正期待利用Rubin平台训练更大型、更强大的模型。