其中最受关注的是Vera Rubin——英伟达喜欢用科学家的名字来为其GPU芯片命名,Vera Rubin之名就是来自美国天文学家薇拉·鲁宾(Vera Rubin),她在暗物质研究领域取得了突破性进展。
Vera Rubin其实是两个GPU合二为一,Vera是英伟达的第一款定制CPU设计,定制的Vera设计比去年Grace Blackwell芯片中使用的CPU速度快两倍。
与Vera配对时,Rubin在进行推理时可以实现每秒50千万亿次的运算,是Blackwell芯片每秒20千万亿次运算的两倍多。Rubin还可以支持高达288G的快速内存,后者为AI开发者所需的核心规格之一。
英伟达强调,Rubin实际上是两个GPU芯片。事实上,目前热销的Blackwell GPU也是两个独立芯片装配在一起,从Rubin开始,英伟达将合并若干芯片组成一个独立的GPU。
Vera Rubin将于2026年下半年交付。英伟达还计划在2027年下半年发布将四个芯片合组为一个独立GPU的“Rubin Next”芯片,将令Rubin的速度加快一倍,能进行每秒100千万亿次的运算。
2025年下半年,英伟达将发布Blackwell Ultra,一款有多重配置的GPU,单个Ultra芯片将提供与Blackwell相同的每秒20千万亿次的AI运算性能,但具有288GB的内存,高于普通Blackwell的192GB,英伟达表示,云供应商可以使用Blackwell Ultra为时间敏感型应用程序提供高级AI服务,从而使他们从新芯片中获得的收入要比2023年出货的Hopper一代芯片高出数十倍。
黄仁勋还提到会在2028年推出Feynman——以美国理论物理学家理查德·费曼(Richard Feynman)命名的下一代芯片,不过并没有透露太多的详情。
另外,英伟达还发布了配备其芯片的新型笔记本电脑和台式机,包括两款可应用AI的个人电脑,分别名为DGX Spark和DGX Station,这两款电脑将能够运行大型AI模型,如Llama或DeepSeek。
该公司还宣布更新其网络部件,将数百或数千个GPU连接在一起,使它们作为一个整体工作。
英伟达还发布了名为Dynamo的AI处理优化软件包,可在运行高性能AI模型时,通过管理GPU高效地分担AI任务。
黄仁勋宣布将免费向企业开放一款名为“Isaac Groot N1”的人形机器人基础模型,能轻松处理抓取和搬运等任务,英伟达表示将在人形机器人技术开发方面,与谷歌(GOOG.US)的DeepMind和迪士尼合作。
英伟达还就量子计算研究发布了战略布局,计划在波士顿设立研究据点,与从事量子技术开发的企业、哈佛大学和麻省理工等开展联合研究。
DeepSeep带来的是陨灭还是机遇?
今年1月,训练成本相对低廉的DeepSeek异军突起,引发了市场对于科技巨头是否有必要斥巨资巨量购买英伟达昂贵AI芯片的猜疑,导致美国科技股的大跌。
不过在这次大会上,黄仁勋驳斥了这种说法,强调随着高级AI模型的普及,所需的算力将进一步提升。DeepSeek偏重于“推理”,而不是需要大量算力的“训练”,因此其成本要比其他的大模型低,不过黄仁勋表示,全新的Blackwell Ultra芯片更适合推理模型,因此DeepSeek的崛起,只会对英伟达更有利。
英伟达在大会上发布了创世界纪录的DeepSeek-R1推理性能:在搭载8个Blackwell GPU的单个DGX系统上运行6710亿个参数的最先进DeepSeek-R1模型,可实现每用户每秒超250 token的响应速度,系统最大吞吐量突破每秒3万token。这些性能两端的快速进步是通过改进英伟达推理开发者工具的开放生态系统实现的,现在针对Blackwell架构进行了优化。随着英伟达平台继续推动最新的Blackwell Ultra GPU和Blackwell GPU突破推理极限,这些性能记录将进一步提高。
资本市场买不买账?
尽管黄仁勋在台上兴致勃勃地介绍了英伟达的诸多技术突破和完全能够激发需求的底层逻辑,但以英伟达为首的科技股未见起色,英伟达于3月18日股价3.43%,收报115.43美元,今年以来,其股价已累跌14.04%,不过3月19日盘前出现反弹,现暂涨0.54%,报116.05美元。
在黄仁勋讲话前夕,The Information报道亚马逊(AMZN.US)的云服务分部正在为其AI芯片提供大幅折扣来削弱英伟达的竞争力,以吸引更多的客户。亚马逊于3月18日的股价也下跌1.49%,但3月19日盘前微涨0.12%。
除了亚马逊之外,超微半导体(AMD.US)的AI芯片虽然推出的时间略迟,但因为性价比上相对较优,也可能对英伟达构成威胁。此外,OpenAI、马斯克的xAI等,也在计划用自研芯片来节省成本,英伟达能不能笑到最后,还难说。