11月18日,据路透社援引《信息》报道,英伟达最新发布的Blackwell AI芯片在服务器应用中遭遇了过热问题,引发了一系列关注与担忧。这一状况可能导致部分客户的数据中心部署计划被迫推迟。
据悉,Blackwell芯片在连接到可容纳多达72个芯片的服务器机架时,会出现过热现象。多位知情人士透露,英伟达已多次要求供应商调整机架设计,以期解决这一技术难题。然而,尽管进行了多次尝试,问题依然存在,且供应商的具体名称尚未被公开。
对于这一状况,英伟达方面表示,他们正在与多家领先的云服务提供商紧密合作,共同应对这一挑战。公司发言人在给媒体的一份声明中强调:“工程迭代是正常的,也是我们预期之中的一部分。”他进一步指出,英伟达的工程团队正在全力以赴,以确保问题能够得到妥善解决。
值得注意的是,Blackwell芯片作为英伟达的最新力作,自今年3月发布以来便备受瞩目。该芯片采用了两块与该公司之前产品大小相同的方形硅片,并通过创新技术将它们组合成一个高效能的组件。这一设计使得Blackwell在执行如聊天机器人响应等复杂任务时,速度相较于前代产品提升了高达30倍。
然而,过热问题的出现无疑给这款芯片的推广和应用蒙上了一层阴影。原本计划在第二季度出货的Blackwell芯片,由于这一技术难题而遭遇了延迟。这不仅可能影响到英伟达自身的产品交付计划,还可能对其重要客户如meta Platforms、Alphabet(谷歌母公司)以及微软等企业的数据中心部署产生连锁反应。