3 月 11 日消息,据路透社报道,社交媒体公司 meta(旗下拥有 Facebook、Instagram 和 WhatsApp)正在测试其首款用于训练人工智能系统的自研芯片。据两位知情人士透露,此举标志着 meta 在减少对外部供应商(如英伟达)的依赖、并逐步向设计更多定制化芯片方面迈出了关键一步。
报道称,meta 已开始小规模部署这款芯片,并计划如果测试顺利,就增加产量以进行大规模使用。meta 推动开发内部芯片是其长期计划的一部分,目的是降低庞大的基础设施成本。
据预测,meta 在 2025 年的总支出将在 1140 亿至 1190 亿美元(备注:当前约 8277.36 亿至 8640.41 亿元人民币)之间,其中包括高达 650 亿美元的资本支出,而其中大部分将用于人工智能基础设施建设。消息人士称,meta 的这款新训练芯片是一款专用加速器,专门用于处理人工智能相关任务,这使其相比通常用于人工智能工作负载的集成图形处理单元(GPU)更具能效优势。
此外,meta 正在与中国台湾地区的芯片制造商台积电合作生产该芯片。此次测试部署是在 meta 完成芯片的首次“流片”后启动的。流片是硅片开发工作中的一个重要里程碑,涉及将初步设计送入芯片工厂进行生产。通常,流片的成本高达数千万美元,耗时约三至六个月,且无法保证测试一定成功。一旦失败,meta 将不得不诊断问题并重新进行流片。
尽管 meta 的自研芯片计划在过去几年中曾遭遇波折,甚至一度放弃了一款处于类似开发阶段的芯片,但该公司仍在持续推进相关工作。去年,meta 开始在其推荐系统中使用一款自研的推理芯片,用于运行 Facebook 和 Instagram 新闻推送中的人工智能系统。meta 高管表示,他们计划从 2026 年开始使用自研芯片进行训练,即通过向人工智能系统输入大量数据来“训练”其执行任务的计算密集型过程。
meta 首席产品官克里斯・考克斯(Chris Cox)在上周的摩根士丹利科技、媒体和电信会议上表示:“我们正在研究如何为推荐系统进行训练,以及如何逐步思考生成式人工智能的训练和推理。”他将 meta 的芯片开发工作形容为“从爬行到行走再到奔跑”的过程,但同时指出,第一代用于推荐系统的推理芯片取得了“巨大成功”。
然而,meta 此前曾因一款自研推理芯片在类似的小规模测试部署中失败而暂停相关项目,并在 2022 年转而向英伟达订购了价值数十亿美元的 GPU。此后,meta 一直保持作为英伟达的最大客户之一,购买了大量 GPU 用于训练其模型,包括推荐系统、广告系统以及其 Llama 基础模型系列。这些芯片每天还为超过 30 亿使用 meta 应用程序的用户提供推理服务。
今年,随着人工智能研究人员对通过不断增加数据和计算能力来“扩展”大型语言模型的潜力表示怀疑,这些 GPU 的价值受到质疑。这种怀疑在 1 月底被中国初创公司 DeepSeek 推出的新低成本模型进一步强化,这些模型通过更依赖推理而非计算能力来优化效率。受 DeepSeek 影响,全球人工智能股票市场出现大幅波动,英伟达的股价一度下跌了五分之一,尽管随后大部分跌幅被收回,但近期又因贸易担忧等因素再次下跌。