作者丨邱晓芬
编辑丨苏建勋
近期,英伟达卡租赁价格崩溃的话题,引起了AI行业的热议。外网一篇流传甚广的文章中,用“英伟达GPU租赁泡沫破裂”这一惊悚的表达,来形容当下这一趋势。
了解到,英伟达核心产品在中国的租赁价格剧烈波动确实是事实,英伟达热门芯片在2024年的租赁价格走势如下——
英伟达H100,一般以8卡为一个节点的形式出租。一个节点年初的市场报价在12-18万/年之间浮动,如今徘徊在7万元前后;
消费级显卡“英伟达4090”,此前“挖矿热”时一度被炒至一万八、九,一卡难求。今年年初,“英伟达4090”单片的年租赁价格为一万三左右,目前的租赁价格大概是七八千。
也就是说,英伟达这两款热门芯片租赁价在10个月内双双降了50%,不再是前两年一卡难求的香饽饽。
不过,多位行业人士表示,不像外网文章那般耸人听闻,这并不需要恐慌。有行业人士测算,过去常规算力芯片租赁价格,在五年内大致有80%的下滑——英伟达H100、4090的发布时间是2022年,距今2年,大致符合价格下降的客观规律。
当然还有其他原因的综合作用。英伟达热门芯片租赁价格的下滑,本质上是英伟达产品周期、以及算力市场供需变化等因素的作用力。
而面对市场的新变化,国内的算力行业也在紧急做出各种调整。
算力供需天平倾斜
英伟达芯片租赁价格下降,与英伟达当下处于新旧产品交接期有关。
一位行业人士表示,相比H100,英伟达今年的Blackwell架构新品GB200,单位算力成本更低,而大部分AI公司基于降本考虑,基本选择“蹲新品”,致使老产品一定程度上遇冷。
在黄仁勋的描述中,新品完全是另外一副光景——其称,Blackwell芯片需求旺盛,导致份额分配就像“走钢丝”,他一不小心就会“得罪大客户们”。
但纵使万众期待,这款新品却面临着尴尬延期问题。
英伟达的工程师们把困境归咎到台积电采用了一项全新的封装技术上;台积电方面则指责英伟达疯狂催促生产流程,给予他们比以往过短的验证时间。这导致,英伟达本应在今年第三季度就推向市场的新芯片,如今推迟到第四季度甚至明年。
一位芯片行业人士向预测,在GB200正式面世后,英伟达老芯片租赁价格下跌态势很有可能进一步加剧,其判断,“预计近半年内不会恢复”。
此外,英伟达产品租赁价格的猛烈下降,还与目前算力市场供给与需求并不匹配有关。
在国内,算力行业的布局模式与国外相反——国内是先搭好算力的池子,再逐步发展AI应用,是“拿着钉子找锤子”;而国外的算力行业更加商业化一些,更倾向于找到了确切客户后,再建与之匹配的算力中心。
有行业统计数据显示,最近两年,国内总共涌现了大大小小1.3万个智算中心,截至2024年上半年,国内算力规模已达全球第三(246 EFLOPS),智能算力同比增速超过65%。
在这次建设潮中,国内也同步掀起了英伟达H100芯片的囤积潮。当这些芯片以中国香港、新加坡为中转站,好不容易凭借各种隐秘方式进入国内,算力行业却悲观发现,原本最消耗算力的预训练,诉求普遍下滑。(