当前位置: 首页 » 资讯 » 新科技 » 正文

大模型只剩DS、阿里、字节,李开复说了句大实话

IP属地 北京 编辑:沈如风 三易生活 时间:2025-03-23 22:00:10

国内的基座大模型大概率将会只剩下DeepSeek、阿里巴巴、字节跳动三家,这是创新工场董事长李开复近日在接受彭博社采访时做出的判断。

在人工智能走红后,李开复与周鸿祎、李彦宏等人一道,成为了国内互联网行业中经常对其评头论足的大佬。那么这一次他关于未来国内大模型市场将从群雄逐鹿的“百模大战”发展至只剩下DeepSeek、阿里巴巴、字节跳动的三足鼎立,到底是无稽之谈、还是不可避免呢?

事实上,李开复对于这番论断极有可能是很有信心的,如若不然,他领导的零一万物也不会成为全面拥抱DeepSeek旗下大模型的第一个“AI六小虎”。早在今年年初,也就是DeeppSeek-R1尚未出圈时,李开复就已宣布零一万物未来不会再做万亿参数模型的预训练,而是将专注在务实的、小而快的、能够以商业性价比来评估的模型。

其实不仅仅是零一万物,在大名鼎鼎的“AI六小虎”里,除了得到一众资方支持的智谱,已经有四家在大模型的迭代这件事上都按下了暂停键。至于在“AI六小虎”之外的其他中小规模AI厂商,现在在大模型这件事也几乎都已经没有了声响。从某种意义上来说,在2023年如火如荼的“百模大战”反而是个特殊现象。

此前在2023年春季,国内AI赛道的“百模大战”之所以会迅速成型,盖因苦于缺乏标的的投资机构终于有了一个看起来无比光明的赛道可以押注,蜂拥而至的资本正是“百模大战”的导火索。彼时,狂飙突进十余年的互联网行业投资踩下急刹车,大消费赛道业已经偃旗息鼓,以至于国内投资圈流传出了这样一句话,“现在没啥好项目,凡是能跑出来的东西早被投完了。”

这时候ChatGPT的出现就给市场注入了强心剂,投资机构则期盼AI能够成为下一个互联网。当ChatGPT的开发商OpenAI在做大语言模型(LLM)的情况下,擅长Copy To China的部分国内企业自然有样学样,搞起了那时候时髦的大模型。

只可惜AI大模型与互联网虽然同属于广义上的科技,但两者的底层逻辑完全不同,互联网是轻资产的代表,而大模型却是技术与资本双密集。大模型的训练不仅是个技术活,需要有懂芯片、推理、模型、算法的人才,还有资源密集型的特征,要耗费海量的电力、冷却水,以及算力。

以meta的LLama3为例,其8B和70B模型的训练就累积耗费了770万个GPU训练时长(GPU Hours),用的是英伟达的H100-80GB显卡,按照AWS上12美元/机时的价格来算,这一训练的花费高达9240万美元。也难怪从2024年开始,一级市场的投资者开始对大模型望而却步,就正是因为训练大模型其实是巨头才能玩得转的游戏。

更加致命的是,这些巨头还不太讲武德,在2024年初夏搞起了价格战,使得资源有限的中小厂商只能作壁上观。到了2025年年初,DeepSeek凭借高效低成本的优势一举成为AI行业的新标杆,而更让一众AI厂商若坐针毡的是,DeepSeek的大模型还是开源的。

开源的DeepSeek就引发了基座大模型的价值重估,进而终结了“百模大战”。有相当多的AI模型厂商都无法回答这样一个问题,那就是“为什么要舍弃低成本且开源的DeepSeek,选择你的模型?”

归根结底,降成本、重落地路线的DeepSeek扛起了开源模型的大旗,并实现了与OpenAI并跑,这也是以往开源阵营的阿里Qwen、meta LLama都未曾做到的事情。既然无法在短期内实现商业化,也没办法在DeepSeek的压力下保持竞争力,处于二三线的国内AI厂商当然就前途无“亮”了。

那么问题就来了,为什么李开复会认为在一众一线AI大厂里,最后可能只剩下DeepSeek、阿里巴巴、字节跳动呢?

毕竟DeepSeek目前势头最强,选它是很正常。而阿里巴巴的通义千问Qwen模型尽管属于普通用户可能不太了解,但在AI开发者社区却享有盛誉,大量开发者甚至将其称之为“源神”,他们最新的旗舰模型Qwen2.5-Max也已经在Hugging Face上“屠榜”。

所以李开复支持DeepSeek和阿里,其实是支持开源、信息平权路线。毕竟当训练超大规模的AI模型成为了只有巨头才能玩转的烧钱游戏时,如果都不开源,他的零一万物可能就得出局了。

至于说在DeepSeek和阿里之外,李开复选择了字节跳动而非腾讯、百度,其实也有原因。不久前,百度文小言、腾讯元宝先后接入DeepSeek的决策,就已经表明了他们对于自研模型的疑虑。至于坚持闭源路线的字节跳动会被李开复选中,并不是因为豆包大模型本身的表现鹤立鸡群,而是由于字节跳动旗下有抖音。

腾讯元宝在3月3日力压DeepSeek,成为App Store国区免费下载榜的冠军之后,旋即就被豆包反超。而字节跳动更是仅凭一招就扭转了局势,即在3月5日宣布抖音App接入豆包的AI能力,打通了流量平台和AI产品。也就是说字节跳动方面不费吹灰之力,就让豆包获得了海量的用户。

日均使用时长都突破150分钟的抖音,无疑是字节跳动在AI大模型领域立于不败之地的最大倚仗,并且为了豆包,他们甚至在抖音上拒绝了其他AI产品的投放。所以除非抖音失去了国内用户的青睐,否则豆包大模型几乎没有失败的道理。

一家技术领先(DeepSeek)、一家技术与资本兼备(阿里)、一家有着取之不尽的流量(字节跳动),李开复这次的选择可谓是火眼金睛了。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新