文 | 唐辰同学
百度正在经历一次关乎生死的路线调整。
在前一天宣布文心一言上线深度搜索功能,并将全面免费之后,百度在今天(2月14日)再次宣布,将开源下一代文心大模型。根据官方消息,百度将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
据唐辰了解,百度计划在今年发布多款模型,并于今年下半年推出文心大模型5.0,将在模型多模态能力方面有显著增强。
百度迅速转向
在百度宣布文心一言免费之前,OpenAI也推出对标DeepSeek-R1的o3-mini模型,并将其免费开放给用户使用。对于突然免费,百度解释称:文心大模型的迭代升级和成本在不断下降。
但大模型路线从闭源转向开源,百度并没有给出明确的解释。反转之快,力度之大,让不少从业者和观察者都感到意外。要知道,此前百度都是强调“闭源”,也是最坚定的“开源”反对者。
2024年,李彦宏在内部讲话时谈到,文心大模型之所以不开源,是基于行业格局和市场态势作出的选择。他表示,文心大模型刚发布时,百度内部曾有过非常激烈的讨论,最后大家决定不开源。
因为“今天不管是在中国也好、在美国也好,最强的基础模型都是闭源的,而各种各样的小模型、最好的小模型,都是通过大模型蒸馏来的。通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。”
他还认为,闭源模型在能力上会持续地领先,而不是一时领先,大模型开源意义不大,闭源才能走通商业模式,闭源是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。
李彦宏还曾多次在公开场合强调闭源的优势。比如在Create 2024百度AI开发者大会上,他直言“开源模型会越来越落后”。
在2024世界人工智能大会(WAIC 2024)期间,李彦宏还表示,开源其实是一种智商税。“无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”
站在百度的角度看,李彦宏的观点并没有不妥之处。他的另外一层意思并不太适合公开表达,那就是,百度之所以选择和OpenAI一样的闭源路线,根本原因还在于保证自己的市场领先地位,并实现最大的商业效益。
百度选择走闭源路线时,掀起大模型浪潮的OpenAI在发布GPT-2之后,也转向闭源。OpenAI CEO萨姆·奥特曼(Sam Altman)甚至在2024年被马斯克告上法庭,嘲讽要求改名为Close AI。
但当时,并没有谁质疑OpenAI的路线和它的商业价值。比如2024年10月3日,OpenAI在官网宣布,获得66亿美元(约合人民币463亿元)融资,这笔资金使这家人工智能公司成为有史以来估值最高的初创公司之一。该公司投后估值已达到1570亿美元,约合人民币1.1万亿元。
闭源意味着百度可以独占技术优势,通过提供API接口或者企业级服务来盈利。而不是把代码、技术秘密都公开出去,失去控制权。换句话说,百度希望更多的开发者、用户和合作伙伴参与到文心大模型的生态体系中,遵守百度制定的游戏规则,形成一个大模型时代的“百度商业生态”。
这是类似“iOS”生态的策略。苹果凭借这套玩法站在全球科技公司之巅,印钞机式的赚钱速度,李彦宏说不艳羡,肯定是假的。他也想在大模型时代,打造出自己的“iOS生态”。
但DeepSeek像一条鲶鱼,搅动了全球AI大模型圈,也打乱了李彦宏的节奏。作为开源路线的坚持者,DeepSeek的成功被认为是开源模型的胜利。有人工智能领域的青年科学家表示,未来开源大模型会越来越多。
业内不少大佬也开始强调开源的价值。比如阿里巴巴联合创始人、董事会主席蔡崇信也在近日表示,DeepSeek让我们看到了开源的价值。”现在如果开发人工智能的目的是打造一个闭源的系统,成为最聪明的博士生,获得诺贝尔奖,我个人认为这种做法的价值几乎为零。”
他们的表态,把DeepSeek推热的开源大模型路线的价值再次放大。百度也随之妥协,“打脸”式的顺应行业趋势,从闭源向开源。
“领先者困境”
在唐辰看来,李彦宏态度反转,除了受到DeepSeek的冲击,还有一个根本原因是为了生存,并试图破局“创新者困境”。
作为国内最早提出并就进军人工智能的公司,百度从2013年就开始在AI的各个细分领域研究、布局,至今投入资金超过1700亿元。李彦宏也早在2016年就将AI确定为百度的公司级战略。
2023年3月,仅落后ChatGPT三个月,百度率先推出“文心一言”大模型,走在了行业前列。过去两年,凭借在AI大模型领域的先发优势,百度取得了一定的成绩。根据百度公开的数据显示,截至2024年11月,文心一言用户规模为4.3亿,文心大模型日均调用量超过15亿次,较2023年增长超30倍。
此外,百度在AI行业的全球第一梯队的地位,也在国际知名研究机构弗若斯特沙利文发布的报告中得到认可,与谷歌、OpenAI位于AI-Native Giant同一象限。
但百度技术上的领先,并没有带来业务和收入的明显改观。过去两个季度,百度营收都出现明显下滑。当李彦宏倡导的“不要卷模型,要卷应用”,成为行业共识时,闭源模式下的百度“AI超级应用”的表现并不太好。
从数据来看,百度在C端应用方面正在被后发力的字节豆包、月之暗面所赶超。根据AI产品榜的1月数据,文小言MAU(月活跃用户数)为1305万,次于豆包、DeepSeek、Kimi排第四。
以致于在12日召开的百度云全员会后,百度集团执行副总裁、百度智能云事业群总裁沈抖的相关言论,还引发与字节跳动火山引擎业务的“口角”。这被不少评论者认为,是在为不太好看的业绩“甩锅推责”。
百度的尴尬境况,正是“创新者的困境”,或者说是“领先者的困境”。“VC网红”朱啸虎在近期点评OpenAI时,也沿用了这个说法。
其背景是,OpenAI也正在转向开源。其创始人萨姆·奥特曼最近承认,DeepSeek的出现改变了过去几年OpenAI遥遥领先的情况。他甚至在一场问答活动中表示:“我认为,我们站在了历史错误的一边,须要制定不同的开源策略。”
朱啸虎认为,萨姆·奥特曼关于开源策略失误的表态,这是“领先者的困境”。在全球AI格局中,DeepSeek让闭源模型的价值遭到质疑。若闭源模型成本高且性能优势不明显,其存在意义就会大打折扣,OpenAI也面临同样的问题。
形势比人强。闭源或者开源,只是一种路线选择。在DeepSeek的冲击下,李彦宏快速调整路线,也未尝不是一个明智的决定。这也可以视为,李彦宏为破局“领先者困境”的尝试。
有一位与百度有深度合作的上市公司CTO对此给出积极评价,他认为,百度加入开源模型大军,肯定是好事,能降低企业使用大模型的价格,节省使用成本。同时,百度开源文心模型后,能让更多开发者为文心模型添砖加瓦,最终模型能力会更强,使用者也会从中受益。
李彦宏“顺势而为”
在正式开源前,百度还有数个月的时间进行相关策略的调整。可以做一个预测,接下来,百度还会有更大的动作,包括但不限于产品路线、市场策略甚至组织架构层面的变动。
这一次,李彦宏学到了“雷军学”的精髓:顺势而为。
2007年金山上市,但雷军有些身心俱疲。他曾表示,“整个金山公司都被上市拖累了,这种疲惫很难用语言表达。”
这句话有两层含义:一层是对于金山,因为谋求上市而错过了互联网的黄金时代;还有一层是对于雷军个人,金山上市,并不完全代表其个人的成功。各项要素都属于顶配的雷军,先后被同辈创业者赶超,在互联网大潮中沦为“配角”。
小米官方传记中描述,雷军离开金山后思考了大半年,“我们这么努力,为什么在互联网浪潮里没有成为主流?”金山给雷军的教训总结起来就是四个字:顺势而为。雷军微信的个人签名,也是“顺势而为”。
事实上,百度也不是从一开始就走大模型闭源路线的。百度曾在2021年开源了文心ERNIE的四大预训练模型,包括多粒度语言知识增强模型 ERNIE-Gram、长文本理解模型 ERNIE-Doc、融合场景图知识的跨模态理解模型 ERNIE-ViL、语言与视觉一体的模型 ERNIE-UNIMO等。
直到2023年10月,百度发布了文心大模型4.0,文心一言也在2023年11月1日开始向用户收费:文心一言专业版成为中国首个采用会员模式面向C端收费的大模型产品,专业版定价达到每月59.9元,连续包月优惠价每月49.9元。
李彦宏的心态也在逐渐的软化。他在2月11日于阿联酋的活动上,被贴脸问及如何看待DeepSeek。李彦宏回应称:“创新是不能被计划的。你不知道创新何时何地到来,你所能做的是,营造一个有利于创新的环境。”
但他还表示,将继续投资,以确保处于这场技术创新或革命的最前沿,也会使用更多算力来尝试不同的路径。李彦宏认为,也许在某个时刻会找到一条捷径,比如只需600万美元就能训练出一个模型,但在此之前,可能已经花费了数十亿美元,用来探索哪条路才是花费这600万美元的正确途径。
言外之意,我听出来了:李彦宏内心有迫于现实的妥协,但仍然有他的技术理想主义的坚守。百度在AI领域的底蕴,或将是他回应外界质疑的底气。而顺势而为,也将让他有更清晰的目标设定,以逃离“创新者困境”,并且以更放松的心态对待“闭源or开源”的胜负之争。
参考资料:
中国企业家杂志,《李彦宏也“卷”起来了》 唐辰同学,《雷军不当影子,终成“雷军”》 财联社,《李彦宏态度反转!DeepSeek爆火后 百度宣布大模型将开源》 腾讯科技,《若DeepSeek开放融资是否会参投?朱啸虎直言:我肯定会投!》