今年春节期间,DeepSeek爆火,掀起的大模型“冲击波”影响了整个行业,一个直接的后果就是大模型的竞赛提速了,最明显的例证就是最近百度与OpenAI之间铆足了劲比谁“跑得快”。
大模型“头部效应”是竞赛提速的原因,所谓大模型“头部效应”是指在大模型领域,少数领先的大模型及其开发企业凭借技术、数据、资源、市场等多方面优势,占据市场主导地位,并不断巩固和扩大这种优势,从而拉开与其他竞争对手的差距。
2月28日,百度官方公众号宣布,将于3月16日发布文心大模型4.5。此次百度文心大模型换挡提速,于行业来说显得突然,于大模型的发展来说却是必须:跑得快才能有资格做头部,做了头部才能有活下去的机会。
争当头部是百度发展过程中的实践经验:1999年百度成立,随后行业内出现了上百家提供搜索引擎的创业公司,百度战胜了所有对手,才有了后来在搜索行业的绝对领先地位,其中包括搜狐、北大天网、3721等实力派对手。
2023年3月16日,百度推出了全球大厂中首个生成式AI产品:文心一言。百度将在两年过去后的同一天推出文心大模型4.5,传达的信息很明显:两年过去了,到了决定胜负的时候了。
在大模型领域,百度对标的对手是OpenAI。2月28日凌晨,来自中新网等媒体报道,OpenAI宣布推出OpenAIGPT-4.5的研究预览版,并称其为OpenAI迄今为止规模最大、知识最丰富的模型。
百度28日宣布推出将文心大模型4.5,硬碰硬,行业内的人都闻到了两家公司激烈角逐的火药味。代表中国的百度文心大模型、DeepSeek与代表美国的OpenAIGPT、Grok相互角力将是未来一段时间内的大模型行业格局。
1
对标OpenAI,中美大模型角力
2月27日,据路透社爆料,百度将在3月中下旬发布文心大模型4.5。DeepSeek之后,中国大模型行业期待更多振奋的消息,文心大模型4.5恰逢其时。
2月14日,百度宣布在未来几个月推出文心大模型4.5系列,对于即将推出的文心大模型4.5系列,市场期待文心大模型4.5。
2月18日晚,在百度2024年Q4及全年财报电话会上,百度创始人、董事长兼CEO李彦宏透露了文心大模型4.5系列的更多消息:4.5将是百度有史以来最强大的大模型,“希望客户和用户能比之前更方便地体验这款模型”。
百度提供的资料显示,文心大模型4.5将在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。
这将是百度最强的下一代大模型:文心大模型的RAG能力是目前国内最强的,去年百度还自研了iRAG等技术,大幅降低图片生成领域的幻觉。还
据此推测文心大模型4.5将在幻觉方面降低到新水平。
百度的对手OpenAI也没有闲着,2月13日凌晨,OpenAI首席执行官SamAltman公布了GPT-4.5和GPT-5的最新消息。免费版ChatGPT能在标准智能设置下无限制地使用GPT-5进行对话。
当地时间2月6日,OpenAI宣布ChatGPTSearch向所有人开放,无需注册,来到OpenAI官网首页就可以直接使用搜索功能。2月28日凌晨,OpenAI发布了GPT-4.5模型。
GPT-4.5性能被业内评价为“差强人意”。OpenAI的GPT4.5不具备推理能力,还是主打写作等文本生成,在基准测试上的得分甚至不如OpenAI的前几代模型。
有分析认为,OpenAI此次发布略显仓促,来自中国竞争加剧的压力可能是重要原因。毕竟,几小时前,路透社刚爆料了百度文心4.5将在3月中旬发布的消息,还有春节期间火爆出圈的DeepSeek。文心大模型4.5比GPT4.5更值得期待的是多模态和深度思考能力。
百度文心大模型是全球最早对标GPT的LLM大模型,过去两年,业内常将两者放在一起分析对比。
文心大模型和GPT4.5前后脚发布,两者的竞争还没有结束,OpenAI首席执行官萨姆・奥尔特曼2025年2月13日透露,OpenAI将在未来几个月内推出GPT-5,消息人士透露,百度将于年内推出文心大模型5.0。
2
开源、免费,百度的“开放”组合拳
应用、开源、免费,中美大模型角力,百度、OpenAI等公司在各个维度展开了角力。
2月13日,百度宣布文心一言将于4月1日0时起全面免费,同时上线深度搜索功能。所有PC端和APP端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级AI绘画、多语种对话等功能。
同时,文心一言上线深度搜索功能,该功能具备更强大的思考规划和工具调用能力,可为用户提供专家级内容回复,并处理多场景任务,实现多模态输入与输出。截至目前,文心一言用户规模达到4.3亿,文心大模型日均调用量超过16.5亿次。
深度搜索针对专业咨询类问题的解决能力(深度搜索)进行全面加强,以解决专业问题查询门槛高、查询渠道专精、查询结果分析难度大等使用挑战。在民生、创业、经济分析等方面问题,能够提供专家级的内容回复;除了搜索能力以外,文心一言具备全面的思考、规划、反思能力,针对工具规划及调用能力上进行全面加强,能够更加“聪明”的使用多个工具解决各类复杂任务问题。
例如先搜索内容,再配合代码解释器,或者阅读上传文档、再搜索分析,最后综合给出结果等。
2月14日,百度宣布文心大模型从6月30日正式开源。2月18日,李彦宏在财报会上确认文心大模型4.5将开源。开源文心大模型4.5,让开发者和用户能够更轻松地试用,为行业发展注入新活力,将推动其在更多领域的广泛应用。
李彦宏表示:开源决策源自于对技术领先地位的信心,相信文心大模型4.5的技术优势能够在开源后经受住市场的检验,并进一步扩大其影响力。
李彦宏说“但我想强调的是,无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值”。未来,百度将加速推动文心大模型的性能升级与成本降低。
百度的“开放”组合拳将行业拉进入“免费+开源”的新阶段,将大模型的使用门槛拉到极致,无疑将助推大模型应用爆发。
能力建设是大模型平台之间的第一场战争,应用、市场、用户争夺是第二场战争。接连打出“开源、免费”组合拳,百度要用更加开放的策略,去占据大模型第二场竞争中的主动权。
在中国的竞争压力下,OpenAI也被卷加速了模型发布和开源的脚步。1月31日,OpenAI的CEO萨姆·奥尔特曼表示,OpenAI在开源AI软件方面“一直站在历史的错误一边”。目前OpenAI内部正讨论公开AI模型的权重等事宜。
同日有媒体透露,奥尔特曼的这一最新表态承认了OpenAI的“封闭策略”可能存在缺陷,同时表明,随着来自中国的竞争加剧,高效的开放模型越来越受欢迎,OpenAI的战略可能会发生重大转变。
在大模型行业第二场战争中,百度、OpenAI等头部玩家率先开启了新玩法,中美大模型之战进入了新阶段。
3
更好的下一代模型
需要持续的AI基建投入
一般来说,新技术的普及与成本之间存在着紧密的关系,通常表现为成本降低有利于新技术的普及,而新技术的普及又可能进一步促使成本下降。
计算机行业的摩尔定律就是这一规律的最好例证:集成电路上可容纳的晶体管数目,约每隔18-24个月便会增加一倍,性能也将提升一倍,而价格保持不变或下降。
摩尔定律由英特尔创始人之一戈登・摩尔提出,其意味着随着时间推移,同样价格能买到性能更强的芯片等电子产品,或者说实现相同功能的成本会不断降低,推动了计算机、半导体等行业的快速发展和相关技术的普及。
在今年2月11日的迪拜世界政府峰会(WGS2025)上,李彦宏与阿联酋AI部长奥马尔・苏丹・奥拉马进行了对谈的过程中提出大模型时代的摩尔定律:当我们谈论大型语言模型时,12个月内推理成本基本上可以降低90%以上成本。
李彦宏说:不仅在AI领域或IT行业,回顾过去几百年的历史,大多数创新都与降低成本有关。如果成本降低一定比例,生产力也随之提高同样比例,这就是创新的本质。
李彦宏“开源+免费”的行业前瞻正是基于这一逻辑的判断,算力成本越来越低,并且性能越来越好,应用普及的机会已经到来。任何行业都会用大模型重新做一遍,随着各种应用的出现,类似PC互联网、移动互联网那样的创新周期正在到来。
关于算力成本降低,DeepSeek是最好的例证,基于独特的技术架构与算法,每个Token只需处理360亿参数,远低于Llama3.1的4050亿参数,有效减少计算量。以文心大模型、DeepSeek为代表的模型厂商持续降低推理成本,降本进而促进普惠已成为行业普遍现象。
正如李彦宏在近日一次对谈的过程中说:也许在某个时刻,你会找到一条捷径,比如说只需600万美元就能训练出一个模型,但在此之前,你可能已经花费了数十亿美元来探索,哪条路才是花费这600万美元的正确途径。
李彦宏认为即使算力成本降低,算力芯片需求仍有巨大的需求空间:当技术发展如此之快,你必须持续投入,以确保处于技术创新的最前沿。
李彦宏表示,百度仍需对芯片、数据中心和云基础设施进行持续投入,来训练更好、更智能的下一代模型。可以想见,即将跟大家见面的文心4.5,在性能创纪录的同时,也将代表着百度AI基础设施投入的新成效。