Tech星球
来源|Tech星球
文|任雪芸
2月14日,百度又官宣新消息:将在未来几个月内陆续推出文心大模型4.5系列,并于6月30日起正式开源。
事实上这几日,百度密集地推出了多项AI开放政策。
2月12日,CNBC一则关于百度文心大模型5.0版本将于下半年发布的消息,在AI行业引发震动。次日,OpenAI首席执行官Sam Altman宣布将在未来几个月推出名为GPT-5,进一步加剧全球AI竞赛的紧张氛围。
然而,真正的“王炸”还是来自百度:同日,百度正式宣布,文心一言将于4月1日全面免费开放,所有PC端和APP端用户均可体验文心系列最新模型,同时上线深度搜索功能。
百度的这一决定,不仅意味着全球用户可零门槛使用中国最先进的大模型技术,也标志着大模型从专业领域迈向大众市场的关键转折,一场普惠大众的AI变革浪潮拉开帷幕 。
从OpenAI开放ChatGPT Search、谷歌免费推出Gemini 2.0,到阿里通义千问、讯飞星火接连开放API免费额度、腾讯混元大模型内测零门槛,再到文心一言的全面免费和文心大模型开源,科技巨头们近乎同步的动作,揭示了一个核心趋势:AI技术的普及已进入“全民化”阶段。
大模型行至2025年,已度过初步发展阶段,迈入 AI应用爆发阶段。开源有助于技术更快传播,提高采用率,为人们更低门槛创造AI应用创新带来更多机会。开源最新系列的模型,意味着百度将采用更积极的姿态面对市场,携手推动产业发展,尤其是助推AI应用层的进步。
百度以免费、开源为支点,撬动技术平权的杠杆,其背后既是技术实力的自信,更是对AI生态重构的深远布局。
文心大模型4.0:从参数爆炸到多模态革命
开源是强者游戏,需要强大的技术自信。近两年来,文心大模型不断迭代,技术能力已有深厚积累,此时开源背后,更是技术底气的体现。
文心一言的发展历程,可以称得上是一部中国大模型技术的进化史。
早在2019年,百度就推出了1亿参数规模的文心大模型1.0版本,随后又在2.0版本升级至10亿参数,ChatGPT发布后不久,百度抢先推出了3.0版本,并在2023年10月迭代到4.0版本,紧接着在2024年4月发布文心大模型4.0工具版。
文心大模型的持续快速进化,是百度作为行业先行者不断突破技术边界、引领产业变革的有力见证。
文心一言1.0阶段,整个行业对于中文语境下大模型的构建还处于迷茫与观望阶段,百度率先为行业初步验证了中文语境下大模型的可行性。从2.0版本之后,文心一言持续进化,构建了从语义理解到知识推理的完整认知框架,实现了对复杂语言现象和知识的精准把握。
相比3.5版本,文心大模型 4.0不仅做到了参数的升级,其构建于 “知识增强 + 场景进化” 的双引擎架构之上,以“多模态能力”为核心,其语言理解、推理、生成能力表现尤为突出。
在多个对比测试中,用户已经能更直观地感受到文心大模型4.0 的能力进阶。开放免费使用后,相信将让广大用户直接受益。
以 “绘制一幅奥黛丽・赫本吃汤圆的画面” 这一指令为例,文心大模型 3.5 版本仅仅生成了一张符合指令基本要求的图片。反观文心大模型4.0,借助其自主研发的 IRAG(image - based RAG)能力,不仅能够精准地描绘出奥黛丽・赫本的面部轮廓,让人物形象栩栩如生,还一次性输出了多张细节精妙的图片。
除了图像生成能力的显著提升,在处理复杂逻辑推理问题时,文心大模型4.0同样表现出色。
面对 “世界八大奇迹哪一个最有可能是外星人建的,严谨地推理一下” 这样充满挑战的问题,文心大模型3.5 和 4.0 版本都能捕捉到题目中的关键线索。
但文心大模型4.0的优势在于,它不仅能正面回应这类极具创意性的问题,还能以图文并茂等富媒体形式呈现推理过程和结论,展现了其强大的逻辑思维与知识整合输出能力。
通过以上实测不难发现,文心大模型 4.0通过多模态知识关联实现了“视觉认知、知识图谱、逻辑推演”的三维联动,这种架构创新让AI已经具备了接近人类的多维度问题解决能力。
成本革命:从实验室到普惠的技术密码
开源和免费策略背后,亦是技术创新驱动,大模型不断迭代带来成本降低和生产力提升。
在近日召开的世界政府峰会上,李彦宏表示,在AI领域或IT行业,大多数创新都与降低成本有关。
“如果成本降低一定比例,生产力也随之提高同样比例。在今天,创新速度比以往都快得多。根据摩尔定律,每18个月,性能就会翻倍而价格减半。如今,大模型推理成本每年降低90%以上。”
这一数字背后,是行业大模型技术的深度变革与突破。
成本的大幅降低,使得大模型不再是仅存于顶尖实验室、少数科技巨头手中的昂贵 “奢侈品”,而是得以广泛普及,为千行百业的发展注入新动能。
成本下降的原因指向技术的成熟。过去几年,以百度为首的大模型企业们,一直在硬件、算法、工程化层面突破,致力于进一步降低门槛,努力提升商业化能力。
回溯大模型发展的早期阶段,技术不成熟带来的高成本问题,笼罩着众多AI企业。
以一个数百亿参数的Transformer模型为例,进行大规模预训练,通常需要数周到数月的时间,且需要依赖GPU集群的持续运行。在GPU单价居高不下的时代,每天的训练费用可能高达数十万美元甚至更多。
行业一直在围绕算法和硬件两个层面降本,百度的做法是,通过昆仑芯+百舸AI异构计算平台双轮驱动,构建超大规模算力集群。
其中,百度智能云通过自研昆仑芯三代及万卡集群建设,在确保了自身算力供应以外,同时为行业提供了新的降本增效方案。据百度方面介绍,万卡集群除了能处理单一任务,还可同时训练多个轻量化模型。基于通信优化与容错机制,有效减少算力浪费,实现训练成本指数级下降。
支撑万卡集群高效运行的是百度自研的昆仑芯三代。相较于前代产品,百度自研的新一代昆仑芯在算力、能效、稳定性等方面全面升级,针对大模型的分布式训练,昆仑芯三代结合并行任务切分策略,在训练主流开源模型时,将集群MFU(集群计算利用率)提升至58%,有效提升算力利用效率。
如果说训练成本决定技术上限,那么推理成本则决定了应用下限。
得益于百度四层技术栈的独特优势,芯片、框架、大模型和终端应用场景能够形成高效的反馈闭环,帮助大模型不断调优迭代。早在2024年初的财报电话会上,李彦宏曾透露,自发布以来,百度不断降低文心大模型的推理成本,已降低至一年前的1%。
训练成本和推理成本的断崖式下降,使百度有能力将文心一言从“付费会员制”转向全民免费。
而这一策略也绝非简单的价格战。此前百度CTO王海峰透露,文心大模型日均调用量已超2亿次,这种量级的用户交互数据,是打磨AI能力的核心燃料。
免费策略本质上是用短期收益换取数据飞轮的高速旋转,当单次API调用成本越来越低,免费开放带来的用户规模效应,反而可能通过生态反哺实现商业闭环。这种以战养战的策略,正在改写AI进化的底层逻辑。
技术平权:重构AI生态的底层逻辑
过去互联网的免费开放催生了淘宝、微信等国民级应用。今天,AI技术的普惠正在重演这一历史。
公开数据显示,截至2024年11月,文心一言用户规模为4.3亿,文心大模型日均调用量超过15亿次。当文心一言的API接口向所有开发者敞开时,一个“AI原生应用”的爆发期已然临近,当技术门槛消失时,创新将呈指数级涌现。
免费和开源背后,百度的战略意图清晰可见:以AI为纽带,构建一个涵盖开发者、企业用户、个人消费者的超级生态。
一方面,通过免费、开源开放吸引开发者,开发者创造应用吸引用户,用户数据反哺模型优化,最终形成自我强化的生态闭环。
百度官方数据显示,截至11月,飞桨文心生态已凝聚1808万开发者,已服务43万家企事业单位,已创建101万个模型。
当AI从少数企业的“护城河”变为全社会的“基础设施”,其价值创造方式将发生根本性转变——技术优势不再体现于模型参数的多寡,而在于能否激发千万开发者的创造力。
这种模式下,属于大模型企业的商业成功不再取决于短期利润,而在于能否构建可持续的生态价值网络。免费及开源后,百度既是技术提供者,更是生态规则制定者。
另一方面,在C端,截至第三季度,百度App月活用户达7.04亿。当更多的用户习惯用文心一言写周报、做PPT、开网店时,百度就把守住了下一代互联网的入口。
文心一言在 C 端获得更广泛的应用,不仅会改变用户的工作与生活方式,提高效率,还能为百度积累了海量的用户数据与使用场景,进一步巩固了其在 AI 领域的领先地位,为其生态发展注入动力。
技术平权也是AI时代的生存法则。回看历史,每一次“免费革命”都伴随着市场激烈的竞争:今天的AI免费大战,同样也是生态位争夺战的前奏。
当OpenAI和谷歌竞相选择开放,DeepSeek掀起波澜时,市场争夺的不仅是用户,更是未来AI标准的话语权。百度选择此时全面免费和开源,是对市场竞争的直接回应。在这场科技变革的盛宴中,掌握生态主导权的企业,将定义下一个十年的技术规则。