当前位置: 首页 » 资讯 » 新科技 » 正文

大模型开源潮:DeepSeek领衔,六小虎、大厂齐发力,格局重构进行时

IP属地 北京 编辑:沈如风 蓝鲸财经 时间:2025-02-26 16:02:16

甚至OpenAI近日也公布了开源计划,OpenAI CEO Sam Altman在社交平台X上就公司下一个开源项目是o3-mini 级模型还是手机端侧模型征询公众意见,让用户投票二选一。此前,在2月6日,OpenAI 也罕见地公开了最新模型 o3-mini 系列模型的思维链。

接下来,六小虎和大厂如何应对?闭源大模型商业模式如何面对市场新拷问?

六小虎陆续开源,大厂加速布局

被动或主动,从1月中旬以来,六小虎就陆续用实际的开源行动来应对这波开源潮。

1月15日,MiniMax发布并首次开源了其最新一代基础大模型MiniMax-01系列模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01,公开了技术报告,并开源了两个模型的完整权重。

在2025 GDC全球开发者先锋大会上,MiniMax副总裁刘华分享称,开源是推动行业发展的关键,此次开源,是希望更多开发者可以参与底层生态建设,加速非Transformer架构的创新。“线性注意力探索方面,我们也只是起步,所以我们对所有的技术创新进行了全面的开源,希望有更多的开发者一起探索非transformer的底层架构,”

2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。

阶跃星辰副总裁李璟称,“开源模型能够为模型公司带来更多的支持者和技术社区的反馈,从而促进模型的迭代和优化。”

李璟透露,接下来,阶跃星辰会继续开展更多开源计划,在行业方面更加聚焦,之后也将也即将在三月份开源图生视频大模型

之后,在2月23日凌晨,Kimi宣布开源其最新技术报告和大模型 Moonlight。

头部的基础大模型创业公司之外,另一个备受关注的是大厂。

其中,阿里对于开源的态度一直是支持,自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。数据显示,目前阿里千问(Qwen)衍生模型数量已超过10万个。

阿里最新一次开源发生在2月25日晚间,阿里云旗下视觉生成基座模型万相2.1(Wan)也宣布开源,其中14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。

出乎意料的是,在2月14日,百度宣布将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。从宣布开源计划到最终开源,百度计划用四个月来实现,足以看出此次开源是计划之外,也需要重新投入人力和资源才能达成。

目前字节在大模型领域的开源主要在训练框架方面,尚未公布更多基础大模型的开源动作。

当下闭源份额高于开源,未来一两年内会发生颠覆性变化

随着各家都在紧锣密鼓地布局,更多讨论也随之而来,开源是否会冲击现在闭源模型的商业模式,大模型生态将会发生什么变化?

在2025全球开发者先锋大会开幕式上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋、指出:“DeepSeek的开源是开源社区的胜利。将了不起的模型开源出来,可以让更多的人有机会在这些模型的基础上做更多了不起的事情”

沈向洋认为,目前市场上,闭源的份额可能略高于开源但这种情况在未来一两年内可能会发生很大的变化。“开源和闭源并不是完全对立的,可以通过合理的商业模式实现两者的平衡,未来需要找到一个平衡点,使得开源和闭源能够更好地共存和发展。”

沈向洋并不认为开源就意味着就无法创造商业利益,他提到:“可以通过提供软件服务等形式实现商业模式的创新。例如,Red Hat通过提供Linux相关的软件服务,成为了市值数百亿美元的公司。”

从技术和产品上来看,开源和闭源产品各有优劣势。

Hugging Face工程师王铁震分享称,相对于闭源模型,开源模型给予用户所有的掌控权,包括给用户微调模型的权利,还有在数据隐私方面有非常好的优势,可以根据特定领域的数据进行训练,从而更好地适应和解决该领域的问题。

但他也提到,闭源模型的优势在于其产品化和易用性。“闭源模型是一个产品,用户只需调用API即可,无需自己部署和维护。相比之下,开源模型更像是一个工具,用户需要自己搭建机房、申请服务器、进行部署,并且需要一定的技术团队来支持。”

开源和闭源的更多讨论还在持续,短期来看,DeepSeek的开源势必会缩窄各大模型能力差距,开源和闭源模型能力差异也越发不明显,大模型的格局将会形成新的走向。

接下来,不论对大厂还是创业公司,如何打造产品能力,与产业深度融合,把壁垒建得更深厚,将成为大模型市场竞争的关键。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新