当前位置: 首页 » 资讯 » 新科技 » 正文

马斯克Grok-3模型与DeepSeek-V3模型较量谁赢?

IP属地 北京 编辑:沈瑾瑜 蓝鲸新闻 时间:2025-02-21 19:31:02

2月18日讯(记者 朱俊熹)2月18日,较原定发布时间延迟近20分钟后,埃隆·马斯克带着他预告多次的“地球上最聪明的AI”新模型亮相。

据马斯克旗下人工智能初创公司xAI介绍,在数学、科学、编码等基准测试中,最新推出的Grok-3模型得分要高于谷歌的Gemini 2.0 Pro、OpenAI的GPT-4o、DeepSeek的V3等模型。Grok-3系列中,另外两个具备推理能力的新模型在AIME 2025测试集上的表现也要优于OpenAI和DeepSeek的推理模型。

图片直播截图

基于Grok-3推理模型,xAI还推出了一项新产品“深度搜索”。从命名和功能上,都与OpenAI此前发布的一款智能体相类似。该产品能够快速扫描互联网包括X平台上的信息,并以摘要的形式提供回答。马斯克称,这将节省大量的搜索时间。

从xAI公布的结果上看,Grok-3模型在能力上确实符合马斯克的形容,但目前仅有社交平台X的高级订阅用户能够使用到Grok-3。其他用户如想体验,需订购xAI的一项新的付费计划SuperGrok,每月收费30美元或每年300美元,将在未来几天内开放。至于面向企业客户和开发者的API服务,还需要等待几周的时间。

“我们的普遍做法是,当下一个版本完全发布时,我们会开源前一个版本。比如当Grok-3成熟并稳定后,可能是在几个月内,我们就会开源Grok-2。”xAI表示。

和DeepSeek不同,xAI一直是AI行业内追求“大力出奇迹”的代表。马斯克提到,Grok-3的计算量比前一代模型Grok-2要高上10倍。

据xAI技术负责人在直播时的介绍,马斯克在去年决定,xAI想要构建出最好的AI并取得成功的唯一途径,就是建立数据中心。因此,团队在122天内让第一批10万块GPU投入使用,是“目前最大的完全连接的H100集群”。之后又用了92天的时间,将数据中心的容量继续翻倍,并基于这些成果构建出了Grok-3。

xAI负责人表示,“如果你看看所有性能的来源,当你有一个非常强大的工程团队和最优秀的AI人才时,唯一需要的就是一个强大的集群,才能产生巨大的智能。”

而被拿来进行对比的DeepSeek-V3模型,则是在配备了2048个英伟达H800 GPU的集群上进行训练的。H800是英伟达特供中国市场的AI芯片,在性能上不及先进的H200、H100等。据DeepSeek计算,V3的训练成本为557.6万美元。

尽管DeepSeek掀起了对大规模AI基建的质疑潮,但硅谷科技公司仍然没有放弃资本战的逻辑。据彭博社上周引述知情人士说法称,xAI正在讨论新一轮100亿美元的融资,公司估值可能达到750亿美元。其竞争对手OpenAI也在进行一轮高达400亿美元的融资,估值将可能被推高至3000亿美元。

近一段时间以来,马斯克和OpenAI之间硝烟频起。上周,由马斯克牵头的财团报价974亿美元欲收购OpenAI的非营利组织。此后,OpenAI董事会正式拒绝了这一提议。CEO Sam Altman还表示这是竞争对手试图“拖慢我们速度”的策略,在X平台上回复马斯克称,“不用了,但如果你想要,我们可以出价97.4亿美元收购Twitter。”

有分析人士指出,马斯克的收购提议可能旨在扰乱OpenAI的重组进程。目前,OpenAI拥有一家营利性子公司,但该子公司受到非营利性董事会的管理。而OpenAI希望转型成为一家营利性企业,为此需要以股权的形式来补偿非营利组织。马斯克的报价可能会作为参考,影响OpenAI非营利组织的资产估值。

据英国《金融时报》2月18日报道,OpenAI正在考虑授予其非营利董事会特殊投票权,保留董事会对重组后公司的控制权,以此抵御马斯克等外部人士的恶意收购。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新