马斯克正式发布Grok 3，这回真的把OpenAI干碎了。

IP属地北京 编辑：沈瑾瑜数字生命卡兹克 时间：2025-02-18 16:01:10

中午12点，预告了两三天的Grok3的发布会，终于来了。
前天马斯克就在X上吆喝，说Grok 3是“地球上最聪明的人工智能”。
甚至还在迪拜世界政府峰会说：“Grok 3的推理表现优于我们所知的任何已发布的模型，这是个好迹象。”
而今天，在灯等等灯等的小音乐声中，马斯克习惯性的迟到后，四个大兄弟也坐在了现场，给大家演示Grok 3。
中间C位又是两个华人。
看完全程以后，我只能说，OpenAI现在是真的惨，前脚被DeepSeek，而后脚，又全部被Grok 3给干碎了。。。
是的，连那个遥遥无期的期货o3，都被Grok 3干碎了，而Grok 3，今天X Premium用户可是就可以用了。。。
一文来带大家迅速过一遍，Grok 3的能力。
主要分成3块，Grok 3、Grok 3 Reasoning、Agents。
1. Grok 3
Grok这次是直接冲着OpenAI来的。研发团队一开始就直接甩了Grok和GPT的迭代时间对比。
从Grok0到Grok3，确实是进步飞速。
马斯克嘚啵嘚的意思，就一句话：Grok只用了两年多，就能匹敌GPT五六年的能力。
23年xAI成立后发布了33B的Grok 0，比肩70B的Llama 2。同年11月份，又马不停蹄的发了Grok 1模型。
24年他们不仅发布了Grok 1.5和Grok 2，还发布了xAI的第一个多模态模型Grok-1.5V。
从Grok0到2024 年 8 月 13 日发布的Grok2，再到今天2025年2月的Grok3，Grok的迭代确实很迅速。
关注度这么高的发布会，马斯克也是忍不住炫耀一下自家的十万卡集群Colossus。
老马起初找了数据中心供应商，问他们要在一个地方有序运行10万个Gpu需要多长时间？供应商给的时间范围是从18个月到24个月。
老马直接不乐意了，所以直接自己做。
最终这个集群只用了122天建成，第一阶段是10万块NVIDIA H100 GPU，训练了122天。后来扩展到20万块GPU（含新增的5万块H100与5万块H200），又训练了92天。由田纳西河流域管理局（TVA）提供超过100兆瓦的电力支持。
最终，有了Grok 3这个超级产物。
半个多小时的发布会没啥实际应用的展示，不过光看跑分grok表现也是挺亮眼的。
在他们内部的测试里，数学、科学和代码三个领域的跑分，Grok 3都是最高的。
不带推理能力的Grok，Benchmarks跑分遥遥领先。
在Chatbot Arena竞技场，Grok3直接拿下第一，分数也高得惊人。
带推理能力的Grok，也是直接冲着目前最好的推理模型去的。分数远高于o3和DeepSeek-R1，拉着就是比。
尤其是Grok解数学题的能力，马斯克在发布会上也特意强调他们会给模型更多时间让它自己思考。
在Chatbot Arena竞技场，Grok3直接拿下第一，分数也高得惊人。
不仅第一，还是目前唯一1400分以上的模型，直接把没火多久的Gemini2.0甩开一大截。
2. Grok 3 Reasoning
下一个，reasoning，也就是grok 3的推理模型。
但是因为还没有具体实测到，所以我不知道，他是类似DeepSeek v3和DeepSeek R1这种两套模型的区别，还是类似于Claude在传的那种混合模型的区别，但是我个人感觉大概率还是两套。
然后上来展示这UI设计，好眼熟。
大家都在群里疯狂吐槽，deepseek是你吗。
在跑分上，还是我们熟悉的三领域：数学、科学、代码。
和o3 mini、DeepSeek R1相比，Grok 3 reasoning都取得了领先地位。
特别是o3 mini，直接被干碎了。
5天前，完成了AIME2025的测试，分数最高。
并且还有类似于o1 pro的功能，可以调高参数，允许Grok 3用更长的时间去推理，让大模型花更多时间思考，直到得出结论。
展示的第一个编程例子，动态宇宙模型，思考了114s。
效果看起来还挺好的，感觉马斯克离他的老家火星又进了一步。
第二个展示了Grok的游戏代码，俄罗斯方块演示（视频有点长，我们这里直接五倍速）
case本身难度也不怎么高，具体实测还不知道是个什么情况，具体详情得测试看，如果确实跟跑分一致，老马没吹牛逼，那Grok 3就是地表最强。
3. Agent
最后一个。
老马决定继续按着OpenAI的头打，推出了他们的Agent工具，DeepSearch，也就是深度搜索。
明显就是前段时间OpenAI Deep Research的翻版。
但是效果上，看了下说实话不太像是能对标OpenAI Deep Research的，更偏向于搜索而不是研究，比OpenAI Deep Research的成品和质量还是差的有点远。
更像是Perplexity出的那个。
他们也跑了一个demo。
点击左侧的答案，会有进度条，思考时间不算特别长。
右侧是当前模型的一些摘要，可以看到模型正在浏览哪些网站，并且会交叉验证不同的来源。
可以同时问好几个问题，一起运行。
4. 写在最后
最后的QA环节，直播也解答了大家最关心的几个问题。
Q：什么时候发布Grok3？
A：X上的预先订阅用户可以最早体验，预计一周后陆续发布，推荐大家关注Grok的动态。
Q：现在的新的网址？
A：grok.com
Q：有语音功能吗？
A：有。（但是现场也只是说有语音功能，支持语音转文字，不知道是不是语音通话，但具体的效果如何，还是等上线吧。）
马斯克在发布会上是说，一周后会陆续上线grok 3的所有功能。也就是说Grok 3、Grok 3的推理模型、DeepResearch、包括app端。
这个画面总让我幻视直播带货，感觉马斯克应该说一句“老铁们记得订阅”。
行，信一回，等着下周上手玩玩了。
老马还说，之后会开源上一代模型，也就是Grok 2，那我也坐等。
无论如何，新王已到，江湖又得重新排座次了。
AI圈，变得就是如此之快。
AI一天，人间一年。
我们，拭目以待。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

官宣！刘成任中信建投董事长，芦苇接任中信银行行长

中农集团董事长被曝失联，客服称属实公司运作都停止，中农e购很多商品库存为0

董明珠经常半夜发通知：24小时都在想格力的事情

才合作就拆台？爱奇艺CEO龚宇公开点名红果短剧拍他协议

马斯克为美国黄金储备查账：这次可能又会踢到铁板

阿里CEO吴泳铭：将专注三大业务类型，投入三大AI方向

华大集团CEO尹烨：当医疗行业遇上AI大模型……

5500亿中信建投“换帅”，中信银行原行长刘成出任董事长

公告：集团董事长已失联！

估值 182 亿，曹德旺入股，江苏常熟冲出一家 IPO

图森未来解散广州3A游戏团队 CEO称内部“赛马”做游戏

公司热点｜普元信息董事长等多位高管组团减持！公司扣非净利连亏三年

中信银行行长刘成辞职，或将出任中信建投董事长

马斯克宣布：免费！

【沈鼓讯息】戴继双董事长接待光大银行沈阳分行行长周鹏一行来访调研

官宣！券商巨头董事长，退休！继任者，定了

信达证券董事长艾久超今年58岁在大股东中国信达任董秘

华熙生物业绩承压，59岁女董事长赵燕5年总薪酬近1800万元

超越ChatGPT！马斯克Grok升至苹果美区应用商店免费APP榜首

马斯克宣布：免费！

库克，不愧是“库存克星”！iPhone 16e价格太狠了！

情况属实！集团董事长失联

突发公告，董事长失联！

马斯克宣布：免费！

信阳建投投资集团换帅！杨帆出任董事长

这位坐姿松弛的民营企业家，到底有多牛？

中信建投选举57岁刘成接任董事长，四个月前刚聘任新总经理

全站最新

YouTube 将推出低价无广告套餐 Premium Lite，瞄准特定用户群体

华擎推出其首款“Pro X3D”系列 AMD 主板，但没有任何特殊之处

又帅又聪明，上汽奥迪A5L亮相感染力满满

2025新能源破局之路：消纳堵点何解？行业自律能否引领新篇章？

国产普拉多旗舰VX版2月26日震撼上市，全时四驱越野新选择！

企业股权设计方案：创业导师胥大成的专业之道与14年创投经验

三线城市养老院的自述：久病床前都无孝子，更别说陌生人

买房别踩坑！业主哭诉选错楼层的惨痛教训，这几层千万别碰！

热门推荐

官宣！刘成任中信建投董事长，芦苇接任中信银行行长

中农集团董事长被曝失联，客服称属实公司运作都停止，中农e购很多商品库存为0

董明珠经常半夜发通知：24小时都在想格力的事情

才合作就拆台？爱奇艺CEO龚宇公开点名红果短剧拍他协议

马斯克为美国黄金储备查账：这次可能又会踢到铁板

阿里CEO吴泳铭：将专注三大业务类型，投入三大AI方向

华大集团CEO尹烨：当医疗行业遇上AI大模型……

5500亿中信建投“换帅”，中信银行原行长刘成出任董事长

公告：集团董事长已失联！

估值 182 亿，曹德旺入股，江苏常熟冲出一家 IPO

图森未来解散广州3A游戏团队 CEO称内部“赛马”做游戏

公司热点｜普元信息董事长等多位高管组团减持！公司扣非净利连亏三年

中信银行行长刘成辞职，或将出任中信建投董事长

马斯克宣布：免费！

【沈鼓讯息】戴继双董事长接待光大银行沈阳分行行长周鹏一行来访调研