在线阅读:https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf
马斯克旗下 xAI 公司刚刚通过线上直播的方式发布了 Grok 3 推理模型。
马斯克在直播中说道:“我们非常高兴能够推出 Grok-3,它的功能比 Grok-2 强大一个数量级。能在这么短 的时间内发布 Grok 3,这要归功于一支不可思议的团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。
马斯克及其团队表示,Grok 3 也将具有类似 DeepSeek R1 和 OpenAI o3 Mini 的推理能力。
马斯克上周在迪拜世界政府峰会的视频通话中预告了 Grok 3 即将发布,并称该聊天机器人具有“非常强大的推理能力”并且是“地球上最聪明的AI”。
据悉,Grok 3 花费 214 天完成构建。
xAI 工程师介绍称,Grok 3 所涉及的训练时间是 Grok 2 的 10 倍。Grok 3 在训练过程调用了 10 万个 NVIDIA H100 芯片,较前代产品 Grok 2 使用的 15,000 个 GPU 实现了数倍的跨越式提升。
目前 Grok 3 已经在 xAI 内部运行了 2 周。
xAI 通过修改 Grok 3 的训练过程(而不仅仅是硬件改进)为 Grok 3 实现了更好的功能。更新后的模型实现了合成数据集、自我校正和强化学习,以提高其性能。
根据官方公布的测试数据, 在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3 在多项 Benchmark 测试中均取得了比 DeepSeek-v3、GPT-4o、Gemini-2 pro 更优的效果。
Grok 3 最大的亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许 Grok 3 像人类一样分步骤解决复杂问题,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。
在直播展示中,Grok-3 现场生成了一段太空发射的 3D 动画的代码,随后成功运行。画面上出现了飞船在地球和火星间往返的动画。
团队表示,这需要 AI 模型理解复杂物理知识。
此外,Gork3 现场还制作了一款类似于俄罗斯方块的游戏。经过思考数分钟后,给出了看起来不错的答案。
马斯克在发布会上表示,这种推理机制使得 Grok 3 在逻辑推理测试中的表现远超 ChatGPT-5 和谷歌的 Gemini Ultra,能够构思出新颖的想法和解决方案。
Grok 大模型已接入马斯克旗下社交媒体 X 平台,用户可在 X 上使用 Grok 聊天机器人。
马斯克称,Grok-3 的最佳体验是“大约一周之后”。
“如果你在寻找一个更完善的版本,也许值得等待一周。我们还在开发语音交互功能,这样你就可以拥有对话体验。今天早些时候我试用了一下,效果不错,不过还需要一些润色。我们的目标是让你可以像和一个人说话一样和它说话。我认为这将是 Grok3 的最佳体验之一,但这需要大约一周的时间。”