北京时间2月18日,埃隆·马斯克的人工智能初创公司xAI发布了更新版Grok 3大模型,马斯克称之为“地球上最聪明的人工智能”。
在xAI当天的直播中,马斯克和三位工程师一起进行了各种现场演示。 在演示的数学、科学和编程基准测试中,Grok 3击败了谷歌Gemini、DeepSeek的V3和R1模型、Anthropic的Claude和OpenAI的GPT-4o。
据演示发布的数据,在Chatbot Arena这一用于众包人工智能基准测试的开放平台上,Grok 3也是第一个得分超过1400分的模型。
此外,xAI宣布推出名为Deepsearch的Grok-3智能搜索引擎。名字和最近大热的Deepseek颇有几分相似。
Grok 3聪明在哪?
马斯克强调,Grok-3可以减少AI幻觉,方法是通过来回检查数据并尝试实现逻辑一致性。他还透露,训练Grok-3所使用的算力远多于此前的版本,并使用了大量合成数据。
不同于DeepSeek的算法优化路径(DeepSeek-V3用2048个H800 GPU,训练2788千小时),xAI透露,Grok-3的开发的得益于用8个月时间建成的Colossus超级计算机,它由10万个英伟达的H100 GPU驱动,为训练提供了2亿个GPU小时,比Grok-2多十多倍。
2023年7月,马斯克成立xAI公司。2023年11月,xAI发布第一款大模型 Grok-1,拥有3140亿参数,成为当时参数量最大的开源大语言模型;2024年8月发布的Grok-2,在性能上与ChatGPT最新模型相媲美。该系列大模型可以通过联网获取实时信息,浏览和使用X平台(原推特)上的资讯,使其具有信息获取的时效性。
不过也有分析认为,在中国DeepSeek大模型推出后,未来是否还需要类似OpenAI或xAI这样利用“大规模堆芯片和算力”的昂贵代价来推进AI发展成为业内关注的焦点。OpenAI首席执行官奥尔特曼此前表示,DeepSeek让OpenAI的领先优势不会像前几年那么大了,他表示,在开源模型和研究成果的问题上,OpenAI已经站在了历史的错误一边,需要制定不同的开源策略。