当前位置：首页 » 资讯 » 新科技 » 正文

号称“地球上最聪明的AI”，Grok 3竟答不出9.11和9.9哪个大

IP属地北京 编辑：苏婉清 IT之家 时间：2025-02-19 12:32:26

2 月 19 日消息，昨天马斯克及其 xAI 团队在直播中正式发布了 Grok 3，此前马斯克通过持续的预热宣传，将外界对 Grok3 的期待值推向了前所未有的高度。马斯克称 Grok 3 为，然而其实际表现似乎对不起这个名号。
注意到，在发布会上，马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型，并计划将其应用于 SpaceX 的火星任务计算，甚至预测未来三年内将实现诺贝尔奖级别的突破。
但 Grok 3 的实际测试表现却让人大跌眼镜。发布后，一些媒体测试了最新的 Beta 版 Grok 3，并提出了那个经典的用来刁难大模型的问题：“9.11 与 9.9 哪个大？”遗憾的是，号称目前最聪明的 Grok 3，仍然无法正确回答这个问题，被网友戏称为“天才不愿意回答简单问题”。
此外，在 xAI 发布会直播中，在分析游戏《流放之路 2》的职业与升华效果时，Grok 3 也给出了大量错误答案，并且马斯克也没有看出这些明显的错误。
尽管在官方 PPT 中，Grok3 在大模型竞技场 Chatbot Arena 中看似“遥遥领先”，但实际上其与 DeepSeek R1 和 GPT4.0 的差距仅为 1% 到 2%。
马斯克在发布会上透露，Grok 3 使用了超过 20 万张 H100 芯片，总训练小时数达到两亿小时。作为对比，DeepSeek V3 仅使用 2000 张 H800 芯片训练两个月，其性能却与 Grok 3 相差无几。这表明，随着模型规模的不断扩大，性能提升的边际效应已经显现。
值得一提的是，马斯克在社交媒体上表示，当前的 Grok 3 仅是测试版，完整版将在未来几个月推出，并邀请用户反馈使用问题。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

王兴兴知乎十年：从科技迷到商界精英的“逆转人生”

山东港口发布《人工智能（大模型）总体建设规划》

观点直击 | 阿里巴巴的AI大考

YouTube 将推出低价无广告套餐 Premium Lite，瞄准特定用户群体

华擎推出其首款“Pro X3D”系列 AMD 主板，但没有任何特殊之处

亚马逊安卓应用商店宣布 8 月 20 日起关闭

扒一扒宇树王兴兴10年知乎生涯，原来他也走了一条“逆转人生”路

超越DeepSeek？Grok3唯一实锤合作商浮现，直供马斯克+高盛抢筹，蓄势待发

冠军之姿：雷蛇毒蝰 V3 专业版 Faker 限定款发布，1399 元

英伟达发布 Game Ready 572.47 WHQL驱动，支持 RTX 5070 Ti 显卡

普门科技发布2024年度业绩快报，盈利3.467亿元，低于分析师预期

普门科技：2024年净利3.47亿元同比增长5.52%

行业首批！腾讯云TI平台支持DeepSeek全系模型精调与推理

超越ChatGPT的AI智能体（英文）

普门科技Q4净利同比下滑近三成拟年内推出中速发光仪器

王兴兴知乎十年：从科技迷到商界精英的“逆转人生”

Epic喜加二：《花园故事》《僵尸世界大战：劫后余生》游戏免费领

R星宣布《GT5A》3 月 4 日可免费升级次世代特性

郭明錤：iPhone 17 全系搭载苹果自研 Wi-Fi芯片以“增强连接性”

海大集团等在长沙成立农牧科技公司

“5G+工业互联网”深度融合加速推动“中国智造”迈向高质量发展

iPhone 16国补后到手4699元：只比iPhone 16e贵200元你怎么选

京东上线iPhone 16e：首发支持国补 3999元起

全车四激光雷达尊界S800首发全向立体融合感知：水沟也能识别了

安宁股份重磅交易，攀枝花富豪收购中核钛白王氏家族资产

微信群如何精细化管理？分享几点微信群运营心得

8999元起！史上最薄折叠屏发布：OPPO剑走偏锋？

全站最新

王兴兴知乎十年：从科技迷到商界精英的“逆转人生”

以旧换新政策成效显著，商务部：报废汽车回收量增35%，新能源车热销

上海一批次土拍：外资进场抄底，金地龙湖重回牌桌

新加坡富豪上海扫货，鏖战184轮，黄祖耀家族联合金茂89亿入手虹口核心地块

山东港口发布《人工智能（大模型）总体建设规划》

重要信号！一二线城市房价开始涨了

恒力集团陈建华：民营经济迎来高质量发展“又一个春天”

时政微观察丨民营经济大显身手正当其时

热门推荐

王兴兴知乎十年：从科技迷到商界精英的“逆转人生”

山东港口发布《人工智能（大模型）总体建设规划》

观点直击 | 阿里巴巴的AI大考

YouTube 将推出低价无广告套餐 Premium Lite，瞄准特定用户群体

华擎推出其首款“Pro X3D”系列 AMD 主板，但没有任何特殊之处

亚马逊安卓应用商店宣布 8 月 20 日起关闭

扒一扒宇树王兴兴10年知乎生涯，原来他也走了一条“逆转人生”路

超越DeepSeek？Grok3唯一实锤合作商浮现，直供马斯克+高盛抢筹，蓄势待发

冠军之姿：雷蛇毒蝰 V3 专业版 Faker 限定款发布，1399 元

英伟达发布 Game Ready 572.47 WHQL驱动，支持 RTX 5070 Ti 显卡

普门科技发布2024年度业绩快报，盈利3.467亿元，低于分析师预期

普门科技：2024年净利3.47亿元同比增长5.52%

行业首批！腾讯云TI平台支持DeepSeek全系模型精调与推理

超越ChatGPT的AI智能体（英文）

普门科技Q4净利同比下滑近三成拟年内推出中速发光仪器