当前位置：首页 » 资讯 » 新科技 » 正文

阿里最新深度思考模型强不强？我们让它和Grok3比拼了下

IP属地北京 编辑：冯璃月机器之能 时间：2025-02-27 05:00:25

AI好好用报道
编辑：杨文

又来了一个深度思考模型。
昨天，阿里 Qwen 团队发了个博客，标题就是：
乍一看，还以为电脑卡出了乱码，但再往下一瞅，里头大有「乾坤」，因为这篇博客：
不是人写的。
而是出自阿里最新深度思考模型 QwQ-Max-Preview 之手。
没想到，浓眉大眼的阿里也开始搞抽象了。
QwQ-Max-Preview，是阿里 Qwen 家族的最新成果。
它基于 Qwen2.5-Max 构建，是即将发布的 QwQ-Max 的预览版。
该博客还表示，在不久之后，阿里将开源发布 QwQ-Max 以及 Qwen2.5-Max，并推出 Qwen Chat APP。
嗯，啥意思？难道是在现有的通义千问 App 之外，再独立搞一个新 App？
至于 QwQ-Max-Preview 的功能，博客里是这么描述的：
它在数学、编程以及通用任务中展现了更强的能力，同时在与 Agent 相关的工作流中也有不错的表现。
自己说好不算好，大家说好才是真的好。
目前，QwQ-Max-Preview 可以免费体验。
链接直达：https://chat.qwen.ai/
接下来，我们就把它和「地表最强」Grok3 对比下，看看它的实力究竟如何。
-1-
深度思考
与 Grok3 类似，阿里 QwQ-Max-Preview 的页面也具有「深度搜索」和「联网搜索」两大功能。
先来个暗藏玄机的逻辑陷阱题。
1. 父亲和女儿的年龄加起来是 100 岁，父亲 50 岁，女儿多大？
看到这道题目，大部分人的第一反应就是女儿 50 岁。但在现实生活中，父亲和女儿不可能同岁。
所以只要抓住这一矛盾点，再进行延伸即可，比如父亲有一对双胞胎女儿……
阿里的 QwQ-Max-Preview 觉察出其中的逻辑漏洞，措辞相当严谨：
仅从数学角度出发，答案是 50 岁，但后面还加了个备注，不符合实际逻辑。
我们再来看看 Grok3 的回答。
Grok3 列了个方程得出 50 岁，同时也点出这在现实中并不常见。
我们在此基础上接着问：在不改变父亲年龄和总年龄的情况下，如何思考才能让这道题目符合实际逻辑？
QwQ-Max-Preview 跳出生物学亲子关系的常规假设，重新定义了「父女」关系，比如收养关系。
我们沿着它的思维链，还发现了更多假设。
科幻片中的经典桥段，存在时间旅行，或者是类似于电影《本杰明・巴顿奇事》中的逆生长等。
语言上的歧义，父亲可能是神父，女儿可能是教女。
思路一打开，这么理解好像也没啥毛病。
而 Grok3 的脑回路更清奇一些。一会假设「父亲」是祖父，「女儿」是孙女（差辈了

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

iPhone 16e 首搭自研 C1 基带，苹果称未来更多设备将跟进

Spotify CEO称苹果DMA合规是场“闹剧”，敦促欧盟对其采取行动

传奇CPU设计师Jim Keller加入AheadComputing，专注RISC - V开发

消息称Valve今年将推出一款独立VR头显，售价高达1200美元

Valve 的《半衰期 3》要来了？消息称游戏开发已接近尾声

磷酸铁锂涨价！高压密产品成必争之地

苹果账号“内容转赠”功能遇挫：繁琐条件与不明确提示成用户痛点

刚刚！英伟达，重磅发布！

1.5亿人，把共享按摩椅“躺”上市

消息称梅赛德斯-奔驰中国大裁员：赔偿 N+9，销售体系成重灾区

京东给骑手交社保，引发的配送江湖暗战

苹果 Vision Pro 首部长篇沉浸式纪录片公布，5 月 30 日上线

县城经济逆涨，餐饮品牌围猎“小镇消费家”？

英伟达公布第四财季财报营收393亿美元净利润近221亿

谷歌搜索升级隐私保护工具：主动监控示警，让用户掌控网络足迹

机构预测苹果或在明年推出iPhone 17e 发力低价市场

中产最爱的折叠车，靠“大腿”们撑起IPO

君乐宝IPO能否化解高负债之痛？

谁在买港股？

宇树四足机器人唯一合作商，接入deepseek+华为鸿蒙独家认证，下一个长盛轴承！

港股暴涨！原因是什么？

Valve新款VR头显有望年底前发布售价高达近9000元

手机太重不想要？这几款轻薄机型手感不要太爽

ColorWare 为 AirPods Pro 2 和 AirPods 4 披上复古外衣

三星Galaxy Z Flip7折叠机抢先看：3.6/6.8英寸屏幕、5000万主摄

亚马逊全能 AI 助手 Alexa+ 登场，打造终极智能家居体验

享 15% 折扣：苹果美国首次上架认证翻新 M4 iMac

全站最新

iPhone 16e 首搭自研 C1 基带，苹果称未来更多设备将跟进

Spotify CEO称苹果DMA合规是场“闹剧”，敦促欧盟对其采取行动

传奇CPU设计师Jim Keller加入AheadComputing，专注RISC - V开发

消息称Valve今年将推出一款独立VR头显，售价高达1200美元

Valve 的《半衰期 3》要来了？消息称游戏开发已接近尾声

磷酸铁锂涨价！高压密产品成必争之地

苹果账号“内容转赠”功能遇挫：繁琐条件与不明确提示成用户痛点

刚刚！英伟达，重磅发布！

热门推荐

iPhone 16e 首搭自研 C1 基带，苹果称未来更多设备将跟进

Spotify CEO称苹果DMA合规是场“闹剧”，敦促欧盟对其采取行动

传奇CPU设计师Jim Keller加入AheadComputing，专注RISC - V开发

消息称Valve今年将推出一款独立VR头显，售价高达1200美元

Valve 的《半衰期 3》要来了？消息称游戏开发已接近尾声

磷酸铁锂涨价！高压密产品成必争之地

苹果账号“内容转赠”功能遇挫：繁琐条件与不明确提示成用户痛点

刚刚！英伟达，重磅发布！

1.5亿人，把共享按摩椅“躺”上市

消息称梅赛德斯-奔驰中国大裁员：赔偿 N+9，销售体系成重灾区

京东给骑手交社保，引发的配送江湖暗战

苹果 Vision Pro 首部长篇沉浸式纪录片公布，5 月 30 日上线

县城经济逆涨，餐饮品牌围猎“小镇消费家”？

英伟达公布第四财季财报营收393亿美元净利润近221亿

谷歌搜索升级隐私保护工具：主动监控示警，让用户掌控网络足迹