我一直不觉着游戏能有生产力,直到我看见马力欧在“测试”AI 工具;我一直不觉着智能体可以取代人类,直到我看见 Manus 在自己写网站;我一直不觉着 AI 价格会太高,直到我看见看到 OpenAI 的博士专家 AI 每月 2 万美金……
当马力欧来敲 AI 的大门,开门的会是 Manus 吗?
本周AI大事件
Manus:通用AI Agent落地应用OpenAI:博士代理售价 20000 美元阿里 QwQ-32B:小参数逆袭大模型iOS 18.4 测试版:苹果加速 AI 场景渗透GPT-4.5:逐步向Plus会员开放DeepSeek曝光:理论成本利润率高达 545%Manus 参见!真·智能体来了
周四凌晨,Monica.im 研发的全球首款通用智能体 Manus 突然发布,通过多代理协同架构(规划代理、执行代理、验证代理)将 AI 从嘴炮王者升级为执行狂魔,实现了端到端任务执行。分析股市、分析财报、制定旅游计划、制作课程,真有种钢铁侠引导贾维斯那味。
只可惜仍在测试中,系统并不稳定。有邀请码的连连崩溃,没邀请码的一码难求,但它让我们看到了 AI 智能体该有的样子:不仅思考,还带来结果。getting everything done while you rest。
当然,Manus 并不是当晚的唯一“炸裂”,阿里也在凌晨三点开源了他们全新的推理模型——QwQ-32B。这可能是 AI 界的题海战术的胜利,它抛弃传统奖励模型,直接用答案正确性和代码执行结果反向优化,QwQ-32B 以 320 亿参数(密集架构)硬刚 DeepSeek-R1-671B,数学推理(AIME24)、代码生成(LiveCodeBench)性能媲美甚至部分超越,
单卡 GPU 部署成本仅为 DeepSeek的 1/10,苹果 M4 Max 就能流畅运行。
开源真好啊,开源真香。
苹果来了!为 AI 加点 AIr
如今苹果连春季发布会都成了 Newsroom 的几篇稿件。
iPad Air(M3)最大的惊喜是命名习惯的统一,MacBook Air(M4)最大的惊喜是价格实惠,虽然有“拼好芯”的 M3Ultra 惊艳全场,从去年 WWDC 至今,苹果的每一款新品都好像那场开发者大会的 Call Back:快换代吧,我们为 AI 准备好了!
相比前代,iPad Air(M3)更换了性能更强的 M3 芯片,其他包括默认壁纸都没有改变,MacBook Air(M4)除了芯片,还新增了天蓝配色、降低了售价,看起来比 iPad Air 系列更具性价比一些。
但同时更新的 iPad(A16)并没有跟上 8G 内存,无法使用 Apple 智能,让人感到迷惑。在全员提 AI 的今天,留下了一个没什么人在意的扣子。
另外,在 iOS 18.4 测试版中,苹果也上线了 AI 评论摘要功能,通过 LLM 自动生成 App Store 用户评论摘要,帮助用户快速判断应用质量,生成不同风格的优缺点总结。
AI 有趣:AI 博士月薪 2 万美元
想在上周第一时间体验 GPT-4.5 的我,找遍全公司没一个订阅 Pro 会员的 ChatGPT 用户,纷纷吐槽 200 美元的价格实在不是个人可以承受的。
这周的好消息是 GPT-4.5 终于推给了 Plus 会员,坏消息是 OpenAI 计划推出定价 2 万美元/月的 PhD 级服务。另外,OpenAI 还计划按照员工席位来收取固定费用,并可以根据客户从产品中获取的价值来向客户收费。
消息传出,很快就有公司表示,宁愿用这个价格聘请一个真正的博士。但作为行业的领导者,OpenAI 的定价策略对其他模型厂商非常有参考价值。但我希望别参考。
另一边,真「Open AI」DeepSeek 表示,其理论成本利润率可达545%。
而这一周最有趣的新闻,可能还是加州大学圣地亚哥分校的研究员们用超级马力欧测 AI。
研究员设计了一个与 GamingAgent 框架集成的《超级马力欧兄弟》用来测试 AI 工具,GamingAgent 内为人工智能提供了一些基本指令,比如“如果附近有敌人或障碍物请向左或跳跃躲避”,同时也提供了一些游戏截图作为参考,再由人工智能以 Python 代码的形式生成输入来控制马力欧。
最终的结果是,Claude 3.7 表现最佳,其次是 Claude 3.5、Gemini 1.5 Pro、GPT-4o。
在《当幸福来敲门》中,克里斯凭借毅力学习、成交,再学习、再成交。某种程度上来说,这恰似如今 AI 技术狂飙时代下普通人的生存图景:当 AI 袭来,我们要做的正是在其中学习、应用,再学习、再应用。
但电影的动人之处,不在克里斯最终的逆袭,而在他和孩子一起为了逃到容身之所厕所的“时光机游戏”。
如今的我们正在“时光机游戏”中。