在开源上的共识。
作者|连冉
编辑|郑玄
最近国内最受关注的两家 AI 公司,悄然走到了一起。
3 月 11 日晚间,Manus 官方宣布与阿里通义千问团队正式达成战略合作。Manus 在公告中称,双方将给予通义千问系列开源模型,在国产模型和算力平台上实现 Manus 的全部功能。
据了解,双方接触时间并不太长,但却在接触后快速达成合作意向。事实上,就在上周五,刚推荐了 Manus 团队前去与阿里巴巴集团相关人士建联交流——基于对阿里云将能够为 Manus 这一创业团队提供重要支持的判断。事实上,阿里对于创新项目一直非常重视,「他们也清楚自己的能力能够帮助到创业者」。
阿里此次可以说行动非常之迅速,从后续 Manus 团队朋友圈的分享来看,甚至阿里巴巴集团 CEO 吴泳铭都很可能都参与了进来,现在,双方已经开始有了明确的下一步计划。而这件事也体现了阿里过去一直秉持的开放心态,以及在开源领域中所展现出的重要力量。
01
恰逢其时的合作
在 Manus 上线后,除了对其独立解决复杂任务的惊叹,关于其使用的基础模型引发了广泛的猜测。
此前,Manus 联合创始人季逸超就在社交平台透露过,Manus 产品使用了 Claude 和不同的基于 Qwen 的微调模型。
图片X
而通义千问推理模型 QwQ-32B 确实也是这段时间最受关注的 AI 大模型之一。
在 Manus 发布的同一天,通义千问推理模型 QwQ-32B 发布并开源。阿里技术的官方报告称,通过大规模强化学习,千问 QwQ-32B 在数学、代码及通用能力上实现质的飞跃,整体性能比肩 DeepSeek-R1:
在一系列权威基准测试中,千问 QwQ-32B 模型表现出色,几乎完全超越了 OpenAI-o1-mini,比肩最强开源推理模型 DeepSeek-R1:在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,千问 QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型;在由 meta 首席科学家杨立昆领衔的「最难 LLMs 评测榜」LiveBench、谷歌等提出的指令遵循能力 IFeval 评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的 BFCL 测试中,千问 QwQ-32B 的得分均超越了 DeepSeek-R1。
此前有消息称 Manus 每次调用的成本达 2 美元,拆解、解决一次复杂任务或消耗百万 token,随着用户的增加,任务排队延迟的问题也已经开始出现——在仅采用邀请码制,只有少数人可以使用到的情况下。
Manus 的多智能体架构和全链路自主执行能力,意味着它需要处理更复杂的任务和更多的数据,这自然会增加算力的消耗。而且,每个任务在独立的云端虚拟机中运行,虽然保证了任务的独立性和安全性,但也意味着每个虚拟机都需要分配一定的算力资源,也加剧了整体的算力消耗。
在这样的背景下,Manus 与通义千问团队的合作尤为重要。通义千问的 QwQ-32B 模型凭借其出色的推理和执行能力,可以为 Manus 提供强大的技术支持;同时,QwQ-32B 的高效性也有助于降低 Manus 在算力消耗方面的压力,提升响应速度和处理效率,以应对增长的用户需求。
图片微博
这份声明里可以看出 Manus 与通义千问团队的合作主要聚焦于几个关键点: 基于通义千问系列开源模型、在国产模型和算力平台上实现 Manus 功能、为中文用户提供服务。
「基于通义千问系列开源模型、在国产模型和算力平台上实现 Manus 功能」表明这次合作的核心是技术层面的深度融合。
尤其「国产算力平台」可能指的是阿里云的云计算基础设施。Manus 原有的独立云端虚拟机架构虽然保证了任务隔离和安全性,但算力消耗巨大。
阿里云可以提供分布式计算资源和更高的算力效率,帮助 Manus 在维持功能完整性的同时降低成本。此外,使用国产算力还能满足中国市场的合规性要求(比如数据本地化)。
考虑到 Manus 每次调用可能消耗百万 token,如何在国产模型和算力上实现同等性能,同时控制成本,将是双方团队面临的挑战之一。
尽管更多细节尚未完全公开,但 Manus 与阿里的合作已经让人惊喜,这次合作不仅展现了 AI 行业在竞争之外的合作潜力,也为推动行业的发展提供了新的思路和动力。
02
合作前文后,Manus 开源?
上周三,Manus 发布后迅速在国内科技媒体和社交网络上刷屏,成为全网热议焦点,研发团队展示了 Manus 在简历筛选、房产研究、股票分析等任务中的应用案例,显示了在复杂任务处理中的潜力,非常接近理想中的 AI Agent。
到了周末,Manus 的影响力开始扩展到海外,一些海外媒体和科技博主开始测评和讨论。Hugging Face 的产品负责人称其为令人印象深刻的 AI 工具,Twitter 上的科技大佬杰克·多西也对其表示赞赏。
Manus 背后的团队是 Monica.im,创始人肖弘是一名连续创业者。肖弘在一次访谈中提到「新时代的安迪比尔定律」,模型能力外溢,应用公司可以抓住机会。
在模型公司和应用公司的分工上,肖弘认为垂直领域、特定领域和脏活累活可能是原厂不愿做的,应用公司有机会抓住这个窗口期,提供更专业的解决方案;关于即将推出的 Manus,定位是一个消费级产品、大众产品,定价策略倾向于消费级市场,一个对比是,主打编程市场的 AI agent 产品 Devin 每个月定价 500 美元、ChatGPT Operator 定价 200 美元一个月。
从这个角度来看,Manus 与阿里通义千问的合作本质上或许正是在填补「脏活累活」这一市场。阿里通义千问的模型可以为 Manus 提供强大的技术支撑,使得 Manus 能够将这种复杂技术转化为对普通消费者友好的产品,同时满足行业需求的多样性与特定领域的精准解决方案。
与通义千问团队的合作,或许能帮 Manus 更好地实现这个定位。
另外,阿里一直在提升其人工智能能力,并通过开源推动行业进步,从 2023 年至今,通义团队已开源 200 多款模型,包含大语言模型千问 Qwen 及视觉生成模型万相 Wan 等两大基模系列,囊括 0.5B、1.5B、3B、7B、14B、32B、72B、110B 等全尺寸,大语言、多模态、数学和代码等全模态,多次登上国内外权威榜单,已成为全球开源社区最重要的模型系列。
3 月 6 日,在 Manus 发布的同一天,通义千问推理模型 QwQ-32B 发布并开源。而 3 月 10 日,在 Manus 被意外「开盒」后,Manus 联合创始人 @peakji(季逸超)回应称开源是团队的传统,「近期会有不少好东西开源」。