距离2022年11月OpenAI发布ChatGPT已经过去了22个月,这是一段真正称得上日新月异的技术旅程。在全球范围内,这股热潮的引领者仍然是OpenAI、微软、谷歌和meta;但是在中国,创业公司如智谱AI、DeepSeek,科技巨头如阿里巴巴也试图挤入各个大模型基准测试榜单和科技新闻头条。
如果将ChatGPT的发布视为此轮AI技术浪潮发展的起点,那么每年秋季的云栖大会,就可以看作是阿里巴巴对过去一年里其AI能力进步的集中展示,也是这家公司每年一次在AI发展路径上持何观点的清晰表达。
与去年相比,近日在杭州举办的2024云栖大会少了一些高屋建瓴:阿里巴巴集团主席蔡崇信没有像去年一样出席这次大会,中国工程院院士、阿里云创始人王坚今年也仅出席而不演讲。但很明显地,今年的云栖大会更加具体、更加接地气、更加贴近产业了。
与之对应,AI大模型找场景、卷应用、要收入,这些也是最近一年来,中国AI行业正在发生的显著变化。如果人工智能和其他科技领域的从业者想要紧跟这些令人难以捉摸的转变,或许可以从云栖大会这样的技术交流盛会中看到一些苗头。
从“为什么”到“怎么做”
2023年的云栖大会,是新一届阿里巴巴领导层“蔡吴配”的第一次公开亮相。那时,阿里巴巴还未公开表示放弃阿里云的拆分上市计划,但在阿里云每年最重要的年度盛会上,早已不提一个字。作为替代的,阿里巴巴集团主席蔡崇信开幕致辞就放出口号称“阿里巴巴要打造AI时代最开放的云”,表示阿里巴巴将加大研发投入,推动阿里云进行全面的技术升级和创新,并且尤其强调带领整个行业加大对AI的投入。
而要想达成这一点,阿里云与阿里巴巴集团事实上就不可能拆分,阿里云依然需要阿里巴巴强大的电商业务去支持投入。在那不久之后,阿里巴巴发布第二财季财报时正式宣布终止分拆阿里云。
在那届云栖大会中,对云计算行业更重要的定调言论来自于阿里云创始人王坚,他以“云计算的第三次浪潮”为主题在首日主论坛的压轴环节发表了演讲。王坚遍数云计算行业几十年的发展历史,可以归纳总结为三次浪潮,最后提出我们当下正处于云计算的第三次浪潮中,这来源于人工智能和云计算的结合,因此需要投身其中。
在蔡崇信和王坚之间,演讲嘉宾的组成则有政府官员、高校教授、阿里云自己以及大大小小的合作伙伴,一起来论证为什么要投入做AI的问题。其各种主题虽说囊括了各行各业、公共机构和商业机构、国内和国外,但不免也导致了话题的分散。
到了今年的云栖大会,首日主论坛的议程设置焕然一新,除去杭州市政府循惯例的支持之外,论坛主体被结构清晰地划分成了三部分——三个圆桌分别聚焦三个议题:大模型、自动驾驶以及人形机器人。
这三个圆桌中的所有嘉宾,没有一个是阿里巴巴或阿里云的代表,但都是各自行业中现阶段的领军企业和代表人物。比如大模型圆桌,阶跃星辰的姜大昕与月之暗面Kimi的杨植麟、生数科技的朱军一起称赞了OpenAI刚刚发布的o1大模型,一致表示这是一个令人惊艳的质变;在自动驾驶圆桌,小鹏汽车何小鹏与自己的前下属,现在NVIDIA负责自动驾驶的吴新宙,共同讨论了竞争对手特斯拉即将入华的FSD;而人形机器人圆桌,四位来自不同机器人公司的创业者、科学家们则从人形机器人的形态出发,辩论了各种场景下人形机器人的应用前景与困境。
比起前一年只有分别演讲来输出观点和案例的云栖大会,今年的主论坛充斥着你来我往、互相提问的交锋,更能显示出论坛的交流功能。其中有共识也有非共识,大模型领域的创业者就仍然保持了对OpenAI的敬意与钦佩,因为其刚刚发布的o1大模型指明了一个新的方向;何小鹏则对一些L4自动驾驶公司并不完全认同,因为小鹏汽车更具备硬件视角,认为规模和可扩展性非常重要;而人形机器人行业由于起步相对较晚,投入资源相对较少,人形机器人企业各自的业务侧重点和观点也就更加千差万别。
而阿里方面,蔡崇信没有现身,王坚没有演讲,今年云栖大会最主要的定调致辞来自阿里巴巴集团CEO、阿里云智能集团董事长兼CEO的吴泳铭。吴泳铭演讲的核心观点包括:现阶段依然处于AGI变革的早期;下一阶段先进模型的投入门槛是几十亿、几百亿美金级别;AI最大的想象力不是在手机屏幕做新的超级APP,而是改变物理世界;机器人将是下一个迎来巨变的行业;未来几乎所有的软硬件都会具备推理能力,它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式;阿里云投资新建了大量的AI算力,但还是远远不能满足客户的旺盛需求。
吴泳铭的这些表态,如果进一步理解:第一,仍处于变革早期意味着还有巨大上升空间,而且早期时的行业差距并不算什么;第二,继续做模型的门槛很高,创业公司和风险投资恐怕竞争不过大厂和产业资本;第三,AI的机会不是移动互联网那样的超级App,而是怎么去影响到现实,与现实发生更多互动,比如机器人,而阿里下一阶段的投资重点肯定也会向机器人行业倾斜;第四,o1的出现会带动推理需求的进一步井喷,所有设备都将逐步具备不同程度的AI能力。
总结起来,无论是大模型、自动驾驶、人形机器人产业的从业者,还是代表阿里巴巴的吴泳铭,今年讨论的都不是“为什么要做”的问题,而是“做什么”“怎么做”的问题。
开源,是现实与使命的共同要求
云栖大会把最受关注的首日上午主论坛,大量篇幅让给了行业,提供了一个百花齐放的平台,反而阿里云自己的动向只能挪到下午。阿里云CTO周靖人依然作为业务方面的代表,没有对行业发展做宏观评论,而是专注于阿里云的业务更新和产品发布。
阿里云的通义大模型在今年6月曾得到了一次不一般的认可,Hugging Face首席执行官Clem Delangue曾在社交媒体X上总结彼时的大模型评估:Qwen 72B 称王,中国开源模型总体上占主导地位。这也是通义Qwen系列模型首次登上Hugging Face开源模型排行榜榜首的标志性事件。
这两年各种大模型测试榜单早已令人眼花缭乱、审美疲劳,国内各个大模型公司基本上都曾宣传过自己旗下产品在某些榜单和对比上斩获佳绩,但Hugging Face的排行榜仍相当具有说服力的一项。更重要的是,通义Qwen系列模型的阶段性成功证明,中国AI行业有能力与OpenAI、谷歌、meta等最领先的AI公司竞争。
在这次云栖大会上,通义选择继续在开源模型的道路上前进。周靖人发布了Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。根据周靖人的介绍,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于meta旗下开源模型Llama系列的世界级模型群。
由于OpenAI为代表的闭源模型公司对中国开发者“断供”,而美国监管者也一直在试图限制Llama等开源模型的“出口”,因此阿里云通义Qwen系列等国产模型就成为中国开发者更现实的选择,这在客观上为通义大模型在初期拓展了市场。但最终,“国产平替”不应该是通义大模型的定位,它需要证明自己与全球最先进的闭源和开源模型一样强大甚至更好。
独立研究和分析公司SemiAnalysis的研究员Patel对媒体说,虽然Qwen不如GPT-4那么好,但也足够接近,让人惊讶。并且,Qwen在形式数学和多语言操作等领域往往能胜过竞争对手。
至少在目前,通义并不是独立的大模型公司,它仍然是依托于阿里云的大模型,阿里云希望的是通义能为阿里云的云服务销售做贡献。开发者是否愿意接受通义大模型,还要考虑云计算产品的适配性。如果一个企业不是阿里云的客户,但通义是更好的大模型产品,就仍然会有所犹豫。
对此,通义大模型坚持了开源。今年云栖大会对“模型生态”的强调也是阿里云和通义自己这一年多来的首次,而这是只有开源模型能够竞争的维度。在官方的解释中,这是因为作为最早提出模型即服务(MaaS)理念的企业,阿里云一直把大模型生态的繁荣作为首要目标。官方披露的数据显示,目前已有30多万企业客户接入通义大模型。
在发布会后的采访中,周靖人也将“模型生态”的繁荣与2023年云栖大会时蔡崇信提出的“阿里巴巴要打造AI时代最开放的云”进行联系,将通义在开源模型道路上的持续发展视为对此前承诺的履行。阿里巴巴成立时就提出的使命是“让天下没有难做的生意”,即使是中国供需关系发生巨变的当下也未改变。而通义对开源模型的战略押注,也可以视为是这一集团整体使命的延续和衍生。