继发布千亿参数模型Yi-Large之后,时隔五个月,零一万物于10月16日正式对外发布最新旗舰模型Yi-Lightning。国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o。这意味着仅花费五个月零一万物已追上OpenAI的顶级模型。
就在近期,有媒体报道称,被称为“AI六小虎”的6家中国大模型初创企业月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰,其中有2家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。
发布会后,零一万物创始人李开复针对这一问题直接回应称,预训练既是技术活也是费钱的事儿,但据他了解,目前“AI六小虎”做预训练仍不成问题。“这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的6家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”
最新模型击败GPT-4o,行业往OpenAI o1方向狂奔
10月16日,继上半年千亿参数模型Yi-Large之后,零一万物正式对外发布最新旗舰模型Yi-Lightning。国际权威盲测榜单LMSYS显示,目前Yi-Lightning已超越GPT-4o-2024-05-13、Claude 3.5Sonnet,排名世界第六,中国第一。这也是在LMSYS这一全球大模型必争的公开擂台上,中国大模型首度实现“超越OpenAI GPT-4o ”。
翻译是模型落地的典型场景,考验的是模型的语言理解和生成、跨语言能力与上下文感知能力。在这一典型场景的测评中,Yi-Lightning更快速地将莎士比亚的李尔王中的经典语句准确翻译出来,将“unaccommodateed man”翻译成没有外物装饰的人,相较之下阿里云旗下的Qwen2.5-72b-Instruct翻译成了“未受文明熏陶的人”、字节Doubao-pro 翻译成了“毫不遮掩的人”,DeepSeek-V2.5翻译成了“没有装饰的人”。
同时,较上一代旗舰模型 Yi-Large ,Yi-Lightning 的最高生成速度提速近四成,在与 GPT-4o的对比中,Yi-Lightning 的生成速度堪称“极速”。
谈及如何快速赶上国际顶级模型GPT-4o的进度时,李开复表示,其实缩短时间差非常困难。“我不预测我们(未来)可以(继续)缩短这个时间差,毕竟人家是用十万张GPU训练出来,我们用的是两千张GPU训练出来,我们时间差能达到只是因为我们模型、AI infra等团队都努力去使用和理解对方做出来的东西,再加上我们自己每家的研发有特色,比如数据处理、训推优化等,现在这一套方法论在零一万物已经成熟了。”
另外,南都记者关注到,零一万物花费近5个月赶上了GPT-4o的进度,同时OpenAI也在9月发布了其被业界称为是AGI(通用人工智能)一大进程的OpenAI o1系列模型。李开复透露,OpenAI内部其实攒了很多好东西,除了OpenAI o1以外,OpenAI领先行业足够多,但会等待合适的节点再释放。而OpenAI o1把只在预训练中scaling的趋势扩展到了推理的时候,让行业认知到训练SFT和强化训练都非常重要,目前中美有不少公司都在往o1的方向狂奔。
加入“价格战”,百万token降至九毛九仍有利润
除了C端以外,此次发布会上李开复还公布了零一万物在B端产品上的最新进展。李开复称,零一万物最新旗舰模型 Yi-Lightning 的 API 价格已降至极低水平,每百万 token 仅收费 0.99 元。
发布会上,针对此次大模型价格降价李开复不断强调称,有人或许会质疑零一万物是否在亏钱拉客户,但自己可以自信地回应,零一万物大模型的真实成本比比0.99元低。“不用担心我们被用垮了,欢迎大家使用,还是有利润空间的。”
今年5月,字节、百度、阿里云、腾讯、讯飞等大模型厂商纷纷大降价格,掀起了一场价格战。当时大模型初创企业零一万物CEO李开复做大模型系统发布时曾表示,其认为大模型之间搞类似于ofo的流血打法是双输的策略。“我觉得大模型公司不会这么不理智,因为技术还是最重要的,当大模型厂商的团队认定自己的技术值得的时候,就会坚持一个合适的价格,而绝不会只靠贴钱、赔钱去做生意。”
发布会上谈及前段时间的“价格战”,李开复也表示,当时有很多性能很差的模型价格都降得非常低,甚至是免费,但让接入的企业和个人体验起来都不达预期,这样的“价格战”李开复并不认同。
李开复强调,在个人或者企业接入API时,足够好的模型性能很重要,否则产品无法达到PMF(产品与市场的匹配度);同时如果一个模型性能很高,价格却很白菜,用户每天调用十几次,累积下来的成本也不可忽视。而零一万物在这两个因素之间已经找到了一个合适的价格。“我们也知道要控制成本,不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。欢迎大家试用,一定物超所值。”
辟谣放弃预训练,李开复称“AI六小虎”都做得起预训练
10月3日,OpenAI官宣称自己已成功获得66亿美元(约合人民币466.9亿元)融资,估值突破了1500亿美元。不过,随后有媒体报道称,通过对OpenAI的财务数据分析推测,OpenAI将于2029年实现盈利,但在此之前OpenAI依然会存在较为严重的亏损,预测2026年亏损幅度将达到140亿美元(约合人民币990.5亿元)。
尽管技术领先足够多,但就连OpenAI都仍未实现较好财务状况,国内的大模型创业公司情况会更好吗?就在近期,有媒体报道称,被称为“AI六小虎”的6家中国大模型初创企业中(月之暗面、百川智能、智谱AI、Minimax、零一万物、阶跃星辰),已经有2家逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用,而零一万物就是其中一家。
对此,近期李开复曾在朋友圈辟谣称,“零一万物一直在做预训练,去年和今年发布的Yi-34B, Yi-Large, Yi-Coder, Yi-VL Yi-Vision都是发布时全球第一梯队国内领先的预训练模型。同时零一万物新的预训练模型也即将推出,也会是全球第一梯队,届时谣言将不攻自破,建议自媒体可以先删稿。”
发布会后李开复再次分享称,预训练既是技术活也是费钱的事儿。“做好预训练模型是一个技术活,需要非常多有才华的人一起工作,慢工出细活。需要懂芯片的人、懂推理的人,也需要懂基础架构的人、懂模型的人、很好的算法同学。如果一个公司能有幸拥有这么多优秀的人才跨领域合作,我相信中国是绝对可以做出世界排名前十的预训练的通用模型。不过,因为成本比较高,也不是每家公司都可以做这件事情,以后做预训练的大模型公司可能越来越少。”
不过,李开复强调,目前“AI六小虎”做预训练仍不成问题。“据我所知,这6家公司融资额度都是够的,我们做预训练production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”
发布B端数字人、全行业解决方案
此次发布会上,零一万物还推出了AI 2.0数字人解决方案、全行业解决方案、AI Infra等产品及服务,面向B/G端客户构建起了从定制模型到专有应用搭建的一整套解决方案。
南都记者了解获悉,零一万物的行业应用产品AI 2.0数字人聚焦零售和电商等场景,将新发布模型Yi Lightning实践于具体行业解决方案。基于以Yi Lightning模型为代表的Yi模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,形成了与AI 1.0时代完全不同的数字人解决方案。
其中,角色大模型为零一万物AI 2.0数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过多国语言和情感表达的门槛,另外电商话术大模型也能成为了数字人主播的“AI 大脑”,负责链接知识库,完成智能对话。Yi-Lightning模型接入后,零一万物AI 2.0数字人对弹幕意图的识别更加精准、生成话术更自然、能够一步到位完成促单。
目前,零一万物的AI 2.0数字人解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。其中某头部酒旅企业在接入Yi-Lightning全新加持的数字人直播后,GMV较此前上升170%。
另外,此次发布会上李开复还提到,在当前的市场需求下,仅仅为企业客户提供标准化模型还远远不够。李开复分享称,审视各垂直行业的核心业务流程就会发现,尽管基座模型具备一定的能力,但其在帮助核心业务提效方面仍显不足。这一现状制约了模型在客户核心业务场景中的深度融合,也限制了大模型的商业价值。因此基于企业不同的业务场景,零一万物也发布了全行业解决方案,除基座模型外还会搭配有RAG、Function Calling等一系列实用性经过检验的工具 。
采写:南都记者 林文琪