网 乐天 3月17日
作为性能媲美OpenAI模型的国产开源模型,DeepSeek凭借其在MoE(混合专家)模型架构上的突破创新和推理能力成为“中国智造”的新旗帜。
然而,将DeepSeek落地产业过程中,现有的“DeepSeekInside”企业解决方案普遍存在着部署难、应用难、定制难等三大核心痛点。当前市场上尚未形成能够系统性解决上述痛点的完整方案。
零一万物今日宣布在打造Yi系列基座模型的过程中,积累了从模型训练到模型微调,再到应用实践的大模型端到端(end-to-end)四大管线技术栈功底。
自2024年底宣布针对2B智能化转型市场的战略聚焦一系列动作后,零一万物进一步采取基座模型的开放策略,针对DeepSeek模型私有化专业部署的市场痛点,将全链条技术管线复用到B端的模型私有化部署场景,推出了万智企业大模型一站式平台。
基于这一平台,零一万物首发面向企业客户提供企业级DeepSeek部署定制解决方案,涵盖了DeepSeek模型部署、应用实践以及模型微调工具。在确保数据安全的前提下,上述方案能够将DeepSeek无缝嵌入到企业业务体系,快速支持行业模型定制和应用创建,让原本的开源AI模型真正成为完整、合规且安全的一站式解决方案。
零一万物CEO李开复博士表示,AI需要市场,市场也需要AI,行业亟需实现“性能x性价比”的AI。后DeepSeek时代产业大模型正在加速落地,越来越多产业将会拥抱大模型,零一万物以开放的态度选择‘模型自由’,除了自研Yi模型,更开放企业客户选用市场上性价比佳的优异模型。
“未来的大模型的行业竞争将不再单指模型性能的比拼,更关乎从中台到应用的能力,即模型能否快速响应场景需求、基于中台构建行业应用。2025是AI-First应用爆发年,也是大模型商业化的大考年。零一万物将继续开放自身底层能力,打通基座模型到垂直场景的‘最后一公里’,推动大模型从炫技走向新质生产力,以大模型赋能千行百业。”
构建四大管线,打造AI2.0时代大模型开发中台
2025年有两大趋势:一是中国超大参数LLM基座模型将收敛到以DeepSeek、阿里巴巴通义千问(Qwen)等最头部的两三家企业;二是轻量化模型以极高性价比催化AI-First应用迎来井喷期,真正解决市场痛点、穿透企业核心业务流程的应用,将创造真金白银的价值。
在这两大趋势下,经过开年“DeepSeek冲击波”,中国ToB市场需求正经历前所未有的高涨,产业链条上的失衡问题也日益显现——从通用大模型到企业业务场景的落地过程中,部署、微调、应用搭建等能力的缺失成为关键瓶颈。基模能力与市场教育到位的当下,中国大模型产业已进入“产业深水区”,亟需成熟的企业级解决方案,来推动大模型从通用能力向垂直行业深度融合。
零一万物称这与其“聚焦产业大模型商业落地”的战略转型不谋而合。
2024年5月,零一万物内部对ScalingLaw的边际收益递减进行推演,最终决定放弃训练原定万亿参数的超大模型Yi-X-Large,而转为训练更轻量化、更具商业落地前景的MoE(混合专家)模型Yi-Lightning。
2024年10月,零一万物推出MoE(混合专家)模型模型Yi-Lightning,发布后即在LMSYSChatbotArena上取得世界第六的排名。
2025年1月:零一万物与阿里云成立产业大模型联合实验室,补强自身超大参数模型的布局的同时,正式宣布聚焦参数适中、性能领先、推理速度快、推理成本低的轻量化模型,以产业大模型发力商业落地。
2025年2月:零一万物与苏州高新区联合成立的产业大模型基地正式授牌,聚焦制造、金融等领域的产业大模型。
在创立至今近两年的发展过程中,零一万物称,构建了扎实的大模型端到端技术管线体系,形成了四大核心技术栈。这一技术积累为公司2024年的战略转型和B端市场布局奠定了坚实基础,使零一万物能够更自信地应对企业级AI解决方案的复杂挑战。也正是基于下列四大管线技术栈,零一万物把握企业需求,推出万智企业大模型一站式平台,填补大模型产业落地的关键空白。
轻量化模型研发管线积淀深厚
零一万物是中国最早探索MoE等轻量化模型架构的大模型企业之一,2024年5月,零一万物投入MoE等轻量化模型路线,10月份推出MoE模型Yi-Lightning,发布后即在LMSYSChatbotArena上取得世界第六的排名。目前,已沉淀MoE模型、小语种模型、多模态游戏模型等成熟的轻量化模型方法论。
凝练顶尖强化学习技术管线
零一万物已经复现通过“强化学习+基于规则的奖励模型提升模型推理能力”的技术范式路径。利用零一万物自研的强化学习技术管线,即便在制造业、生物医疗等非结构化、非标化数据占比大的领域,只要能相对清晰地定义奖励函数,就有可能省去大量数据标注的工作,优化模型面对垂直复杂场景的表现,定制更懂行的产业大模型。
高质量数据训练管线安全且成熟
零一万物在赋能头部B端企业客户的过程中积累了丰富的SFT方法论、模型蒸馏经验。在数据安全方面,零一万物已建立多重防护体系和数据治理措施来确保模型的安全合规与隐私保护,打磨出了安全成熟的高质量行业数据构建管线。在金融、零售等行业数据丰富的领域,零一万物能够快速构建企业专属、安全稳定、高效的产业大模型。
工具链与应用管线经实践成功验证
工具链与应用组件方面,零一万物的联网搜索、RAG(检索增强生成)、多模态文档解析、高精准度的OCR(光学字符识别)解析、AIPPT生成等都经过了企业级市场的实践检验。
李开复博士表示:“万智所做的与坊间的系统集成商或一体机分销商能做的浅层服务有着本质区别。零一万物有着完整的前沿大模型研发经验,所以有能力闭环交付全链条的大模型解决方案。万智选择贴近企业实际需求出发,通过安全便捷的一体机本地部署和可视化控制台解决方案,帮助企业‘零门槛、保安心’开启AI大模型”。
万智:让“满血增强版”DeepSeek极速穿透企业核心业务流
基于目前行业内所面临的部署难、应用难、定制难等三大难题,零一万物万智企业大模型一站式平台为企业规划了DeepSeek落地“三步走”步骤,并提供了针对性的解决方案:
安全部署:开箱即用的企业AI底座
当前的企业客户中,算力基础设施、模型部署等方面的软硬件积累参差不齐。在基座模型部署方面,零一万物整合了DeepSeek、Qwen、Yi等国内Top3模型,推出了“安全部署”方案。
对于算力储备薄弱的企业,零一万物将联合头部硬件厂商推出软硬集成式一体机方案,预装高性能GPU,内置DeepSeek全系列模型,部署周期缩短至小时级,助力企业快速上手671B参数的满血增强版的DeepSeek-R1模型;
对于已具备算力硬件基础设施的企业,零一万物同样可实现DeepSeek全系列模型的快速部署。
“安全部署”方案支持本地化推理与私有化数据隔离,有效防范数据外泄风险,保障企业核心业务信息安全;此外,本地化推理也能避免因公共云端波动而影响业务连续性,为企业提供更稳定、可控的AI运行环境,满足金融、政务等对数据合规性、服务稳定性要求极高的特殊需求。
应用实践:一键生成企业专家Agent
完成模型部署后,如何安全、稳定地将先进模型能力转化为企业生产力,已成为企业必须面对的核心命题。而具备工具调用能力、自主执行任务的专家级Agent,正是推动模型能力落地的关键。相较于近期如火如荼的C端通用Agent,企业级Agent更专业、更稳定、更安全,更能满足企业垂直场景的需求。
2024年,零一万物开始发力国内大模型ToB应用,在零售、能源、金融、游戏等垂直领域内积累了丰富的行业Agent开发经验。大模型ToB解决方案也获得了中国移动、阿里云、华为、百胜中国、顺丰科技、孩子王、美图、飞书等头部客户的认可。
DeepSeek+联网搜索:实时数据,赋能决策和业务流。
以零一万物自研ToC出海AI搜索产品为例,搜索准确性得分88%,校正大模型幻觉的能力优于以搜索性能强著称的Gemini(73%)、Perplexity(73%)、ChatGPTSearch(64%)。
DeepSeek+知识库RAG:构建企业专属知识大脑。
零一万物构建了高度可扩展的RAG架构,支持无缝接入企业的结构化和非结构化数据,将部署和实施速度提升至原来的两倍。通过引入先进的Rewrite和Rerank模型,大幅降低了DeepSeek等大模型的幻觉效应,使召回率提升60%,准确率提升30%。
DeepSeek+智能体Agent:智能体驱动业务自动化。
一方面,企业客户能够基于自身业务场景,通过简单的点击、拖拽等操作就能够一键生成企业级Agent;另一方面,针对各自工作流中的核心环节,零一万物也会与企业客户深度共建,深度定制真正穿透企业核心业务流程的企业专属Agent。
DeepSeek+DeepResearch:生产深度专业级报告
万智企业大模型一站式平台提供DeepResearch功能,经过多步推理,生产深度专业级报告。
在零一万物过往全球化应用实践中得到验证的其他成熟功能,如多模态文档阅读、高精准度的OCR(光学字符识别)解析、AI写作、AIPPT生成、AI数字人等也都被封装入万智企业大模型服务平台,成为企业客户即插即用的标准化组件。
行业定制:专业微调让DeepSeek进化更懂行
作为世界第一梯队的通用基座大模型,DeepSeek-R1在数学、代码、自然语言推理等场景下均有优秀表现。但由于DeepSeek-R1本身并不支持FunctionCall(工具调用),JSONOutput(JSON格式的字符串输出)。这两大企业刚需能力的缺失,使其在落地专业工作场景内进一步受限。
对于期待通过接入DeepSeek-R1实现提效的企业而言,基于DeepSeek-R1进行SFT(监督微调)成为刚需。零一万物给出基于DeepSeek-R1的成熟微调方案,企业能够在万智企业大模型一站式平台上,基于自身企业数据库对DeepSeek-R1进行模型微调,使之符合垂直领域的业务需求。
“应用➕模型”进入产业深水区,拷问模型研发落地能力
DeepSeek的走红为整个中国大模型领域完成了实质意义上的ToB市场教育。随着模型性能的提升与推理成本的下降,大模型应用也在越来越多的ToB场景内实现了降本增效。在龙头企业的加持下,可以预见2025年大模型ToB领域将会迎来新的增长。
迎合AI-First应用爆发的行业趋势,零一万物选择主动调整,从“模型+应用”走向“应用+模型”,以应用场景需求反推产业大模型的能力,打通从基座模型到垂直场景的“最后一公里”,力求解决大模型“高分低能”、“无法落地产业、解决实际问题”的核心痛点。
零一万物称,万智企业大模型一站式平台是其“以大模型赋能千行百业”的重要起点。不同规模和发展阶段的企业需要个性化的落地支持,万智目前所包含的“安全部署+应用搭建+模型微调”的组合,既降低了企业的技术门槛,又确保了数据的本地化部署安全性,对于大模型技术积累相对薄弱的企业尤为友好。
李开复说,对于拥有更强算力需求、具备复杂业务场景的大型企业更为复杂的AI智能化转型需求,零一万物同样具备“超大规模算力管理+数据资产及安全管理+行业模型训练/精调+行业应用平台”的全方位能力,可针对性提供企业进阶解决方案。这一方案不仅能够实现大规模算力的灵活调度,还能够进行产业模型的训练与精调,结合数据资产的安全管理,助力大型企业深度AI化转型,提升业务运营效率与数据应用价值。
除DeepSeek全系列模型外,万智企业大模型一站式平台严选适配了阿里巴巴通义千问(Qwen)、零一万物Yi等国产最新主流模型,能支撑企业灵活配置,找到性能x性价比的最优解。
———————————————
由媒体人雷建平创办,若转载请写明来源。