当前位置：首页 » 资讯 » 新科技 » 正文

连续三月登顶全球AI视频榜，上海这家大模型初创公司凭什么？｜产业进化论

IP属地北京 编辑：苏婉清新民晚报 时间：2025-03-12 13:00:16

说起视频生成模型，如果还只知道Sora，那你显然已经OUT了。
申城大模型创业公司MiniMax（稀宇科技），旗下“海螺AI”一经推出便成为业界焦点，广受市场好评。不知不觉间，“霸榜”2024年12月和2025年1月的全球AI产品榜“出海总榜”和“视频生成”类。近日揭晓的2月榜单，“海螺AI”不出意外地继续蝉联这两项榜首。
眼下，国内大模型创业领域有“六小强”之说，MiniMax亦位列其中。这家创立于2021年的科技公司，正不断“挖深”自己的“护城河”，在激烈竞争中杀出重围。现在，“海螺AI”已成为海外逾200个国家和地区AI爱好者口中的热词，也被视为代表中国先进AI水平的代名词。
MiniMax是通用人工智能科技公司，致力于与用户共创智能。
一张照片就能“拍”电影
Sora的横空出世，点亮了视频生成的赛道。然而，和所有新技术一样，视频生成一旦进入生产环境，要想实现行业应用，各种问题便暴露出来。其中，最头疼的就是，要让视频真正承担起叙事任务，就必须把人物一致性的门槛打下来。
很多人都有这样的体验：上一段视频生成的是小A，下一段视频就变成了另一张脸。无论怎么调整，两段视频的主角都无法统一为一个人。
MiniMax最新自研S2V-01视频模型
直到今年1月，MiniMax发布最新模型，将这一难题彻底化解。用户只需提供一张人物的正面照片，不论生成多少段风格迥异的视频，主角都是这个人。人们惊呼，给一张照片，还一部大片，这不是梦！
在发展过程中，MiniMax始终坚持技术驱动。如何在动态视频中保持人物面部多角度的真实度和稳定性，如何在使用连续片段拼接创作时，使人物角色保持高度一致……这些困扰业界的难题，便成为MiniMax“啃硬骨头”的选择。
研发团队进行了大量技术探索，比选不同的技术路径，最后开发出S2V-01视频模型——只需不到传统方案1%的计算成本和很短的等待时间，就带来了足够好的体验。
值得称赞的是，“海螺AI”在艺术审美上也很“在线”，它能用专业级调光与构图营造美学氛围，精细控制光影效果与景别变化，画面质感媲美大片。
可以说，有了MiniMax的突破，跨视频片段的主体一致性创作痛点成为历史。用户在进行更完整内容表达的视频创作时，也能将更多精力放在内容表达上。
开源“首秀”就抛“王炸”
跨过了“百模大战”的“乱斗”阶段，大模型要“活下来”并走得更远，还有很多技术难关需要攻克：错误率持续降低，无限长的输入和输出，多模态能力……
曾经，在AGI（通用人工智能）这件事上，OpenAI一度是风向标。当全球都在希冀OpenAI尽快给出答案，哪怕是解题思路时，MiniMax已然暗下决心——在算力和数据资源都不占优的条件下，走出一条自己的优化大模型之路。
从2023年夏天开始，公司将80%的算力与研发资源投入底层架构研发，这在外人看来无异于一场豪赌。幸运的是，MiniMax赢了！在成功推出国内首个基于MoE架构的模型后，研发团队又把目光投向了能够几倍提升模型速度的技术难关——线性注意力。
在大部分学术集上，MiniMax都取得了比肩海外第一梯队的结果。
今年1月，MiniMax开源“首秀”，出手就是俩“王炸”：基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。在与海外顶尖模型的基准性能测试对比中，这两款模型在多个核心任务中表现毫不逊色，甚至在某些任务上更胜一筹。在综合性能比肩海外顶尖模型的基础上，MiniMax-Text-01更是在长文本上带来惊喜——支持最多400万个token的上下文输入。
这是什么概念呢？400万token上下文窗口可以一次性处理约700万个汉字。通行的一百二十回本《红楼梦》总字数约为96万字，700万个汉字相当于7部多《红楼梦》。
更值得关注的是，MiniMax在架构上做出了大胆创新，以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈。这也是中国公司首次突破传统Transformer架构。
MiniMax-Text-01模型架构
研发人员要有“极致热情”
“在AI行业蓬勃发展的当下，开源与开放精神正在成为业界共识。”MiniMax副总裁刘华告诉记者。他进一步解释，高水平模型的开源能够让普罗大众免费体验大模型的技术能力，从而推动AI技术的普及和渗透率的提升；同时，开源还能吸引更多开发者参与，共同推进大模型行业快速发展。
MiniMax开发者社区负责人蔡佳人补充说，在让AI变得可用、好用这件事上，全球开发者的智慧不可或缺。对模型优化的建议、创作者体验的问题，MiniMax都会高度重视，也会积极响应跟进；而开源模型的后续更新，也会第一时间与开发者们分享。
刘华还认为，创业公司在中国大模型领域将继续发挥重要作用——大模型研发框架的敏捷迭代要求研发人员对技术变革抱有极致热情，而不能仅仅依赖过去经验。大量聘用年轻研究员并充分授权，打造科学的研发组织体系，是组建高效大模型研发团队的唯一路径。MiniMax就拥有这样一支年轻的研发团队，大部分成员在35岁以下，许多博士还在读书阶段就加入公司作为实习生。
“AI行业充满了活力和发展潜力，但想站上世界舞台，绝不能靠走捷径。作为创业公司，MiniMax会保持专注，让技术回归技术本身。”刘华如是说。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

字节跳动2024年辞退353名违规员工追究39人刑责

思瑞浦投研报告：行业复苏难解亏损困局，存货跌价损失近1亿元，转型阵痛期看三大变量

真相来了！余承东与刘亦菲恋爱？这谣言脑洞也太大了

疯狂的谷子，被掏空的年轻人

DeepSeek和Manus先后火爆，大厂被甩在身后了？

美“DOGE”政府效率部研发聊天机器人，拟用 AI 重塑公务员工作

天文学家破解神秘重复无线电信号之谜：源自双星系统

三星 Galaxy Tab S10 FE 平板跑分曝光：CPU 性能较上代提升 32%

全球手机产量排行榜来了国产中小米第一

单盘容量26TB！西部数据推出全新机械硬盘

太平资产董事长更迭！营收下滑、净利上扬或系中基层员工待遇被砍

曝台积电要联合英伟达、AMD等：共同拿下Intel代工部门！

平安带头，险资疯狂加码银行H股，南向资金创史上第三，大摩称全球资金配置港股仍有空间

「数据看盘」IC、IM期指空头大幅减仓一线游资活跃度降至冰点

次新市场悄现“急牛”！盘中一度飙涨30%，近年“争气”新股扫描，这些标的依旧强势

从暴利到崩盘，大洗牌才刚刚开始

英特尔盘前涨超8%！台积电被曝拟联手英伟达等接管英特尔晶圆代工厂，公司回应

涨停复盘：大盘午后冲高回落数据中心、算力概念活跃

突发！百亿基金经理离职

首款原生鸿蒙正式版手机下周发余承东亲自官宣

外媒称英伟达引发玩家不满指出RTX50定价策略是收割行为

全球最快笔记本众筹搭载9950X3D+桌面RTX5090

中国市场PC出货量来了华为第二

苹果M3 Ultra神了跑DeepSeek比8卡A100还快

“地表最强90后”，中国硬核科技井喷

大疆、美的强制员工下班！这操作我看不懂，只想点赞！

中国AI PC迅猛：份额一年暴增2倍

全站最新

字节跳动2024年辞退353名违规员工追究39人刑责

思瑞浦投研报告：行业复苏难解亏损困局，存货跌价损失近1亿元，转型阵痛期看三大变量

真相来了！余承东与刘亦菲恋爱？这谣言脑洞也太大了

疯狂的谷子，被掏空的年轻人

DeepSeek和Manus先后火爆，大厂被甩在身后了？

美“DOGE”政府效率部研发聊天机器人，拟用 AI 重塑公务员工作

天文学家破解神秘重复无线电信号之谜：源自双星系统

三星 Galaxy Tab S10 FE 平板跑分曝光：CPU 性能较上代提升 32%

热门推荐

字节跳动2024年辞退353名违规员工追究39人刑责

思瑞浦投研报告：行业复苏难解亏损困局，存货跌价损失近1亿元，转型阵痛期看三大变量

真相来了！余承东与刘亦菲恋爱？这谣言脑洞也太大了

疯狂的谷子，被掏空的年轻人

DeepSeek和Manus先后火爆，大厂被甩在身后了？

美“DOGE”政府效率部研发聊天机器人，拟用 AI 重塑公务员工作

天文学家破解神秘重复无线电信号之谜：源自双星系统

三星 Galaxy Tab S10 FE 平板跑分曝光：CPU 性能较上代提升 32%

全球手机产量排行榜来了国产中小米第一

单盘容量26TB！西部数据推出全新机械硬盘

太平资产董事长更迭！营收下滑、净利上扬或系中基层员工待遇被砍

曝台积电要联合英伟达、AMD等：共同拿下Intel代工部门！

平安带头，险资疯狂加码银行H股，南向资金创史上第三，大摩称全球资金配置港股仍有空间

「数据看盘」IC、IM期指空头大幅减仓一线游资活跃度降至冰点

次新市场悄现“急牛”！盘中一度飙涨30%，近年“争气”新股扫描，这些标的依旧强势