文 | 本原财经
雷布斯发力大模型。
总裁在线挖人的风还是传到了雷军这里。
据第一财经报道,雷军开出千万年薪招揽了一位95后AI天才少女——DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉。
罗福莉其人,硕士毕业于北京大学计算语言学专业,曾在阿里巴巴达摩院任职,因在国际顶会发表8篇论文而走红。加入小米后,罗福莉或将供职于小米AI实验室,领导小米大模型团队。
小米在大模型领域的布局相对较晚,如今总裁雷军亲自出手摇人,AI领域或许也要掀起一阵“腥风血雨”了。
01 95后天才萝莉
被雷军看中的罗福莉到底何许人也?
大家给罗福莉起了个“95后AI天才小萝莉”的称呼。
自称“起点很低”的罗福莉出生在四川小城一个普通家庭,甚至在上大学之前几乎没接触过电脑。
本科就读于北京师范大学,误打误撞进入计算机专业,起初成绩垫底,经历一段清苦但充实的时光,成绩终于爬到了前几。
大三被打击“你没有天赋做科研”,却凭借天赋和努力保研进入北京大学计算语言学研究所。
人生转折发生在2019年。身为北大硕士的她,在NLP国际顶会ACL上发表8篇论文(其中2篇一作),迅速登上知乎热搜而走红。
▲图源:罗福莉知乎回应
人生转折发生在2019年。身为北大硕士的她,在NLP国际顶会ACL上发表8篇论文(其中2篇一作),迅速登上知乎热搜而走红。
她提出的词义消歧方法,和文本风格转换框架等成果,推动了NLP技术发展,因而成为“天才AI少女”。
研究生时期的罗福莉已经达到了博士生的毕业标准,却选择了直接毕业参加校招进入工业界。
这对于罗福莉来说,是一步想把路走得更宽的棋——“既然已经具备了博士毕业的学术水平,那在最好的年纪就去做一些不一样的事情。”
▲图源:罗福莉参加ACL2019顶会
那一年,她基本上拿下了国内各个大厂的最Top的硕士offer,包括阿里星、腾讯技术大咖、百度AIDU计划等等。
她选择了加入阿里达摩院机器智能实验室,主导开发多语言预训练模型VECO。此外,她还主导了AliceMind的开源工作。
此后,加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。
2022年,她又跳槽DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
DeepSeek-V2模型一大亮点是性价比,罗福莉表示1元/百万输入Tokens的价格,只有GPT4的1/100,这或许正是小米看中的点。
今天的罗福莉,学术成果丰硕、职场履历精彩,但她依旧谦逊低调,经常在自媒体端分享自己的心得,想激励那些和她一样不是一开始就领跑的伙伴们,与网友的互动也十分接地气。
深耕自然语言处理领域,技术实力深厚,又自带“天才AI少女”“95后AI萝莉”的标签,符合“营销天团”小米的调性,可以想象小米发布会热搜霸屏的场景了。
02拿下大模型
雷军上次高调挖人还是做小米汽车的时候,对大模型的重视可见一斑。
AI Agent在智能手机上的应用逐渐成为常态,未来通过AI Agent为用户高度定制化的私人助理,这一趋势将成为品牌维护用户群体的核心护城河。
而相比友商,小米在AI大模型上的真正发力确实有点晚,虽然2016年它便组建了AI团队。
你知道小米小爱目前用的哪家模型:小米大模型?文心一言?阿里通义?字节豆包?
大概是:全都有。
2023年4月,小米AI实验室下设了专门的大模型团队,任命栾剑担任负责人,向小米技术委员会副主席、AI实验室主任王斌汇报。同年11月,AI实验室主任王斌接受采访时,明确表示过小米不做ChatGPT、不搞AI的军备竞赛。
对于“烧钱”的预训练大模型,小米相较于其他厂商更显谨慎。其中也有同步造车,要优先保住“现金王”在成本上的考虑。
内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。
作为对比,2023年11月,友商Vivo已经推出第一代蓝心大模型矩阵,包括十亿、百亿、千亿三个参数量级的五款语言大模型。
同年的年度演讲中,雷军宣布小米将全面拥抱AI大模型,大模型技术的主力突破方向只是「轻量化」和「本地部署」。
小米几乎是全球,拥有最丰富AI入口和应用场景的公司。2024年Q3财报显示,小米集团的AIoT平台已连接的IoT设备数超8.61亿,同比增长23.2%。
被称为“杂货铺”的小米,这些海量的AIoT设备,轻量化、需要借助分布式算力的终端设备,目前主要依赖于云端的AI能力,想要实现本地化部署,对于轻量化的需求确实更高。
2024年底,荣耀CEO赵明在发布会上,用手机AI点了2000杯瑞幸咖啡。这种“自动驾驶”式的手机功能引发了热议。
而小米15与竞品相比,虽配备基础AI功能,但是在多模态交互与跨App联动等方面的应用,就有些乏善可陈,宣传上也略显不足。
如今国产手机价格已经迈过4000元大关,各家厂商芯片算力不断提升,AI Agent与手机硬件的融合已势不可挡。AI Agent在人机交互中显得尤为重要,AI的加持与否,也将成为区别手机高低端的关键。
另据IDC预测,2025年中国新一代AI手机市场出货量将达1.18亿台,同比增长59.8%,整体市场占比达到40.7%。
在其他手机厂商All in AI时,小米警觉自己已经默默地落后了。为了拿下新一轮的高端智能手机军备,小米必须加注大模型也是势在必行的事情。
03人才先行
雷军曾表示,小米将继续加大在AI、物联网(IoT)等前沿技术的投入,力争在全球科技创新中占据一席之地。
2017年,小米正式成立AI实验室。在AI领域,小米已经发布了自研芯片澎湃C1、成立自动驾驶团队、小米机器人实验室,去年其AI相关团队已经超过3000人。
近期小米大模型也已升级至第二代。目前,MiLM2已经在澎湃OS、小爱同学、智能座舱、智能客服中应用落地。
▲图源:小米发布会
在大模型领域,小米其实是有优势的,其“人车家”战略最不缺大模型的落地场景,其中汽车领域的大模型实践,既是体验赋能、也是落地样板,一旦储备了丰富的人才和技术积累,把这块短板补上来,无数的应用场景能迅速反哺大模型的能力。
这样看来,小米大模型的上限会很高。
如何将“轻量化”和“本地部署”战略真正转化为用户可感知的体验差异,并在多样化场景中形成闭环生态,是小米必须回答的新课题。
AI人才对整个产品举足轻重,在雷军给出发力大模型的信号之后,相关人才的招募正在如火如荼的进行。