图/微博
DeepSeek 效应下,罗福莉被外界聚焦
就在罗福莉凌晨发声前,红星新闻在 2 月 16 日中指出,从罗福莉的一名亲属处获悉,罗福莉已到新岗位上班,但未提及是否正式入职小米。
可以确认的是,罗福莉已正式离开 DeepSeek。这一点从其取消知乎个人账户的蓝 V 认证就能初见端倪,罗福莉最初在技术圈火起来,就是 DeepSeek V2 发布后在知乎引起的大量关注,她还曾亲自回复网友们的一些问题。
截至目前,罗福莉在知乎一共回答了8个问题,拥有1万+赞和2.5万粉丝(小雷意外地发现,她在知乎还关注了我们的创始人罗超)。她在知乎主页(签名档也提出了恳求:
“烦请各大自媒体不要再神化和消费个人。”
到了年初 DeepSeek V3 技术论文发布,我们更是在论文名单中正式确认了这一点。
论文末尾的部分名单,*代表成员已离开,图/
除了 DeepSeek 居高不下的话题度,舆论关注罗福莉的另一个关键因素是「小米」。尤其是去年年底,雷军在直播中表示愿意千万年薪挖角,随后媒体也报道了罗福莉将领导小米 AI 大模型团队的消息,似乎罗福莉一人就将扭转小米在大模型上的落后。截至目前,头部手机巨头华米OV荣,只有小米没有官宣接入DeepSeek。小米AI手机、AI硬件以及AI汽车战略的后发而至,让外界对其AI战略有了更多期待。
日前,在接受媒体采访时,雷军表态小米要将AI落地到各个终端产品上:
小米创业的15年来,一直聚焦在手机、汽车、智能家居、智能制造这些领域。要下决心把最新的,像AI技术怎么能够落地到我们各个终端产品上,能够让消费者体验科技带来的美好生活,怎么在拓展国内市场的同时能够放眼全球,提高中国产品在全球的影响力。
但时至今日,「罗福莉加入小米」一事变得越来越不确定。澎湃新闻 2 月 18 日指出,在小米内部员工系统,目前没有显示「罗福莉」相关信息。结合红星新闻援引罗福莉亲属表示「已到新岗位上班」的报道来看,罗福莉的最新职位依然成谜。
图/澎湃新闻
罗福莉在凌晨发声的直接导火索,我们不得而知,但往上追溯无疑是来自外界的重新关注。春节期间DeepSeek一夜爆发,举世瞩目,愈演愈烈的DeepSeek浪潮将罗福莉以及跟DeepSeek相关的许多人都推到公众聚光灯下。
(图源:百度)
跟计算机、电子工程等通用IT技术不同,AI特别是大模型技术门槛极高,真正掌握顶尖特别是前沿AI技术的人少之又少。正因为此,AI圈近年来十分流行「封神」。无论是 AI 领域的「天才少女」,还是那些层出不穷的「AI 教父」,科技媒体和自媒体似乎更愿意讲述关于个人的传奇故事,而非关注技术发展的本质。但真正的技术人员往往对这种聚光灯感到不适,正如罗福莉在朋友圈所言:
「请互联网还我一片安安静静做事的氛围吧!」
不止天才少女,AI圈热衷「封神」「AI 天才少女」、「AI 教父」、「AI 教母」、「大模型之父」……科技行业的「造神运动」似乎从未停止。无论是 AI 领域的「AI 天才少女」,还是那些层出不穷的「AI 教父」,科技媒体和自媒体似乎更愿意讲述关于个人的传奇故事,而非关注技术发展的本质。
事实上,仅仅是「AI 教父」的名单就能列出好几个:Geoffrey Hinton、Yann LeCun、Yoshua Bengio、Demis Hassabis、Jürgen Schmidhuber,甚至 Elon Musk、黄仁勋、吴恩达(曾任百度首席科学家)也常被放进这个名单。
去年玩的梗,今年该换成 DeepSeek 了,图/微博
不仅如此,几乎每隔一段时间,都会有新的「天才」登上热搜,被塑造成技术革命的核心。
这种「故事」并不新鲜。从乔布斯、马斯克,到这两年风头正劲的 Sam Altman,再到最近的梁文峰、王兴兴等,媒体一直在用个人英雄的方式讲述科技变革。
在 AI 行业,技术的突破其实是产业发展、团队努力和个人创新共同作用的结果,比如DeepSeek也是站在巨人肩上取得的成功,如果没有深度学习/NLP等AI技术的多年积累,如果没有OpenAI的珠玉在前,如果没有巨头们对稠密架构型大模型的持续投资,如果没有算力成本在摩尔定律下的降低,DeepSeek都很难凭空起高楼。
然而,AI的技术突破却经常被媒体以及自媒体归功于某个「天才」的功劳。当然,这也是最简单的归因方式,且人们热爱这样的个人英雄主义叙事。
OpenAI 的 Sam Altman,被塑造成拯救人类于「超级 AI 崛起」的掌舵者,甚至在 ChatGPT 爆火后,普遍被认为是「比马斯克更懂 AI 的男人」;DeepMind 的 Demis Hassabis,则被描述为「科学家+企业家」的完美结合,是 AI 从象棋棋盘走向生物医学的核心推手。
而 Hinton、LeCun、Bengio 三位图灵奖得主,也被并称为「AI 教父」,尽管他们的贡献分属不同的研究领域,但媒体仍倾向于用「三巨头」的方式强化其个人光环。
图/图灵奖
互联网时代,流量是自媒体/媒体商业模式的核心,而流量偏好的是「简单、直观、富有戏剧性的叙事」。相比于一篇深入讲解 Transformer 架构如何改进注意力机制的论文,大众天然更容易被「某某 90 后天才攻克 AI 难题」的标题吸引。
一个「14 岁黑客攻破 MIT 系统」的故事,即使是杜撰的,甚至也能赢得数百万点击,进而成为多数人的「认知」。
个人英雄叙事的本质,是用更容易理解的方式,满足大众对科技创新的猎奇心理。内容平台的算法机制也在助推这一趋势。无论是知乎、微博、X(原 Twitter),还是 B 站、YouTube,带有「传奇」色彩的个人故事,往往更容易引发关注和讨论,越多人被标题/封面吸引,点击越多;点击越多,看得越久,算法认为内容越受欢迎进而推荐越多,流量飞轮就会加速旋转。
AI 需要人才,但不需要「天才少女」
「(自己)只想安安静静做难而正确的事情,仅此而已!」
罗福莉在朋友圈的这句话,可能给 AI 行业当下浮躁的「造神热」敲响了警钟。在 AI 大模型技术还在快速迭代的当下,世界需要的不是被神话的个人,而是一群又一群的技术人才,他们愿意在聚光灯之外“坐冷板凳”,仰望星空的同时脚踏实地,不断去攻克核心问题。
但 OpenAI 的 GPT-4,Google DeepMind 的 AlphaFold 3,以及DeepSeek的R1,所有这些技术的背后都是成百上千名研究员和工程师的共同努力,然而媒体往往忽略了这些集体智慧,而选择将焦点集中在一个个鲜明的人物标签上。
包括 DeepSeek V3 上发光发亮的混合专家结构(MoE)和多头潜在注意力(MLA)机制,实际上在罗福莉作为核心成员参与开发的 DeepSeek V2 就已经初步带来,只是“发布多日无人问,一朝成名天下知”。
DeepSeek V2 技术论文摘要,图/
诚然,AI 行业最令人惊叹的突破,几乎都来自小而精的高效团队,但也远非「某个天才」的奇迹时刻。
根据国内大模型厂商智谱在 2023 年初的,ChatGPT 团队规模不足百人(共 87 人),平均年龄为 32 岁,尽管本、硕、博人数相对均衡,但绝大多数拥有名校学历以及全球知名企业经历。
DeepSeek 也有一支高端人才密度极高的研发团队,团队成员100来号人,但核心成员大都来自清北等中国C9顶尖高校。
(图片见水印)
根据 DeepSeek V3 的技术论文,DeepSeek V3 项目的研究员和工程师数量共为 150 人,其中包括罗福莉等已离职成员 10 人。另外从 DeepSeek R1 的技术论文来看,项目贡献者达到了 194 人,其中 142 人(包括核心贡献者 18 人)同时也是 DeepSeek V3 项目的研究员或工程师。
诚然,这里面也包括了「流量最高」的原 DeepSeek 研究员罗福莉和 DeepSeek 创始人梁文峰,但将其「神化」既不公允,也不合理。
罗福莉的发声,实际上也在提醒我们一个现实:现在 AI 研究者最需要的,是一个安静做研究的环境,而不是成为流量甚至“带货”的工具。当一个行业进入技术快速迭代期,真正的技术天才更需要专注于攻克技术难点,而不是接受访谈、上热搜成为「传奇人物」,这一切只会徒增技术人员们的压力。
如果说 AI 需要「天才」,那么 AI 需要的是那种愿意埋头研究,不被流量干扰的「长期主义者」,而不是被塑造成「天才」的符号人物。
OpenAI、DeepSeek 如此,所有科技公司亦如此。
是时候还AI技术大牛们一个「安静」了
罗福莉的经历再次证明,在当下这个信息极度碎片化的时代,一个技术人员的职业选择、一次正常的离职流动,都可能被外界赋予过多的解读。
AI 确实是智力密集型产业,一定需要顶级人才驱动,但这些人才最需要的,是一个专注研究的环境,而不是成为流量焦点。梁文峰也曾描述过 DeepSeek 团队的管理模式:
没有严格的层级架构或部门壁垒,只要彼此感兴趣,团队成员可以自由协作;成员可以随时调用我们的训练集群,无需审批。
这种与硅谷顶尖实验室「放任式创新」实际上有异曲同工之之处,都是尽可能赋予研究人员一个自由的研究环境。
去年 7 月,梁文峰接受暗涌 Waves 时讲过他的判断,「当前阶段是技术创新期,而不是应用爆发期。」对整个行业来说,与其不断造神、炒作「天才少女」或「AI 教父」,不如更多地关注那些真正推动技术进步的团队、关注他们正在解决的关键难题、关心他们的技术被如何应用于造福于人。
AI 行业需要的不是个人英雄主义的幻象。或许,最好的尊重方式,就是让那些真正做「难而正确的事情」的人,回归安静,继续前行。
2023年,DeepSeek在一则公告中曾留下一句如今传遍行业的名言:「务必要疯狂地怀抱雄心,且还要疯狂地真诚」。这句来自法国新浪潮导演特吕弗的话,正是今天AI行业需要的精神。
聚焦DeepSeek: