未来图灵
近日,据知情人士透露,原滴滴出行AI Labs首席算法工程师李先刚近期又将发生工作变动,由贝壳重新回归大模型领域。最新消息是,他即将入职中国大模型“六小虎”的中一家专注医疗领域的大模型的“小虎”。跳槽频率令人咋舌。
公开报道显示,李先刚在过去一年间跳槽频繁。离开滴滴后,李先刚加入贝壳,任策略算法中心负责人。据公开报道,之后他曾在2023年7月起短暂于零一万物任职,数月便离职;离职后李先刚先加入百川智能,旋即回归曾就职的房屋交易平台贝壳。近日则又传出其归位被传放弃预训练、聚焦医疗领域的大模型“小虎”的传闻。为何一年多时间高速二进二出,原因值得思索。
据多位知情人士透露,李先刚在零一万物任职期间,未负责核心技术产品管线。据上述知情人士猜测,上述提到的数家公司中,某家科技公司的员工/高管试用期通常为半年时间,“到点离职”的原因或许是未能交付出合格的技术产品。
消息称,李先刚此次最新入职的公司为加盟大模型“六小虎”中的主打AI+医疗的一家。
在此前的公开发声中,该公司聚焦于搜索、医疗领域,在2023年下半年曾密集发布多款模型,但进入2024年模型发布节奏显著放缓,近期更是被外界质疑放弃预训练。虽然该公司清华系创始人已辟谣,但是有多名大模型从业者都表示,由于迟迟未能交出在国际权威榜单上取得好成绩的模型,已被质疑技术掉队。“榜单都在‘打’商业化榜单SuperCLUE,LMSYS等权威没法刷分的世界权威榜单都没见过上榜。哪怕在李先刚在该小虎的第一次任职期间(职务不详)。”从业者表示。
除预训练能力外,该“小虎”的算力供给安全度近期也受到关注。“算力妖股”鸿博股份此前曾于2023年12月末发布公告称,全资子公司英博数科与该AI小虎签订了近14亿元的算力服务订单,履行期限为2024年1月30日至2027年1月31日,履约跨度为整整三年。
但步入2024年,鸿博股份却持续承压,负面消息频传。2024年10月12日,鸿博股份发布公告称,公司全资子公司英博数科与紫光晓通科技有限公司解除了高达4.94亿元的购销合同。作为紫光股份旗下公司,紫光晓通业务就包含了英伟达产品的中国区销售业务。这无疑为鸿博股份的算力租赁业务增加了不确定性。
或受此影响,据鸿博股份于6月8日发布的《关于2023年年报的问询函回复的公告》中显示,英博数科与该小虎签订的大订单也进展缓慢,2023年12月签署协议后至2024年6月8日,该合同尚未开始产生收入,预计进展与实际情况存在一定延后,主要原因在于合同涉及的GPU 服务器设备到货时间较原计划延后,以及设备在到位后需进行上架安装以及联网调试等工作,服务器集群需满足性能标准后才可确认收入。
图片鸿博股份《关于2023年年报的问询函回复的公告》第三大部分
近期鸿博股份的控股股东寓泰控股也被申请破产重整,其股权的司法扣划可能导致鸿博股份的股权结构发生较大变动。这是否影响公司的治理结构仍有待观察。
从凭借算力概念横空出世至今,“算力妖股”鸿博股份股价较今年3月份的高点已跌去56.5%,考虑到重大采购合同被解除等情况,鸿博股份及其全资子公司英博数科能否按时为百川智能交付算力服务、交付到何种程度均不明朗。
考虑到之前李先刚一年之间在技术交付能力,和高速的跳槽频率,正式入局该小虎后能否改变现状,不少大模型圈内人士持相对保守的态度。
我们来看看目前AI小虎的技术位序。一个行业共识是,做好模型预训练单单依靠算法团队是远远不够的,模型结构与算法只有与AI基础设施相结合,软硬件搭配下才能够更高效、更低成本地完成模型预训练。“目前,大模型初创中如智谱AI、零一万物、DeepSeek,大厂中如阿里、通义千问都推出了性能领先的模型,从模型预训练角度来看,技术上的差距一旦被拉开,掉队后再追赶难度极大。直接招一个模型训练负责人入职就能搞定一切的时代已经结束了。”有业内人士称。
该AI小虎应用落地方面,针对搜索场景所推出的C端AI助手应用并未有明显起色,据七麦数据显示,近30日iPhone端日均下载量仅3次,similarweb数据中也显示,Web端9月访问量同比下降3.03%。近期,因为聚焦国内AI医疗业务落地,该小虎也开启了内部裁员,涉及技术、产品、BD等多个组别,“比如API组是裁员重灾区,而C端产品也进行大幅缩减,百小应沦为摆设。”其他大厂、AI 小虎的HR近段时间迎来不少百川员工“毕业”面试潮。
近期该小虎公布的50亿融资或许是为数不多的“好消息”。但有知情人士爆料称,所谓50亿融资实际为过去一年多的融资总额,并非今年新一轮融资所得,不过为了融资额好看,这样的操作可以理解。但模型预训练、应用落地方面都面临质疑与挑战的当下,一位在行业间“频繁跳槽”的算法负责人能发挥多大的效用?市场上传言的200亿的估值又能否继续找到投资人买单?接下来,我们拭目以待。