当前位置: 首页 » 资讯 » 新科技 » 正文

横跨AI1.0到2.0的商汤科技,如何积累与OpenAI掰手腕的底气

IP属地 北京 编辑:孙明 财经杂志 时间:2024-10-28 20:20:11

要坚持的和将放弃的,都基于未来想成为的样子做考量

文 | 施然

中国人工智能(AI)产业在过去10年历经多个关键节点。2017年谷歌AlphaGo在中国战胜围棋世界冠军柯洁,验证了AI在这一度被认为人类智力巅峰的领域超过了人类的最高水平,从而开启了AI产业的新一轮爆发式增长,AI算法快速在各个产业里落地并产生价值:从人脸识别、身份验证,再到互联网平台的算法推荐,广告精准投放等。多轮技术周期转换中,出现了一大批前期被肯定、后期被验证的公司。

商汤科技是其中一家。商汤成立于2014年,到今年已经是第10个年头。从最早的人脸识别算法,到今天的大模型,商汤参与并见证了中国AI产业的发展、挑战和调整。2021年12月,商汤在港交所上市,最新市值569亿港元。今年以来,商汤市值上涨超过50%。

10年过去,商汤从一家快速增长的AI明星初创公司,变成一家成熟的商业化公司。经历了中国AI科技投资的狂热期到冷静期,经历了AI技术的两次大变革,也经历了国际形势变化带来的地缘政治影响。

今天,生成式AI的发展日新月异,世界距离通用人工智能的目标越来越近,商汤作为中国人工智能行业的代表,也快速调整战略目标。和今天备受关注的创业新贵不同,在AI圈里摸爬滚打了十年的商汤更关注如何盈利,如何真正让AI技术落地应用,如何成为一家有能力穿越周期的科技公司。

图说:商汤科技上海总部大楼

摸爬滚打的十年

商汤最早是通过计算机视觉技术(CV)进入AI行业。商汤科技董事长兼CEO徐立回忆,当科研突破进入产业的时候,大家都在验证一件事,就是AI技术精度究竟能不能过工业的红线。彼时各家公司开发不同的AI模型在垂直行业中试水落地,大概经过两到三年的验证后,就像AlphaGo在围棋中的验证一样,以人脸识别、图像识别为核心的一批模型过了工业应用的红线。

2017年前后,人脸识别技术开始陆续应用于不同垂直场景中,包括智慧城市、身份识别验证等。接下来,行业思考的新问题是如何让AI应用于更多场景和行业中。在当时更普遍的方式是造更多模型。

今天回头来看,通过投入大量研发人员造更多领域模型的路径已经基本被迭代,主流方式是造更通用的大模型,再在模型基础上微调出专用模型。当时那个节点,很少有人去想更远的未来,去探索未来的路径,毕竟模型是否能通用尚需验证。

商汤无疑是有远见的,率先投入通用模型的研发和AI算力的发展。“如果你每个场景都用投入研究人员训练不同模型,最后可能你要做成百上千个模型,完成一个复杂的任务,模型的生产降不下来。” 徐立发现,这阶段AI模型的生产成本主要是人。事实上,当时的AI公司的研发成本几乎就等价于研发人员薪酬。

伴随商业化进程的深入,要做通用的、端到端的模型变成商汤思考的主要方向。2019年,商汤对外提出做通用视觉大模型;在自动驾驶领域,又率先提出了做端到端的大模型UniAD。

徐立发现,在走向通用的过程中,AI算力的重要性愈发上升。一个复杂的任务如果能分解为三个子问题,假设每个环节有10个参数,训练3个专用模型来解决这些问题只需要30个参数,而如果要用一个通用端到端模型来解决,那就变成有1000个参数(10乘10乘10),相当于参数量增加了100倍,这意味着算力规模要呈几何级数增加。

“如果你每个场景都用一个不同的模型去做,最后可能你要做1000个模型,这很难实现,人手都不够,模型的价格也降不下来。”徐立发现,这一路径显然距离跨越“工业红线”越来越远。

所以,通用模型的打造成了2019年商汤的重中之重,商汤是国内最早一批投入通用大模型研发的厂商,这也成为其构建AI价值商业闭环的先发优势,而这背后的大规模AI基础设施建设投入也随之提上日程。徐立原计划用租赁算力完成通用模型研发,但当时市场上没有成熟的大规模算力基础设施,只能自己去建不说,此前甚至都没有前人经验完整搭建过一套大规模智算系统。商汤成了第一个吃螃蟹的人,投建了自己的算力大装置,组建了大装置团队完成超大规模的算力训推软件平台的搭建。取名算力大装置,徐立是将其对于AI的作用类比于粒子对撞机之于高能物理学。如今商汤所持有的5.4万块GPU和超过20,000petaFLOPS算力,已经成为行业公认的稀缺资源。

而在2018年—2022这几年间,资本对于AI的态度以及国际环境都发生了巨变。2018年到2021年是中国AI创业、融资爆发式增长的四年,以商汤为代表的AI创业公司们在那几年快速获得高额融资,走到上市节点。创投数据服务商IT桔子数据显示,2018年,中国AI领域共融资2373亿元,同比增长93%。2021年共融资3996亿元,同比增长51%。

但市场热度在2022年出现明显下滑,这一年AI领域融资额降至1579亿元,同比下滑64%,2023年继续下滑至1101亿元。

和融资热度下滑同时出现的,还有外部水温的变化。在此之前,AI领域的融资以美元投资机构为主,他们看重前沿技术,也愿意为初创公司早期的高额研发买单。但2021年,美国加大对中国科技公司的制裁力度,美元机构陆续退出。

商汤的融资上市过程可谓是一个缩影:商汤在2019年被美国列入实体清单,2021年上市期间又被美国列入涉军企业清单(CMIC)。但仍顶着压力于当年12月30日在港交所挂牌上市,获得了稳定的融资渠道,提升了抗风险能力,这为商汤继续发展通用智能和AI智算奠定了基础。

和全球大部分AI公司一样,商汤还处于亏损阶段,但作为上市公司,商汤面临商业化落地和保持技术领先的双重考验,想要扭亏,需要一边扩大收入,一边降低成本。

现在看来,商汤在AI基础设施方面的投入和通用大模型的路线选择,与OpenAI等国际巨头十分吻合。要搞好算力基础设施软件能力,需要深入理解大模型。2023年4月,商汤在国内率先发布了“日日新SenseNova”大模型体系,发布时,徐立提到,通用模型的能力比单纯的规模更重要,商汤在过去积累了不少客户,解决了很多行业问题,因此积累了大量真实数据,能够让模型在通用的基础上,在垂直领域更好用。在此后一年3个月的时间内,“日日新”迭代至5.5版本,交互效果和多项核心指标实现对标GPT-4o,也是国内对标GPT-4 Turbo领先的国产大模型之一。

商汤技术上的领先也迅速体现在商业上。今年8月商汤发布的半年财报显示,2024年上半年,商汤收入17.4亿元,同比增长21%;毛利7.7亿元,同比增长18%。商汤财报中,收入来源按业务分为三大类,生成式AI、智能汽车和传统AI,其中生成式AI占比60.4%,是目前商汤收入占比最高的业务。

新的机遇和挑战

把原来传统AI构建一个个场景模型的时代称为AI1.0的话,徐立认为,生成式AI或者AI2.0时代除了模型的通用性之外,最大的特点是成本结构由“研发人员密集型”转化为了“算力资源密集型”。OpenAI研发ChatGPT的时候研发人员只有87人。由一套算力基础设施支持行业应用,实现服务边际成本极低,是理想的模式。但实际上,目前算力资源成本巨大,以现有的应用规模来说,很难看到盈亏平衡。2024年9月,微软与贝莱德携手成立300亿美金的AI基建基金。

商汤是上一轮AI产业爆发中,少数成功上市的AI公司。一些业内人士担心,商汤在资金储备方面不及互联网大厂,可以大规模投入今天的生成式大模型;又不像初创公司那样可以暂时不考虑商业回报,通过一级市场大规模融资来获得技术投入资本。

徐立却认为,过往十年的AI1.0时代客户和应用,使得商汤更了解市场需要什么样的AI产品和服务。其次,也因为长期专注于AI底层基础设施与模型应用,商汤积累了可观的算力规模和技术资源,以及高效运营这些资源的能力。“电力和通信流量都是基础设施,一套基础设施就能服务千行百业,但是早期的成本也都居高不下,随着技术的迭代以及使用人数的扩大,边际成本就忽略不计了”,现在AI基础设施正处在这样的重要转折点。

他总结,商汤是最懂模型的算力服务商,最懂算力的模型服务商。

商汤也需要将传统AI客户转化为生成式AI客户,随着客户需求和技术迭代,让生成式AI商业应用能够快速进入市场。在具体应用行业上,商汤需要做到更聚焦。AI1.0时代的行业客户,在通用人工智能来临之际,已经快速将日日新大模型部署到各领域,一些垂直行业场景包括金融领域,如商汤金融的数据先兵产品聚焦数字化分析;在智能办公领域,比如在Copilot助手(个人AI助手)商汤 “小浣熊”产品个人用户和开发者达数十万,亦服务于金山办公等头部应用。此外,在大模型拟人交互领域,商汤日日新大模型支持了新浪微博、阅文集团筑梦岛、爱奇艺等互联网应用,日均Tokens数达数百亿,调用量在半年内增长近22倍。

商汤下一步的产品和业务目标是“用得上、用得好、用得起”。用得上是指能真正为用户创造价值;用得好是要进入客户的生产和流程中;用得起,则是需要大幅降低训练、推理和部署成本。

为了实现这一目标,商汤决策层制定了“大装置-大模型-应用”的三位一体核心战略。大装置是指模型的基础设施服务,以算力服务为主。徐立提到,如果只有基础设施,不懂大模型的话,就没有竞争力。今天使用算力主要有两类,一是训练模型,二是使用模型。训练模型时,需要优化算力使用效率;使用模型的时候,则需要节约算力成本。

“今天人工智能的商业模式不管是训练模型,还是用模型对外服务,本质意义上都是在消耗资源,付的是资源的费用。所有的商业模式最后都和计算资源消耗画了一个等号,就是通过‘三位一体’,把资源以最有效的方式利用起来。”徐立表示。

按照这样的战略布局,商汤认为,算力和模型的深度协同,能让大模型迅速迭代,并降低推理成本,从而获得更多用户和调用量增长,实现收入提升。例如在推理场景中,商汤以创新的技术架构实现了相同算力及电力成本下的每秒请求数(QPS)提升4倍,并实现了推理服务弹性按需伸缩,优化了大规模AI推理的整体成本。

算力服务是不少科技巨头也在重点布局的方向,徐立认为,一些科技巨头的重心在于自己的生态,包括自研芯片和云平台等。但当下AI领域要抢占先机,什么资源更快更好用就先用起来,不局限于一家的产品和平台。徐立认为,商汤提供的基础服务更贴近AI发展现状。

穿越技术周期的两条腿

今天,AI领域最大的挑战就是商业模式不清晰。算力的投入,数据的投入和人才的投入都相对确定,甚至连AI可能带来的风险和威胁都已经被多次讨论。但AI究竟能怎么赚钱,最终的产品形态如何,目前还很难有定论。

商汤这样的AI技术公司,能否成功穿越新一轮技术转换周期,取决于两点:其一,走得够快;其二,走得够远。

徐立说,今天对于AI公司来说挑战很大,因为“技术投入永远要比商业化前置”。如果决定要做大模型,那就需要长期的资源投入,有新的方向出现都要跟进。但实际的回报可能要等很长的周期。

上市后的商汤有了更清晰的规划——盈利。

徐立说,商汤目前有两条腿,一条腿是传统AI,技术成熟,不断降低成本、拓展市场(包括海外市场),聚焦利润贡献;另一条腿新一代的AI大模型,目标是盈亏平衡,这条腿增长很快,且能看得到未来。前者保证商汤“走得够快”,后者保证“走得够远”。

商汤在不断探索不同的商业的模式,比如:卖一体机。一台机器配一定数量的账号,能够实现本地化部署,即买即用,一方面能降低客户应用AI的门槛,另一方面也能帮助客户节约使用成本。这一模式相对软件模式,毛利偏低,但商业化效率提升明显。

在海外市场,商汤也未放弃软件模式。事实上,目前全球范围内,中国和美国是AI领域的两大高地,中国的AI技术对很多海外国家来说,都是非常领先的。徐立说,海外客户对于AI软件的购买意愿很高,且回款周期短。目前商汤在传统AI领域已经有非常成熟的产品和解决方案,只需要继续拓展海外销售渠道即可。

据了解,商汤目前海外市场的年营收增长率约40%,高于21%的整体增长率,海外市场占集团总收入比例提升至18.5%。目前,海外市场对于商汤来说是赚钱主力之一,且在海外能沿用软件模式,毛利更高。海外市场营收和利润的增长也能够帮助商汤更好地投入到大模型业务中。

接下来,考验AI公司的是如何实现大模型的商业化。据媒体报道,OpenAI GPT-4的一次训练成本约6300万美元,2022年的总训练成本约5.4亿美元。OpenAI称2024年的运营成本将超过85亿美元,预计亏损约50亿元美元,预计2023年至2028年的总亏损(不包括股权补偿)将达到440亿美元。OpenAI还提到,模型训练成本还将进一步增长,预计到2026年每年将达到95亿美元。

可以预见的是,大模型依然会在通用的道路上前进,但很难在短时间内实现真正的通用。此外,随着开源模型的能力越来越强,对于一些科技公司来说,再去“卷”参数、做预训练价值不大。更实际的方式是,通过针对性训练,去提升较小模型的专有能力,也相当于是“降本增效”,这可能是更符合当下市场环境的做法。

从训练到推理,算力的资源属性愈发显现。商汤也在积极布局算力运营,希望在现有条件下将已投入打造的资源变现。现实情况是,目前市场上的算力资源分散且标准不统一,使用起来效率不高。而商汤可提供算力运营服务,将不同标准的卡连接起来,适配不同需求,满足那些需要使用算力的客户。

2024年10月18日,商汤科技十周年国际论坛上,徐立表示,当下正处于AGI(通用AI)的转折点,大模型快速发展很大程度是因为基础设施水平有显著提高,让通用AI模型成为可能。徐立还提到,早在2014年商汤成立之时,商汤创始人汤晓鸥就强调,要把技术带到日常生活中,希望技术能够融入生活的不同场景。这句话放到今天仍不过时。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新