文 | 海豚投研
作为当前资本和科技市场最大的主线—AI 在技术端的发展可谓日新月异:
①24 年初 Sore 视频生成模型发布,代表着大模型由图文向视频等多模态演变;
② Suno 模型代表 AI 在音乐等音频生成上已初有成效;
③ 年中 Llama-3、Gemini、Claude、豆包等不同平台的大模型如雨后春笋,不断涌现和迭代;
④以 Tesla FSD v13 代表的 AI 在 “通过视觉理解世界” 上已有长足进步;
⑤ChatGPT 4o1~4o3 给我们展示了一个 “初见成效” 的兼具图文、视频、语音等多模态感知和逻辑推理能力的 AI 大模型;
⑥日前以$赛富时.US 发布的 Agentforce 为代表的 “AI agent”,则又向 “人工智能” 真正替代 “人工” 迈出了一步。
但资本市场上,以微软、英伟达、台积电为代表的 AI 产业链上游,即硬件芯片和云计算基础设施自 24 年下半年以来,大体上是震荡走平,并未随着 AI 技术的不断演进继续创新高。反而 AI 产业链的下游,即软件或 SaaS 服务商则涨幅不俗。由下图可见,最大的 SaaS 服务商之一 Salesforce 在 2H24 的累计涨幅超过 30%,明显跑赢上述三家上游龙头不足 20% 的累计涨幅。更广的视角下,MSCI Software & Service 指数自 22 年低点的上涨斜率也大幅跑赢 MSCI 全美指数。市场内对 2025 年 AI 下游软件端可能会跑赢中上游硬件和基础设施的声音并不鲜见。
在此背景下,海豚投研此次就以 Salesforce(NYSE:Salesforce)为研究对象和切入口,一方面尝试探究市场看多软件端背后的原因、逻辑是什么?其中基本可以明确的原因之一,就是前文提及的 “AI agent” 概念下的 Agentforce。因此,Agentforce 到底是什么,以及 Agentforce 会给行业和 Salesforce 带来哪些影响,也会是本文尝试探讨的内容。
以下为正文内容:
一、9 月以来 Salesforce 在涨什么?
1. 股价简单复盘
正文开篇,我们先简要复盘下 Salesforce 近期股价的走势,及其背后可能的催化原因。由下图可见:
① 第一个关键事件,Salesforce 在 9.12 首次公布了 Agentforce,随后 Salesforce股价立即突破了持续数月的震荡走势,开始趋势性拉涨;
② 10.29 日 Agentforce 服务向用户全面开放,几日之后(数日延迟应当是市场和客户在评估 Agentforce 的可用性),Salesforce 的股价再度突破持续了十几个交易日的震荡,快速拉涨;
③ 12.04 日 Salesforce 披露 3Q25 业绩,当天 Salesforce 股价拉升超 10%。不过客观的说,当前业绩表现和对下季指引并不算很强劲,属于不会给当前乐观情绪 “泼冷水”,但也并不足以验证市场对 Agentforce 乐观预期的季报。(后文会更详细探讨);
④ 12.17 日Salesforce 召开 Agentforce 2.0 发布会,介绍了公司对 Agentforce 后续会添加功能的展望 (主要是展望,实际已落地的较少),和自发布以来 Agentforce 的效果和用户接受情况。后一日 Salesforce 股价明显走跌,但当天纳指整体下跌近 3.6%,主要是受宏观市场拖累。据我们了解,市场对 Agentforce 2.0 的反应是比较正面的。
2. Salesforce 的 3Q25 业绩表现好吗?
简要回顾 3QF25 业绩,从当季表现和对下季度指引两个视角,来看看这次业绩的质量是否配得上公布次日股价超 10% 的大涨。
3QF25 当期业绩上,① 从预期差的角度,收入、毛利、经营利润这三项关键财务指标的都仅略高于预期 1%~3% 左右,仅是比预期稍好,并没有大超预期的明显亮点。
② 从趋势的角度,3Q 收入增速(无论是整体还是核心的订阅收入)较上季度继续略微放缓 0.1pct,表明在Agentforce 之外 Salesforce 现有业务的增长趋势是在继续向下的。
相比不断放缓的营收增长,Salesforce 盈利能力改善相对更有看点,3QF25 经营利润同比增长 26%,OPM 同环比分别提升了 280bps / 90bps 到 20%。主要是费用大头(占收入 4 成上下)的营销费用支出仅增长 5% 的带来的利润率提升。但如上文所述,OPM 改善的幅度是在市场预期之内的。
③ 本季度从预期差和变化趋势两个角度都算有亮点的指标,是cRPO(current remaining performance obligation,即已签订合约但尚未被确认为收入的金额)在 3Q 同比增长 10.5%,较上季度提速约 50bps,且比市场预期的 9% 高。海豚投研猜测,市场对此的解读可能是:用户对采用 Agentforce 的意愿较高,发布后确实带来了新增合约,带动了 cPRO 的增长提速。这可能是当前市场叙事下,Salesforce 股价为何对 3Q 业绩反映相当乐观的一个合理解释。
而Salesforce 对 FY25 和下季度即 4QF25 的指引甚至是相对偏负面的,① 增长端,总营收和核心的订阅收入增速会进一步的放缓,② Non-GAAP 口径(剔除 SBC)下,在 3Q 季度可圈可点的经营利润率改善,按指引在 4Q 会环比走低 40bps,③ 3Q 增速达双位数的 EPS 和经营现金流,在 4Q 增速都会大幅回落到 10% 以下,④ 3Q 最大亮点-cPRO 在四季度的增速将由 10.5% 下降到~9%。
小结来看,3Q 当季业绩除了有所提速的 cPRO 增长外并无显著亮点,对 4Q 的指引更是在全部关键指标上都边际变差,看起来并不值得业绩后 10% 的涨幅。且近期 Salesforce 股价突破的节点,都于 Agentforce 的推出和上线的节点精准的一致。经过上述简要复盘,海豚投研认为,近期 Salesforce 股价的强劲表现,与近期的业绩基本面并无多大关联,主要是由于市场对 Agentforce--“AI agent” 概念下最早的商业实例的前景的乐观预期和提前反映。
因此,海豚投研此次对 Salesforce 的覆盖研究,不从常规的商业模式和壁垒优劣等角度入手,就以当前市场最关注 Agentforce 切入,尝试解答 Agentforce 和所谓 “AI agent” 到底是什么?Agentforce 能否真的给 Salesforce 带来改变投资逻辑程度的增量营收?定量来看空间有多大?后文就将围绕上述这些问题展开。
二、Agentforce -- 又是一个引领未来的新科技?
1、什么是 AI agent?
我们需要理解的第一个问题即,Agentforce 所属的“AI agent” 这一概念具体指什么?与以 ChatGPT 为例的 “Chat bot”,以 Copilot 为例的 “AI assistant”,有哪些本质上的异同点?以下讨论多少会涉及部分 “艰涩难懂” 的概念,海豚投研尽量抛开底层的技术细节,从一个我们和普罗大众便于理解的视角简要出发,让大家理解我们到底在讨论什么。
高度概括的说,“AI Agent” 相比先前各类 “Chatbot” 或 “AI assistant” 的差异主要在--AI 由 “工具性” 向 “主体性(或者说自主性)” 进化程度的不同。按 OpenAI 的设想,AI 技术通向真正 AGI(Artificial General Intelligence)的发展可分为 5 个阶段。其中,第一阶段是具备自然语言交互能力的聊天机器人;第二阶端的 AI 则具备了一定推理和问题解决能力;第三阶段即 “AI agent”,其与第二阶段 AI 技术的本质差别在,“AI agent” 不仅能提供解决方案,同时还具备自主执行解决方案的能力。
以更通俗、类比的方法来说:
① 更早出现的 ChatGPT 和 Copilot 之类,主要仍是在人类的指导下、辅助完成某些工作的“工具型” AI,或者说是“以具体任务为导向”。本质上这类 AI 技术,和我们之前使用的 “电脑”、“Office suite” 等并无质的区别,仍只是工具。
② 而 “AI Agent”(在技术成熟的理想状态下)则能够“以目标为导向”。AI agent 能自行收集必须信息、判断拆解达成目标所需的步骤、和最终落地执行的动作。人类只需要给 AI agent 设定需要实现的目标或结果,并提供所需的资源和监督。换言之,AI agent 可以类比为人类领导下的 “数字版” 员工(即管理层多次提及的 “Digital labour”),而不再仅仅是工具。
实际上,AI agent 相比 ChatGPT 等的演化路径,和 AI 技术的另一大主流应用方向 -- 自动驾驶的演化路径非常类似。如我们可能更加熟悉的,自动驾驶技术的等级可分为 L1~L5。ChatGPT 和 Copilot 可类比自动驾驶的 L2~L3 级别,能辅助驾驶员完成变道、自动刹车等辅助工作,或者在比较频繁的人类监管下实现由 A 到 B 的行驶。相比之下,AI agent 则可类比 L4 自动驾驶,即能够在没有或很少人类干预的情况下,自主实现由 A 到 B 的行驶。
从中我们也能隐约窥见,AI 的技术发展路径虽然各部相同,但颇有 “殊途同归” 之感。大模型、自动驾驶、机器人等等技术组合在一起,或许未来某日真会诞生兼具 “智能” 和 “实体”,能近乎完全替代人类劳动力的一天。
2、AI agent 离我们有多远?
以上探讨的 AI agent 是一个成熟理想状态下的概念和展望,具体能不能、何时能实现理想状态的 AI agent 是一个犹未可知的问题。Again,从底层技术的角度去探讨 AI agent 能否实现的可能性及时间节点、并非海豚投研的能力所在。我们只从普罗大众能理解的角度,简要探讨下要实现成熟的 AI agent 需要哪些关键组件和技术,以便各位自行感受 AI agent 离现实还有多远。
如前文所述,成熟的 AI agent 有能力自行完成信息收集、分析决策、落地执行,因此成熟的 AI agent 就需要兼具三大模块:
① 分析决策模块(大脑):如各类基于 LLM 的 AI 模型。以海豚投研的认知,当前的各类大模型都已具备成熟的自然语言交互能力和一定的推理和分析能力。但距离能进行长链路且能保证较高 “正确性” 的推理、分析和判断能力,以我们的认知,目前的 AI 大模型应当还需要一定时间的发展
② 感知模块(五感):能够感知并分析文字、视觉、听觉等各类信息的硬件和对应模型。硬件上,感知端应当是不存在制约的,摄像头、麦克风或各类传感器已相当成熟。目前能理解包括图片、视频、语言在内的多模态大模型目前也已有 “初见成效” 的模型存在。如近期发布的 GPT-4o 多模态模型和 Tesla 的纯视觉自动驾驶技术,都验证了目前的大模型已具备了一定理解视觉信息的能力。至于语言和文字的识别技术则就更加成熟。
③ 执行模块:正如 AGI 的 L2 和 L3 阶段的核心差异是 L3 具备了执行能力,海豚投研认为 AI agent 要成熟落地的主要难点 (之一) 也在执行模块上。一个主要问题是,诚然目前各类 AI 模型已初步具备了输出文本、PPT、语音、乃至一些简单的视频、3D 模型的能力。但这种需调用相关 API 执行的能力并不 “通用”,需要事先埋设 API、且难以穷尽。
不过以操作电脑为例,目前 AI“通用型” 的操作能力也已在研发当中。形象的说,具备 “通用型操作能力” 的 AI 能够像人类一样通过扫描显示屏(模拟人类眼睛)来获取所需信息,通过模拟使用鼠标、键盘的操作方式,来使用各类软件,而不需依赖 API。
④ 小结来看,AI agent 所需的三大模块上,目前都至少具备了初步的技术能力。以海豚投研目前的认知,目前最主要的技术难点,还是在大模型进行可靠推理、判断、通过视频、语音、语音等信息,精准认知现状(无论是物理上的、工作上的、或是人际关系上的)的能力,以及最后的执行端。
3、Agentforce 到底是何方神圣
以上更多是理想状态下对 AI agent 的愿景,在那种情形下 “数字员工” 大范围替代人力的 “未来已来”。那么 Salesforce 已经发布的 Agentforce 实际如何?是否如愿景中,已拥有了相当的 “自主工作” 的能力?
以上图为参考,高度概括来看:Agentforce 是 Salesforce 基于其底层的技术平台(PaaS)和多年累计的数据(Data),和作为 CRM 龙头数十年在 SaaS 技术和行业知识的积累(所谓 Industry know-how),并通过当前 AI 技术,将上述一起融合、揉捏在一起,塑造成各种能负责不同任务的 Agents,帮助执行包括但不限于销售、客服、营销、数据分析等方面的工作。
不过从普通使用者,以及投资人的视角,高深的技术能力和行业知识更多只是一个不易理解的 “黑箱”。我们从更形象具体的角度--通过 Agenforce 搭建一个负责处理费用报销申请的 Agent 的案例来看,Agentforce 到底是如何运作的:
① 首先第一步,大致定义该 Agent 的角色,所负责的工作内容,或工作的目标; ② 定义需要 Agent 介入的各类场景(Topics),例如收到员工报销申请、员工问询报销规章制度等情景;③ 详细定义、规范不同场景下 Agent 应当采取的行为(Action);④ 在工作流程中(workflow)中设定何时触发 Agent 介入执行,有哪些可能的处理结果等;⑤ 经过上述设置,我们就得到了一个负责费用报销的 Agent,最后一个截图是该 Agent 反馈的一次结果案例。
可以看到,目前的 Agentforce 距离理想状态下 “AI Agent” 能自行分析、拆解任务目标,做出合理判断和操作,交付预期目标尚有很远的距离。仍需事先具体且准确地去设定的角色、场景、行为、流程等,这和非 “AI 时代” 下按设定好规则办事的机器人可能仍是相近的。
但真正核心的不同之处是,上述设置过程中并不涉及代码编程,而是用自然语言来描述出对应的情形、规则、操作等即可。从这个角度,Agentforce 本质上可类比为一个 “去代码化” 的编程工具。虽然目前 Agentforce 相比人类显然仍需要更多、更精准的 “指导”,Agentforce 可能的最大价值是,给予了普罗大众(无编程能力),相对更简单方便构建自己的 “数字助力员工”,去处理一些相对简单、但繁复耗时的工作。
4、Agentforce 落地情况如何?
根据以上的例子,可见 Agentforce 目前适配的仍是相对简单、重复性的工作。而根据公司的披露,Agentforce 1.0 发布以来落地进度最快的方向是客服(service agent)。由于客服一般不太涉及决策,大多数情况下只涉及文字交流(技术难度低),且在 AI 时代之前使用机器人辅助客服服务就已是常规操作,因此 service agent 作为最快落地方向并不意外。作为范例,Salesforce 在自身官网的客户服务也上线了 Agentforce,以下是海豚投研与 Agentforce 的一次沟通,可供各位自行感受 Agentforce 与其他客服机器人或 ChatGPT 的优劣。
海豚投研的主观看法,Agentforce 的语言理解和沟通能力相比 ChatGPT 等主流 LLM 大模型,我们没有感受到明显差异。不过在用词的规范、防止 “幻觉” 或 “胡言乱语”、拒绝回答不相关问题等方面,Agentforce 相比 ChatGPT 等 C 端产品,对回答质量的 “下限” 要求更高。
而在 2024.12.17,Salesforce 举行了 Agentforce 2.0 的宣讲会,会上的主要信息包括:
① 首先提及了Agentforce 发布至今的一些成果。例如落地最快的 service agent 目前已每周处理 3.2 万次客户咨询,其中 83% 的客户咨询 Agentforce 能独立处理,相比先前需上报人工处理的案例减少了 50%。
②Agentforce 支持的使用场景将从最初上线的客服和销售外,向更多行业、更多场景、更多角色拓展。如个人的购物 agent、负责招聘的人力 agent、协助医疗、交税、教育等多方面的 agent。
③ 将Agentforce 的部署和使用范围将拓展到 Salesforce 之外的第三方平台上,例如允许用户创建的 Agentforce Agent 调用用户在 SAP 平台上的数据,或在 SAP 平台上执行相关的 ERP 操作流程。
④ 上述Agentforce 2.0 提及的功能按计划将在今年 2 月上线,而下一次的进化--Agentforce 3.0 的发布会预计会在今年 5 月左右举行。
小结此次 2.0 发布会,可见 1.0 的 service agent 看起来已取得了一定的成果,结合海豚投研了解到的调研,用户们对 service agent 的看法是比较正面的(当然渗透率并不高)。至于管理层对 Agentforce 后续发展的畅想最终落地时的质量如何,在实际产品上线前海豚投研无法凭空猜测。不过从 Agentforce 每隔 2~3 个月就更新一代的演化节奏,可以近乎确定的是,之后 Agentforce 和其代表的 “AI Agent” 技术大概率会有非常迅速的迭代和发展。
三、梦想很大,Agentforce 实际能有多大贡献?
以上我们从概念性的角度初步搞清楚了 Agentforce 到底是什么的问题,接下来我们将尝试从定量角度来分析:① Agentforce 可能为用户带来多少收益 or 节省多少费用;② Agentforce 的潜在市场空间有多大;③ 中短期内 Agentforce 有望给 Salesforce 带来多少净增量收入?
1、以 Service Agent 为例,Agentforce 的潜在市场有多大?
以目前 Agentforce 落地最顺畅的 service agent 为例,目前 Salesforce 对 service agent 的定价是$2 per conversation(实际有可能会提供一定折扣)。相比之下,据行业调研人工客服平均应答一次问询(conversation)的成本大约在$2.7~$5.6 之间。作为交叉验证,我们自行做了测算:① 据查询,美国平均一个客服员工的年工资大约在$35,000~$70,000 左右;② 按单个员工平均每周工作时间在 40~50 小时左右(有可能会更高);③ 假设平均每次沟通花费时间为 10 分钟(包括空闲等待时间)。按上述假设,海豚投研自行测算的人工客服单次沟通成本大约在$2.8~$4.5 左右,和市场调研的数据接近。
这么看,Agentforce 对 service agent 的$2 每次沟通的定价较平均人工成本低了约 45%,换言之,理想状态下若企业用户采用 service agent 代替人工客服大约能节省约一半的人力成本。但也需考虑到,目前 service agent 尚不具备完全匹配人类客服的能力(按 demo 中的展示)。因此我们认为与人工成本下限差异并不大的$2 定价,可能不具备很强的吸引了让企业用户采用 Agentforce,确实有在名义定价上给出折扣的需求。
通过以上分析可见,Agentforce 提供的 “Digital labour” 在理想状态下(假设 Agentforce 的工作能力接近人类员工)确实能够帮助企业用户节省相当可观的人力成本,因此有希望吸引企业用户采用 Agentforce 来替代人力员工。那么下一个问题是,以美国客服(customer service)为例,Agentforce 理论上的潜在市场有多大?
据调研,美国目前约有 300 万在职的人工客服岗位,参考我们以上的测算,单个人工客服一年处理 1.3 万次客户的问询,那么基于保守和乐观情景下的渗透率和单次沟通的定价,海豚投研测算出Agentforce 在客服市场有望取得的市场空间可达$20~$390 亿之间。相比 Salesforce 在 FY25 年约$90 亿的 Service cloud 收入,保守情景下$20 亿增量市场规模并算不上可观(何况这还没考虑到其他竞争对手也可能推出类似服务的竞争)。而理想状态下,AI agent 需要取得相当可观的对人工的替代率(比如至少 3~5 成),以及和人类员工接近的能力而收取较高的定价(如$2 每次沟通),才有望带来数倍于当前收入规模的增量空间。
当然,理论上随着 Agentforce 拓展到销售、教育、法律、财务等各行各业,Agentforce 理论上的总 TAM 较单一的客服行业可以再翻数倍到数十倍,可达数千亿乃至万亿美金的行业规模。再往长期看,如果 “Digital labour” 果真能在普遍情况下替代人力,其 TAM 空间之大甚至可以说 “无所不包”。但是上述这些工作对能力的要求和复杂度明显高出客服工作,且 Salesforce 目前自己都尚未搞清楚在客服以外行业,对 Agentforce 的定价方式。我们在此也就不 “强行拍脑袋” 定量测算 Agentforce 在其他全行业的 TAM 大小。简单定性来说,AI agent 的总 TAM 想象空间显然是无比巨大的,十万亿美元都不算上限,但其前提假设—“人工智能” 能够确保质量的替代人类工作,尚有些遥远。
2、Agentforce 能给 Salesforce 带来多少增量收入?
以上是从中长期视角对 Agentforce 潜在的市场规模有多大的测算,那么从中短期视角,例如 3 年之内 Agentforce 有可能对 Salesforce 的业绩产生多大的影响?
首先需要明确的一点是,如前文所述Agentforce 在 customer service 方面是采用的按次收费模式,而非原本传统采用的按 seat 收取固定服务费的订阅式收费模式。随着存量用户采用 Agentforce 替代原本的 service cloud,在获得新收入的同时,也会导致原本订阅收入的下滑。
由于公司并不披露其服务的订阅用户数量和平均客单价数据,我们只能举例来测算。对于原不同档次和定价的 Service Cloud 的用户,在假设 Agentforce 实际每次沟通收费$1,和 Agentforce 替代 20% 的原有订阅 seats 的情况下,对三档不同定价的用户 Agentforce 能贡献 37%~101% 的增量收入。对营收占比较大,参考意义更高的规模较大的两档用户,20% 的渗透率假设下,Agentforce 能带来的增量收入约为 37%~41%。
整体来看,我们假设中档的 “Unlimited” 等级用户代表了 Salesforce 全部用户的平均情况,主要看保守和中性情景下的预期,假设 2 年内 Agentforce 在客服服务上的采用率分别达到 5% 和 10%,那么能给 Salesforce Service Cloud 收入分别带来 10% 和 20% 的增量收入。贡献还是比较可观的。但如果 Agentforce 在 2 年内仅在 Cloud service 上成功落地,那么上述两种情况下 Agentforce 对 Salesforce 总收入的贡献就仅为 3%~6%,意义不大。
3、总结
回顾上文的探讨,能独立思考、工作的 “AI agent” 的概念和未来 “Digital labour” 大范围替代人力,可以说是 AI 技术浪潮以来最让人激动的,也最具 “星辰大海” 想象空间的技术发展方向。并且为实现 “AI agent” 所需的各方面技术也确实已有初步的成果,和高速迭代和发展。从我个人的看法,拉长视角下 “AI agent” 是可能有相当的概率能够实现。
但畅想之外,现实是当前的 Agentforce 仍是一个需要人类事先规范比较详细规则和流程的辅助性工具。目前 Agentforce 更多的意义可能是提供了一个无需代码就可实现办公自动化的 “编程工具”,而非一个能 “独立思考和工作” 的数字员工。
定量来看,如果 Agentforce 确实能实现接近人类的工作能力,那么其潜在的市场空间(TAM)非常可观,仅以美国客服行业未来,50% 的渗透即有近$400 亿的市场规模。若能在多种行业都能有不俗的渗透,那么数千亿乃至数万亿的 TAM 也并非不可能。
但显然 Agentforce 目前不具备接近人类的工作能力,从更现实更近的视角看,仅以客服(Service Cloud)为例,2 年内 Agentforce 可能给 Service Cloud 带来约 10%~20% 的增量收入。并不算很多,但对 Salesforce--总收入增长中枢已不足 10% 的企业,多少有边际改善营收增速的效用。
所以,作为一个发布仅数月,概念意味大于实际表现的 “Agentforce”,目前显然尚不足以给 Salesforce 带来 “x 倍” 量级的增长。对情绪、估值的拉动,强于对基本面业绩的拉动。
当然 Salesforce 也不仅只有 Agentforce,我们在下一篇中,将从更多的角度来探讨,当前的 Salesforce 是不是具备其他值得下注的亮点。