文|数据猿
AI初创公司Anthropic于2024年11月发布了一款计算机使用的AI Agent。该代理通过大模型Claude 3.5 Sonnet,可以实现移动光标、单击按钮和键入文本,以及填写表格、导航网站以及与软件应用交互等计算机操作。
今年的1月23日,OpenAI公司模仿Anthropic也推出了名为Operator的计算机使用AI Agent,并将其描述为“一个可以去网络为你执行任务的代理”,可以与网络上的“人们每天使用的按钮、菜单和文本字段”进行交互,自动执行如会议安排、表格填写、餐厅预订等个性化任务。
这些AI Agent是妥妥的机器人流程自动化(RPA)系统,不过其背后依靠了一个自然语言大模型(LLM),其应用创建比RPA更简单、方便和智能。
自动化技术的发展一直是科技行业内最受关注也最容易引起争论的话题,除了降低成本、提高效率备受欢迎外,替代人们完成重复性工作,甚至替代部分人的工作,最受诟病。
随着基于LLM的AI Agent的应用,人们越来越多地关注其对传统RPA的影响,会不会通过AI增强功能对现有技术与品牌进行重塑呢?
AI Agent与RPA,并行的两条“车道”到了交汇的时候
AI Agent和RPA其实是两个完全不同的技术领域,一个就像热衷于学习一切的“实习生”,另一个就像一台可靠的办公室中的复印机,日复一日地地工作。
2023年,全球人工智能市场价值约为1366亿美元,预计从2023年到2030年,它将以37.3%的惊人复合年增长率增长。其中,AI Agent是AI落地应用的主要手段。
与此同时,RPA软件市场在2022年的收入约为29亿美元,预计到2025年将达到60亿美元大关。
尽管众人皆知AI Agent是“未来”,RPA融入AI Agent是大势所趋,但是AI Agent与机械性较强的RPA的区别仍然分明。
AI Agent与RPA虽然是两种不同的技术,但是其应用效果却惊人的一致。AI Agent虽隐藏于大模型下,但实际上是一种能够独立做决策、自动运行的人工智能技术,无需人类时刻指引。它就像数字夏洛克·福尔摩斯,能从数据中探寻线索、汲取教训并调整自身策略。
AI Agent的特点日益鲜明,如自主性,不需要像“霸道父母”般时刻监督,能自行、自动开展工作。学习能力强,工作时间越长,就越“聪明”。
同时拥有更强的适应性,当应用环境发生改变(如市场、趋势变化,或者出现大量新数据),AI Agent能调整策略。
以医疗保健为例,实时分析患者数据的AI Agent,会动态调整治疗计划,提高治愈率,降低再入院率。
RPA本质上是一组软件机器人,执行重复性任务,让用户不必亲自操作,可以说是重复性工作的得力助手。当然RPA不会像人一样,抱怨这些重复性工作的枯燥、无趣。
RPA和AI Agent一样,能够实现任务自动化,处理枯燥、繁琐的工作如会计核算,让用户能专注更有价值的工作如管理会计。处理任务极为迅速,如发票录入和数据库迁移。
同时,RPA属于非侵入性集成,无需拆除整个IT基础设施,就像给房子扩建而非重建。同时可扩展性高,工作量增加时,只需启动更多机器人,且无需额外空间或特殊支持。如电商的物流部门使用RPA机器人应对季节性订单激增问题,确保订单处理顺利进行。
同样,AI Agent与RPA也有显著的区别。AI Agent和RPA都扮演着重要的角色,但在一些关键方面存在显著差异:
核心功能方面,AI Agent展现出高度的智能化,借助机器学习来解决问题,并且能够以富有风格的方式处理复杂的任务。
而RPA则更像是一位忠实的伙伴,会严格遵循给定的指示来完成各项任务。它缺乏创造力,也没有那种灵光乍现的“顿悟”时刻,每天的工作就像按照写好的剧本,稳扎稳打地进行,踏踏实实地完成既定的任务。
学习能力方面,AI Agent具备强大的学习能力,能够从成功和失败的经历中吸取教训,并据此进行自我改进,如同一个人在工作中不断历练,从而提升自己的技能水平。Forrester 2023年的一份报告就显示,在客户服务场景中使用AI Agent的公司,其投诉解决时间缩短了30%,充分体现了AI Agent卓越的学习和优化能力。
与之形成鲜明对比的是RPA就像一个有固定功能的设备,不会学习,始终按照预设的指令去执行任务。
用例复杂性方面,AI Agent适用于处理复杂且需要智能决策的任务。当面临需要预测趋势、解释人类语言等这样充满挑战性的任务时,AI Agent能够凭借智能分析来理解和处理复杂的信息,寻找解决方案。
RPA则更擅长处理那些简单且重复的工作,如获取数据、记录信息、进行勾选等操作。
灵活性和可扩展性方面,AI Agent具有较高的灵活性,当外界条件发生变化时,它能够及时做出调整以适应新的环境。不过,AI Agent在扩展时可能需要更多的计算资源。
RPA则在扩展方面具有显著优势,非常容易进行扩展。如果需要提高产出,只需增加同样型号的机器人即可。例如,一家大型保险公司在自然灾害后的索赔处理激增期间,部署了200多个RPA机器人,加快了赔付速度,并将客户满意度评级提高了近20%。
AI Agent和RPA在业务应用中各有其专注的领域。
AI Agent在客户服务领域,其应用表现为具备超强能力的聊天机器人,不仅能给出答案,还可理解上下文并解决问题,使客户愿意与之交流;在医疗保健诊断领域,借助AI驱动的图像分析,可在扫描中发现早期预警信号,辅助医生治疗;在财务预测方面,能够预测市场趋势,助力CFO采取数据驱动的行动;在供应链优化领域,可依据情况变化不断调整物流,面对如卡车延误、港口关闭等状况也能有备份计划。
而RPA在数据迁移领域,能将信息从旧系统迁移到新系统,避免团队进行繁琐的复制粘贴工作;在发票处理方面,输入发票详细信息的速度极快;在人力资源入职领域,可自动化完成招聘新员工时枯燥的管理工作;在报告生成领域,能为每周统计文档收集和格式化数据,方便使用者周一登录时直接使用。
从功能特性来看,AI Agent具备强大的智能分析与决策能力,而RPA主要是流程自动化,像数据迁移、发票处理、人力资源入职以及报告生成等,更擅长处理重复性、规律性强的事务,通过自动化操作来提高效率。
从应用场景来看,AI Agent主要聚焦于需要专业知识和深度理解的领域,以提供智能决策支持。RPA 则集中在那些基于规则、流程固定的业务流程,致力于简化流程和节省人力。
在很多企业业务流程中,二者可以相互补充。如在一个大型项目里,RPA可以先进行数据收集和整理,然后AI Agent对这些数据进行深度分析,为决策提供依据,共同服务于企业数字化转型,提升企业运营效率和竞争力,帮助企业在不同层面实现业务优化。
目前,大量企业都已经部署了RPA,很多业务流程的自动化也依赖RPA。Gartner报告中预测,到2023年底,90%的大型和超大型组织将部署某种形式的RPA,到2024年,75%的政府将启动或实施至少三项超自动化计划。
而AI Agent虽然前景被看好,但是应用相对较少,还没有进入大规模推广阶段。
从RPA到AI Agent,开启企业自主运营新纪元
在AI技术迭代浪潮中,企业自动化技术正经历革命性跃迁。传统RPA与AI Agent的显著差异正引发行业两极分化。相较于仅能执行预设规则的RPA,AI Agent通过整合LLM实现认知升级,其核心在于实时学习推理与动态决策能力,不仅是工具升级,更是将机械自动化转化为智能决策的范式变革。
从RPA到AI Agent,实现了技术本质的升维。AI Agent为带LLM的RPA。传统RPA依赖结构化数据,而AI Agent通过LLM解析复杂场景,典型应用如贷款谈判场景:系统基于既定目标逆向构建对话策略,结合实时上下文、历史数据、法律条款等多维度信息进行动态决策。这需要像人类般理解对话潜文本,而非简单遵循决策树。此类复杂场景已超越传统自动化的边界。
传统RPA在工作方式上相对固定,而AI Agent具备实时学习与适应的能力,能够展现出更细致、更接近人类的处理水平。这种适应性在处理复杂的信息驱动型任务时尤为重要,因为此类任务往往无法通过简单的重复和数据传输来有效解决。本质上,AI Agent为工作流程带来了更强的适应性与灵活性,使其更能应对现实世界场景中充满的不确定性。
从RPA到AI Agent,市场格局将重构。2018-2023年间AI与RPA的渐进式融合在2024年迎来质变。安德森·霍洛维茨基金在行业白皮书中预言“AI将吞噬RPA世界”。IntellectAI首席技术官Deepak Dastrala则揭示深层动因:RPA作为战术工具专注规则性任务,而AI Agent通过数字孪生技术实现人类工作模式的战略重构。
Layerup首席执行官Arnav Bastilla更描绘出未来的发展图景:“通用自动化软件将让位于垂直领域专家型代理,这些专用系统能端到端解决行业特定问题。”
从RPA到AI Agent,进化压力具有“双重性”。尽管部分厂商将AI Agent包装为“RPA 2.0”进行概念营销,但是需要突破根本局限:在保持效率优势的同时,必须解决复杂场景适应性、持续进化能力等关键问题。
尽管AI Agent能够处理比RPA更为复杂的任务,但要实现完全自主的预期,其表现可能还有所不足。比如,AI Agent虽然可以处理和分析海量数据并做出明智决策,然而在确保输出结果的准确性和相关性方面,仍然需要大量人工监督。
正如业内人士警示,若AI Agent仅停留在流程自动化层面,或将重蹈RPA被替代的覆辙。这场技术革命的终极考验,在于能否建立超越人类预设的真正自主智能体系。
AI Agent是带有LLM的RPA,虽然前景可期,但要想真正发挥潜力,仍有许多挑战需要克服。
无论是大型科技公司还是初创公司,都看好AI Agent将成为未来的关键趋势。随着技术的发展,人们逐渐减少对LLM的关注,转而更加重视在工作流程中应用AI Agent。
英伟达CEO黄仁勋建议将所有IT部门演变为专注于AI Agent的HR。黄仁勋强调AI Agent可通过自动化高级任务来改变行业,提高生产力和创新能力。
Microsoft CEO Satya Nadella也强调AI Agent将成为员工队伍的重要组成部分,并将此转变类比为近年来的RPA兴起,并对将AI Agent集成到现有系统中以提高效率持乐观态度。
然而,现实情况或许并未完全如预期发展。行业曾预测RPA将自动执行大多数基础工作,使团队能够专注于更高级别任务。如今,部分行业专家认为AI Agent正在经历与RPA类似的阶段。
将高级RPA更名为AI Agent,往往是一种借助AI热度的营销手段。今年很多初创公司热议AI Agent,但多数技术本质上是RPA,不过这会促使这些初创公司开始思考AI Agent循环相关问题。
当前AI Agent的框架与RPA高度相似,唯一不同在于引入了LLM,但即便如此,要将其适配到实际工作流程,仍感觉像是采用了一项10年前的技术。
当前部分初创公司推广的AI Agent基本基于RPA框架,这种趋势非常明显。虽然随着时间推移会向真正代理技术发展,但要成功实现,必须攻克可扩展性、互操作性以及准确的上下文理解等难题。
尽管转型势头凶猛,RPA厂商仍面临关键挑战:如何将传统RPA的2000+API接口与AI Agent的神经符号系统兼容;大模型推理成本使部分自动化场景ROI转为负值(据Forrester调研,43%企业暂缓部署)等。
埃森哲技术总监指出:“当前所谓AI Agent仍是增强型自动化,真正具备战略决策能力的代理不足5%"。
现在来看,AI Agent是RPA的升级而非替代品。自主代理专为处理复杂任务而设计,不过自主代理能否真正满足行业期望,目前仍存在诸多争议。一种理想的方式可能是将RPA和AI Agent相结合,充分发挥这两种技术的优势,以此达到最佳的应用效果。
IDC预测,到2026年RPA市场将分化为两大阵营:专注基础自动化的“流程工匠”与提供认知服务的“智能代理服务商”,后者市场份额有望突破60%。这场竞赛的终局,或将决定谁能在万亿美元企业智能化市场中占据制高点。
“所有”的RPA公司都加入了AI Agent竞赛
在生成式AI技术催化下,全球头部RPA厂商正加速向AI Agent赛道迁移。据Gartner最新报告,超过92%的RPA企业已将大语言模型(LLM)集成纳入产品路线图,一场围绕“自动化+认知智能”的产业革命正在重塑行业格局。
几乎所有的RPA公司都加入了AI Agent竞赛,纷纷将AI Agent融入其产品和服务中,以提升自动化能力、优化业务流程,并探索新的市场机会。去年8月,Gartner发布了《2024机器人流程自动化(RPA)魔力象限》报告,涉及13家RPA厂商,堪称行业的风向标。
产品基因重构是RPA厂商正加速向AI Agent赛道迁移最重要的战略路径之一。RPA领域的头部企业UiPath于2023年推出Autopilot智能中枢,将GPT-4与流程挖掘深度耦合,实现自然语言指令自动生成自动化脚本。其最新演示显示,用户通过语音描述“优化应付账款流程”,系统在3分钟内构建出包含异常处理逻辑的完整RPA流程。
领导者象限中的另一家企业Automation Anywhere推出了AI + Automation Enterprise System,将GenAI流程模型与其传统的自动化平台相结合,以改善客户的工作流程自动化。该系统的一项突破性的新功能是能够使用新的AI Agent Studio构建自定义AI Agent。
而AI Agent Studio开发平台,为所有级别的开发人员提供了低代码工具,以轻松构建、管理和治理自定义AI Agent。同时允许企业将内部知识库与ChatGPT、Claude等大模型组合训练垂直领域代理。其与德勤合作打造的财务稽核AI Agent,在测试中实现98.6%的异常检测准确率。
被SS&C收购的Blue Prism则推出AI Fabric模块化架构,支持灵活接入各类LLM。其与Anthropic合作的医疗理赔处理代理,通过Claude模型解读非结构化病历,将理赔决策周期缩短70%。
进入象限的国内企业来也科技也发布了三款基于数字化劳动力平台的AI Agent数字员工产品,分别是数字员工开发助手、知识管理和问答助手,以及文档审核与风控助手。
数字员工开发助手自动解析复杂Excel,按需生成自动化流程,简化开发并降低成本。扩展命令库能迅速产出Python代码,与RPA产品无缝对接,提升代码复用率和开发速度。
知识管理和问答助手结合大模型、RAG、RPA和IDP技术,实现了对这些文档的自动化理解和知识生成,为企业提供了一个智能化的解决方案。
文档审核与风控助手提升企业文档处理的效率和准确性,保障企业现金流管理和业务运营风险的控制。
去年5月,国内著名的RPA企业达观数据发布了智能数数字员工Agent平台,融合了RPA的高效执行能力和“曹植大模型”的先进语义理解技术,实现知识库和大模型结合的企业应用。
在达观智能数字员工平台中,RPA作为数字员工的执行核心,自动化处理重复性任务。曹植大模型则赋予其理解复杂语言和任务规划的能力,使数字员工能够精准捕捉并响应用户需求。
此外,通过知识管理系统,数字员工能够存储和利用历史数据,优化任务执行策略。这种结合不仅提升了企业运营的效率,还可推动业务流程的智能化和自动化。
RPA企业正在积极推进RPA与AI Agent的技术融合实验。Automation Anywhere最新专利显示,其正在研发“长期记忆存储层”,使AI Agent能持续积累业务决策模式。在客户服务场景测试中,代理对重复问题的响应速度提升40%。
在多模态突破上,WorkFusion推出支持图像理解的RPA+代理混合系统,在保险定损场景实现图片损伤识别与理赔逻辑联动的端到端自动化。
在仿真训练场上,微软研究院与UiPath联合开发“Automation Gym”虚拟环境,AI Agent可在模拟业务系统中进行强化学习,某银行测试案例显示代理经48小时训练后,信用卡审批流程优化效率超过人类专家。
国内企业实在智能自研垂直“塔斯(TARS)大语言模型”,在全行业首发产品级别Agent落地产品RPA Agent智能体(TARS-RPA-Agent),通过“自然对话式交互和超自动化执行打造全能业务专家”,再次大幅降低“数字员工”构建门槛,真正实现人人可用。而新版Agent 7.0实现了多代产品能力集成:实现一代RPA、二代IPA数字员工元素拾取、组件、流程编排等全部能力集成。
RPA厂商正加速向AI Agent赛道迁移另一个战略路径就是生态卡位战。RPA厂商纷纷与云服务绑定,如Automation Anywhere与AWS Bedrock达成战略合作,客户可直接调用Amazon Titan等基础模型;微软将Power Automate与Azure OpenAI深度集成,实现RPA流程与Copilot智能体的无缝交互。
云扩科技通过其Formation计划,与合作伙伴携手打造RPA商业新生态。云扩不仅自主研发先进AI技术,还集成了全球各大技术伙伴的领先AI能力,从自动化到智能化,驱动企业生产力变革。
金智维先后与中国人工智能产业发展联盟(AIIA)、百度AI加速器等达成生态合作关系。金智维推出的信创版本全面适配了国产主流的基础软硬件,进一步强化了其在数字化转型中的技术实力。通过引入AI代理,金智维的RPA解决方案能够更好地适应复杂业务场景,提升自动化效率。
同时,RPA与合作伙伴合作,在垂直领域攻坚。如UiPath联合麦肯锡推出制造业智能代理解决方案,通过设备传感器数据与LLM的实时交互,实现预测性维护决策自动化;国内来也科技发布“政务AI办事员”,集成70+地方政府办事规程知识库。
在开发者生态构建方面,不同企业都展开激烈竞争。如Pegasystems设立1亿美元AI Agent创新基金,吸引ISV开发行业专用代理;SAP在AppCenter上线AI Agent市场,提供200+预训练场景化智能体。
RPA公司积极布局AI Agent,AI驱动的自动化惠及更多企业
AI Agent的潜在市场影响是巨大的,AI驱动的自动化将成为各个行业业务运营的基石。
在AI进步的推动下,各个行业的运营自动化方式将发生了重大转变。随着企业越来越多地采用AI Agent来完成更复杂和动态的任务,对传统RPA解决方案的需求可能会下降。
Gartner关于RPA行业的魔力曲线报告数据显示,最近几年融合AI的RPA软件市场一直在持续高速增长。到2022年RPA软件市场达到28亿美元,增长率降到了22.1%,仍是全球软件市场增长的两倍速。即便是在生成式AI和大语言模型凶猛来袭的2023年,RPA仍然保持了22%的市场增长率,同时市场规模也达到了32亿美元。
Gartner认为,AI尤其是GenAI正在成为RPA的核心部分,能够推动RPA更简单的深入应用。RPA供应商正在大力投资GenAI,以帮助客户开发自动化。大多数供应商都专注于创建基于提示的开发功能,将自然语言请求转换为自动化工作流程,使得自动化开发的技术性较低,并且更广泛地可供组织中的平民开发人员使用。
融合GenAI之后,需要更强大的原生集成、第三方解决方案和编排能力。目前大多数RPA供应商通过支持多种自动化技术(包括IDP、BPA、对话式AI、LCAP、流程挖掘、任务挖掘、测试自动化和iPaaS)来提供超越RPA的平台。这种融合到更大的自动化平台,需要跨原生集成和第三方解决方案的强大编排能力。
然而AI Agent的成本效益和实际优势仍然存在不确定性,公司必须权衡采用AI Agent的好处与相关成本以及对现有工作流程和系统的潜在中断的风险。
从RPA到AI Agent过渡需要仔细规划和实施,以确保AI Agent顺利有效地集成到现有流程中。AI Agent在市场上的未来充满希望,但它也需要一种现实且慎重的方法来充分实现其潜在优势。
虽然RPA与AI Agent走向融合,但是用户在应用时依然面临选择问题。
首先AI Agent和RPA都有自己的局限性。其中AI Agent限制最明显的是数据依赖性。如果你向它提供垃圾数据,你就会得到垃圾结果。
实施复杂性,麦肯锡发现,53%的公司难以找到人才来实施先进的AI系统。另外投资也高。
RPA限制包括维护开销大,更改底层系统,就必须重新训练或重新编程机器人。可扩展性问题,您可以添加更多机器人,但最终管理与协调问题不容忽视。
实际上,大多数企业从小规模开始使用RPA来处理繁重的工作,然后引入AI Agent来处理棘手的事情。
在数字化转型的浪潮中,RPA公司积极布局AI Agent,敏锐捕捉到AI Agent与自身业务融合的巨大潜力。借助AI Agent强大的理解、分析和决策能力,RPA将原本依赖规则和预设流程的自动化,升级为能根据复杂多变的实际情况灵活应对的智能自动化体系。
随着AI驱动的自动化逐步落地,越来越多企业从中受益。繁琐的业务流程得以高效简化,企业运营成本显著降低;同时,智能决策的引入,让企业在市场竞争中能够更迅速、精准地把握机遇,做出更科学合理的战略规划,从而提升整体竞争力,在数字化时代抢占先机。