文 | 乌鸦智能说
在AI应用领域,Harvey无疑是最耀眼的明星公司之一。
今年7月,Harvey刚刚完成新一轮融资,估值高达15亿美元。这意味着,从22年底完成500万美元天使轮融资到跻身独角兽行列,Harvey只花了不到2年时间。
估值蹭蹭涨,离不开那些明星投资人捧场。Harvey的股东名单里,不仅有OpenAI这样的AI大模型巨头,还有红杉资本以及美国最大独立风险投资人埃拉德.吉尔等知名投资人。
为什么大家都这么看好Harvey?一个很重要的原因是,Harvey的经营数据跑得太好了。
在2年时间,Harvey的ARR(年度经常性收入)已经接近3000万美金了。根据Lenny的统计,过去10年时间最好的B2B SaaS产品达到100万美金的时间平均是2年,而Harvey在2年时间做到了3000万美金。
为什么Harvey能够实现这么快的增长?我们又应该如何看待AI法律的机会?
叫好又叫座的法律AI助手
很多人可能不知道,法律一直都是应用新兴技术最积极的领域。
此前,AI技术(以NLP为主)就已经应用在合同管理、诉讼预测、法律研究等领域。但大部分工作都以信息检索为主,很难对信息进行深度的处理与分析。
与过去不同,大模型对于法律AI软件能力有两方面的提升:
一是LLM可以用对话式的搜索方式,并且可以对数据内容进行总结提炼,以答案式回答细节问题。二是从“提取”到“生成”,生成能力可以应用于起草法律合同、为法官提供判决建议等。
这些能力也体现在Harvey的服务中。
作为法律AI领域的扛把子,Harvey的服务模式主要有两种:一种是通过fine-tune(微调)过的法律专家大模型,帮助律师完成合同分析、监管合规、索赔管理、尽职调查及更广泛的法律咨询服务;另一种是为客户构建定制模型,以达到更好的效果。
前者的服务场景主要有三个:工作流程自动化(如文件起草、审查、分析和总结)、法律研究和AI助理。
比如,在文件起草环节,法律工作者需要起草一份合同或者诉状时,Harvey可以根据提供的问答内容生成一个初步的草稿,律师可以在此基础上进一步修改、完善。
再比如,到了法律合同审核环节,律师需要确保法律政策与最新的法规是否一致时,Harvey也可以帮助梳理相关法规要求,并且初步分析现有政策可能存在的合规风险点。
此外,Harvey还能被用于辅助法律研究。比如,当律师正在处理一起知识产权案件,Harvey可以帮助罗列相关的法律条文、判例和学术文章,加速案件准备的过程。
除了提供与法律相关的服务外,Harvey还能帮助大型律师事务所构建自己的定制AI模型。比如,普华永道就与Harvey进行合作,训练自己专有的人工智能模型,创造定制产品,包括为普华的客户定制产品服务,简化内部法律流程等。
从目前看,Harvey的产品取得了不错的商业化成绩。根据Harvey公司员工的Brian Burns透露,Harvey的ARR(年度经常性收入)已经接近3000万美元了。
根据Lenny(国外的一个科技博客网站)的统计,过去10年时间最好的B2B SaaS产品达到100万美金的时间平均是2年,而Harvey在2年时间做到了3000万美金。
过去一年中(2023年8月-2024年8月),Harvey的用户使用率从33%大幅增长至69%。与此同时,留存率表现也不错。数据显示,Harvey的用户留存率在一年后保持在70%左右。而SaaS产品的月流失率一般在3%到8%之间,年流失率在32%到50%之间。
客户群体方面,根据Harvey透露,已经有超过1.5万家律所排队等待其AI服务,现在超100家律所已经付费用上了Harvey的产品。
目前,其官网中展示的战略合作客户中,不乏安理·谢尔曼(A&O Sherman)、普华永道(PwC)、美迈斯(O’Melveny)、礼德(Reed Smith)、麦克法兰(Macfarlanes)以及CMS等国际顶级律所及机构。
降本驱动,AI法律正处于爆发前夕
之所以AI在法律领域应用如此顺利,主要得益于两个原因:律师成本太高,降本需求强烈;以及大模型技术与法律业务逻辑高度匹配。
作为一个依靠人力的知识密集型行业,律师的雇佣成本很高。以北京为例,2019-2023年北京律师年均创收高达84万元。即使在最低的内蒙古,律师年均创收也有16万元。在美国等发达国家,这个数据还要更高。
昂贵的人力成本,使得律师事务所更有动力推动AI技术的落地,来实现成本下降。而法律行业以知识+文本为主的业务模式,也与大模型技术特征高度匹配。
首先,法律有相当大比例的工作是文本处理,这恰好是AI擅长的领域。其次,法律工作内容都有非常强的知识性,而大部分知识都有现成的文本材料可供参考,降低了大模型学习的成本。
得益于以上两点,AI法律行业正在快速发展。仅仅2023年,AI法律行业就从9.4亿美元,上涨到23.9亿美元,增速超过250%。
展望AI法律赛道的发展,有两个趋势值得关注:
首先,优质数据的价值在不断提升。由于法律领域对信息的准确性要求很高,自然也对数据质量提出了更高的要求。但与此同时,出于数据隐私保护等原因,大模型企业获得行业数据的途径有限。
数据问题是所有AI法律公司都必须面对的问题。目前,解决数据来源问题的方法主要有两种:
一是与大型律师事务所展开合作,在满足客户合规需求基础上,获取数据。比如,Harvey已经与Allen & Overy等大型律师事务所展开合作。
二是通过收购的方式来获得更多的行业数据。去年,汤森路透以6.5亿美元的价格收购AI法律公司Casetext,看中的就是其在过去服务客户过程中所建立的数据优势。截至被收购前,Casetext 的客户有1万多家律师事务所与公司法律部门。
今年,Harvey曾一度计划收购vLex,但是收购最后没有成功。vLex就是一个全球法律智能平台,为法律专业人士提供广泛的法律和法规信息库,涵盖了来自 130 多个国家的法律和法规信息,拥有全球最大的法律和监管数据库。
其次,将AI融入法律领域,需要对行业需求的深刻理解。Harvey CEO Winston Weinberg在此前接受采访时披露,公司30%左右的员工都是法律背景。
这些法律领域的专家作用是,围绕特定法律任务构建定制的工作流和流程。Weinberg说,只有有经验的律师才能在任务层面对复杂法律工作的组成和分解有深厚的专业知识,但这种类型的“流程数据在任何地方都不公开”。
总结
当所有人都在寻找大模型应用的背景下,Harvey受到投资人追捧还有另一个更重要的原因是,由于数据隐私的存在,法律AI应用很难被通用大模型取代。
现在大部分AI应用创业者都会面临一个问题:当模型能力越来越强,怎么保证模型不会吃掉应用产品的服务场景。
而法律就给我们提供了一个很好的思路。由于法律对数据隐私的重视,有价值的数据很难公开获得,但输出质量又高度依赖于这些专业数据。所以至少从目前看,通用大模型很难对法律领域的专业模型产生冲击。