“过去24个月,AI行业发生的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度董事长兼首席执行官李彦宏在百度世界2024大会上发表了主题为应用来了的演讲,同时发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。据悉,文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码工具“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。
百度董事长兼首席执行官李彦宏。
截至11月初,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,增长约30倍。李彦宏表示,“这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。”演讲中,李彦宏再次强调,智能体是AI应用的最主流形态,即将迎来爆发点,它将成为AI原生时代,内容、信息和服务的新载体。
“如果你要问我,过去这24个月,对这个行业而言,最大的变化是什么?我的回答一定是,大模型基本消除了幻觉,它回答问题的准确性大幅提升了,这让AI从‘一本正经的胡说八道’变得可用、可被信赖。我们知道,大模型是一个概率模型,生成的内容具有不确定性。采用RAG技术后,大模型会利用检索到的信息来指导文本或答案的生成,从而极大地提高了内容的质量和准确性。”李彦宏表示。
李彦宏透露,今年年初,百度决定要解决图像生成的幻觉问题,于是开发了iRAG,即image based RAG,检索增强的文生图技术,“之前,完全基于大语言模型的文生图系统,生成的图片常常是‘一眼假’,甚至是逻辑不合常理。百度的iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了机器味儿。”
在发布会上,李彦宏还发布了无代码工具“秒哒”,“秒哒是一个不需要写代码就能够实现任意想法的软件,一个由大模型和智能体组成的全新的软件,我认为它是‘迄今为止人类历史上最复杂的多智能体协作工具’,它包括无代码编程、多智能体协作以及规模化地调用各种工具等能力。注意,秒哒是跟任何辅助代码生成工具很不一样的,因为它根本不需要你能看懂代码。”
李彦宏表示,“有了秒哒,一个人通过自然语言交互,就可以完成一整套系统的搭建,还可以做任意场景下的各种应用,应用的复杂度也会随着我们技术的提升不断提升。最早开始的时候,它只能做一些比较简单的编程,比如说两三百行代码,以后随着基础模型能力提升,以及秒哒本身技术能力的演进,它就可以做越来越多的,越来越复杂的事情。这意味着什么?这意味着你不需要去招募项目经理、设计人员、开发人员、测试人员等等,自己就可以指挥多个智能体来协同完成任务。也就是说,只要有想法,你就可以心想事成,我们将迎来一个前所未有的只靠想法就能赚钱的时代。以前有个想法,你还要去执行,把想法做出来。现在只要你有想法,秒哒就可以帮你做了。”
采写:南都记者 汪陈晨