讯 (记者黄磊)11月19日,百度创始人李彦宏在2024中国5G+工业互联网大会上,发表了主题为大模型促进科技创新和产业创新的演讲。
据悉,截至11月初,百度文心大模型的日均调用量达到15亿,相较5月披露的2亿增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。李彦宏表示:“大模型调用量高、增速快,表明有越来越多的应用在使用文心大模型。”
多模态大模型开始广泛应用
李彦宏表示,过去24个月,大模型最大的变化就是基本消除了“幻觉”。如今,文字层面的检索增强(RAG)已经做得很好,让大模型变得可用、可被信赖。
同时,图像等多模态技术要实用,也需要准确性和可控性,从而拓展AI应用空间。
李彦宏介绍,百度花了很多精力解决图片生成的“幻觉”问题,开发了检索增强的文生图技术iRAG(image based Retrieval-Augmented Generation),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。
“现在用文心多模态模型进行生成,可以去掉‘幻觉’,去掉所谓的‘AI味’,生成的图片看上去更真实,保留了准确性。”李彦宏认为:“未来多模态的检索增强也会有快速的发展,从而使得多模态大模型进入更加实用的阶段。”
超5000家企业申请测试无代码工具“秒哒”
除了检索增强技术,大模型另外一个重要发展方向是智能体,而智能体的最终极形态是多智能体的协作。11月12日,百度在百度世界2024大会上发布了无代码工具“秒哒”,这是一个非常复杂的多智能体协作应用。和其他辅助代码生成工具不同,“秒哒”不需要人们看懂一行代码,可以让非程序员具备程序员的能力。涵盖无代码编程、多智能体协作以及多工具调用等特点,只需通过自然语言,就能构建出各种应用。
李彦宏公布了“秒哒”的最新进展:“秒哒”发布后仅仅3天,就有超过5000家企业排队申请测试。
“全球大概现在有2800万程序员,但全球有80亿人口,绝大多数人是看不懂一行代码,无法用编程的方法来解决问题。当每个人都具备程序员能力的时候,对整个社会的生产力是一个极大的释放。”李彦宏说。
大模型在自动驾驶领域应用广泛
基础大模型的能力已经就绪,应用驱动的产业创新正在快速落地。
李彦宏举例,大模型在自动驾驶领域也有非常好的应用,现在讲的端到端、纯视觉大模型、L4级无人自动驾驶,背后都是大模型技术。百度的最新一代无人车,是世界上唯一一款前装量产的L4级无人车。
据了解,百度从2013年开始布局自动驾驶,2017年推出了全球首个自动驾驶开放平台 Apollo。今年5月,百度率先发布了全球首个L4级端到端的自动驾驶大模型Apollo ADFM,可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员10倍以上。搭载这一大模型的自动驾驶开放平台——Apollo 10.0版本,也即将面向全球用户发布,这一升级将大幅提升自动驾驶开放平台的安全性、智能化和易用性。
“我们应该真正利用好人工智能这次新的工业革命,利用好大模型,为各行各业赋能,为社会生产效率提升,为人的美好生活做出更好的贡献。”李彦宏最后说道。