11月12日,以“应用来了”为主题的百度世界2024大会在上海盛大召开。百度首席技术官王海峰在会上宣布,文心一言的用户规模已达到4.3亿,这一数据再次彰显了百度在人工智能领域的领先地位。同时,王海峰还深入解读了文心大模型的最新技术及应用,包括检索增强的文生图、无代码产品秒哒、文心快码等,进一步展示了百度在AI技术上的不断创新与突破。
自去年3月16日发布文心一言以来,百度文心大模型持续快速迭代,不断进化。王海峰在大会上介绍,百度在检索增强方面取得了显著进展,研发了「理解-检索-生成」协同优化的检索增强技术,这一技术极大提升了大模型的应用效果。通过这一技术,文心大模型能够更好地理解用户需求,精准检索相关信息,并生成高质量的内容。
面向不同应用场景的生图需求,百度进一步研发了检索增强的文生图技术。该技术不仅能够生成精确的图片,还能够进行泛化生图,满足不同用户的多元化需求。王海峰详细阐述了这一技术的实现过程:首先,基于大模型对用户的需求进行分析理解,自动规划精确或泛化方案;接着,在增强阶段,对需要增强的实体,检索并选择相应的参考图;最后,在生成阶段,利用自研的多模可控生图大模型,通过局部注意力计算和整体注意力计算,实现图像的高泛化生成和高精确生成。这一技术在实际应用中已经取得了显著成效,支持用户上传参考图,根据用户期望进行生成,极大地提升了用户体验。
除了检索增强的文生图技术外,百度还发布了智能体机制,并研制了系统2。王海峰表示,系统2的核心是思考模型,包括理解、规划、反思和进化四个部分。通过这一模型,机器能够像人一样思考和行动,自主完成复杂任务,并在环境中持续学习、自主进化。这一技术的推出,标志着百度在AI领域的又一重大突破,为未来的智能化应用提供了更加广阔的空间。
为了完成更加复杂的任务或项目,智能体之间的协作变得尤为重要。王海峰在大会上分享了多智能体在代码场景里的应用——秒哒和文心快码。秒哒采用了智能体的中心化模式,其中的代码智能体通过场景知识的增强,提升了复杂代码生成的质量与稳定性,高效实现用户需要的功能。而文心快码作为智能代码助手,已经升级至3.0版本,具备完成系统功能开发、代码测试和问题修复等能力。在开发全流程中,多个智能体流水线协同工作,大幅提升了程序员的工作质量和效率。
面对产业需求,百度打造了文心大模型矩阵,包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型。这些模型能够满足不同应用的需求,为产业提供更加高效、智能的解决方案。同时,文心大模型和飞桨深度学习平台的联合优化,持续创新,提升了模型效果、训练效率和推理性能,为文心大模型的广泛应用提供了有力支撑。据王海峰披露,目前飞桨文心开发者数量已达1808万,服务了43万家企业,创建了101万个模型。
随着人工智能技术的加速进步,AI在千行百业的应用也越来越深入。在教育科普领域,中国科学技术馆与百度达成战略合作,双方将利用人工智能技术为科普教育注入新活力,赋能智慧科技场馆建设。大会现场,中国科学技术馆馆长郭哲与王海峰共同发布了“科技馆智能体”,这一智能体将助力科普服务触手可及,让更多人享受到科技带来的便利和乐趣。
科学技术的发展和广泛应用离不开人才的支持。百度始终重视人工智能人才的培养工作,并已为社会培养了592万AI人才。这一成绩的取得,不仅得益于百度在AI技术上的不断创新和突破,更得益于百度对人才培养工作的高度重视和持续投入。未来,百度将继续投身人才培养工作,为社会的智能化发展提供更多的人才保障。
最后,王海峰在大会上笃定地透露,文心大模型仍在持续训练中,更强大的新版本值得期待。(文智)