近日,注意到,谷歌于近正式推出了Gemini 2.0系列人工智能模型的首个版本——Gemini 2.0 Flash。该模型不仅提供聊天版本供全球用户使用,还推出了一个实验版模型,供开发人员免费使用,这个版本具有文本转语音和图像生成功能。
谷歌声称,Gemini 2.0是Agent时代迄今为止最强大的AI模型。与前代相比,它在速度上快了两倍,并且比参数量更大的Gemini 1.5版本更加强大。此外,该版本在性能、多模态性和原生工具方面都有所增强。
谷歌CEO桑达尔·皮查伊表示:“如果说Gemini 1.0是关于整理和理解信息,那么Gemini 2.0就是要让这些信息真正变得有用。”Gemini 2.0在代码生成和提供事实正确响应的能力上都有所提升,满足了更多用户请求。
不仅如此,谷歌还推出了新的多模态实时API,支持实时音频、视频流输入和多个组合工具的使用。同时,谷歌还展示了三个智能体研究原型:Project Astra、Project Mariner和Jules。这些原型展示了AI从被动的信息处理工具转变为能够主动思考和行动的智能助手的潜力。
其中,Project Astra尤为引人注目。它是一个系统级的智能体助手,可以整合Google应用如搜索、地图和Lens,通过文本、语音、图像和视频回答问题并执行任务。在演示中,Astra展现了强大的记忆能力、流式处理功能和原生音频理解能力,为用户提供了更加个性化的服务。