3 月 24 日消息,谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实,谷歌已开始向 Gemini Live 推出新的人工智能功能,这些功能使其能够“看到”你的屏幕内容,或者通过你的智能手机摄像头获取画面,并实时回答与之相关的问题。这些功能是在谷歌首次展示为其提供技术支持的“阿斯特拉项目”(Project Astra)近一年后推出的。
注意到,谷歌公司在去年 5 月召开的 2024 年 I / O 开发者大会上,曾展示了基于 Gemini 的全新 Project Astra 项目,可以本地运行在 Pixel 手机上,被看作是对标 OpenAI GPT-4o 的最新模型。
谷歌表示 Project Astra 是最新的多模态 AI 项目,用户打开摄像头,该多模态项目可以直接解释用户画面中物品。