今日,谷歌正式发布了视频生成模型Veo 2。
据介绍,新模型可以更好的理解现实世界物理、人类运动及表达的细微差别,进一步提升整体细节和逼真度。
具体来看,谷歌 Veo 2 模型可以生成分辨率最高 4K(4096×2160 像素)、时长2分钟的视频片段,相比较 OpenAI 的 Sora 模型,分辨率是后者的4倍,时长是后者的6倍。
与前代Veo一样,Veo 2可以在给定文本提示或文本和参考图像的情况下生成视频,还可以更真实地模拟运动、流体动力学和光的属性,包括不同的镜头和电影效果。
通过谷歌发布的宣传视频来看,画面中人物细节刻画细腻,远近、明暗交替过渡自然。
与此同时,谷歌还发布了一款名为 Whisk的全新AI图像生成工具。
据官方介绍,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示:用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。
同时,谷歌还发布了其新一代人工智能大模型——Gemini 2.0,号称“为智能体时代设计”。
据谷歌介绍,Gemini 2.0带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。
在关键基准测试中,Gemini 2.0相较于前代Gemini 1.5 Pro性能大幅提升,速度至高提升两倍。这一速度提升意味着,用户将得到更高效的处理能力和更快的响应时间。
具体来看,Gemini 2.0采用了最新的机器学习和深度学习算法,提升了神经网络的结构和效率,核心特点在于其强大的多模态能力:支持原生图像和多语言音频输出,以及原生工具使用。
也就是说,Gemini 2.0预计能够更好的理解和生成自然语言,增强了人机交互的智能性。
看完了谷歌全新发布的AI系列新品,我们再来看看其迭代新机—— Pixel 10系列的爆料信息。
消息源透露,谷歌Pixel 10系列手机预计将放弃使用三星和高通的基带芯片,转而采用联发科尚未发布的T900基带芯片。
据悉,联发科T900相较于上一代T800,性能预计有所提升。作为参考,T800于2022年11月发布,峰值下行速率达7.9Gbps,上行峰值速率达4.2Gbps。
尽管目前还无法确定具体的效能表现,但有业内人士称,该芯片的应用有望改善过去几代Pixel手机的续航与过热问题。
此前,有消息源分享了新一代谷歌Pixel 10、Pixel 11的部分配置信息,都会新增更多的AI功能。
而对于谷歌Pixel 11系列手机,消息源称谷歌计划2026年发布Pro版本机型,将配备“下一代”长焦镜头,结合其硬件和AI,有望能够实现100倍变焦。
同时,Cinematic Blur支持4K 30fps HDR,并新增一个“video relight”功能,可以调整视频中的光照条件。
此外,Pixel 11还将引入超低光照视频(Night Sight video),升级为完全依赖设备本身而非云端处理,能够大幅提升手机在低光环境下的成像质量。