近日,谷歌AI Studio平台推出了其首个通用推理模型——Gemini 2.0 Flash Thinking。该模型的核心亮点在于其能清晰地展示思考过程。不同于传统AI模型直接给出答案,该模型可以模拟人类逐步推理的过程,使AI的“思考”步骤变得透明可见。
该模型在解决复杂问题方面表现出色,能够处理包含图像和文本信息的推理问题。谷歌DeepMind首席科学家Jeff Dean和产品负责人Logan Kilpatrick分别通过视频演示了模型在物理问题和多模态信息处理方面的应用。
Gemini 2.0 Flash Thinking模型在性能上也有显著提升,基于Gemini 2.0 Flash的速度和性能构建,其在Chatbot Arena LLM排行榜上在所有类别中均排名第一,尤其在“硬提示”和“视觉”两项上分别提升了14分和16分。
谷歌表示,Gemini 2.0 Flash Thinking模型的上线仅是推理之旅的第一步。未来,这些推理能力有望进一步集成到Gemini 2.0系列的主要模型中,为AI领域带来更多创新。
目前,Gemini 2.0 Flash Thinking模型已在Google AI Studio和Vertex AI平台上线,有望与OpenAI的o1推理模型展开竞争,共同推动AI技术的发展。