当前位置: 首页 » 资讯 » 新科技 » 正文

腾讯新一代快思考模型混元Turbo S上线 输入价格0.8元/百万tokens

IP属地 北京 编辑:杨凌霄 雷递 时间:2025-02-27 20:04:53

网 乐天 2月27日

腾讯混元自研的快思考模型Turbo S今日正式发布。

腾讯称,区别于Deepseek R1、混元T1等需要“想一下再回复”的慢思考模型,混元Turbo S能实现“秒回”,吐字速度提升一倍,首字时延降低44%,同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。

有研究表明,人类约90%—95%的日常决策依赖直觉,快思考正如人的“直觉”,为大模型提供了通用场景下的快速响应能力,而慢思考更像理性思维,通过分析逻辑提供解决问题思路。快思考和慢思考的结合和补充,可以让大模型更智能、更高效地解决问题。

在业界通用的多个公开Benchmark上,腾讯混元 Turbo S 在知识、数学、推理等多个领域展现出对标 DeepSeek V3、GPT 4o、Claude3.5等模型的效果表现。

通过长短思维链融合,腾讯混元Turbo S 在保持文科类问题快思考体验的同时,基于自研混元 T1 慢思考模型合成的长思维链数据,改进了理科推理能力。

架构方面,通过创新性地采用了Hybrid-Mamba-Transformer 融合模式,混元Turbo S有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache缓存占用,实现训练和推理成本的下降。

新的融合模式突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题,一方面发挥了Mamba 高效处理长序列的能力,也保留 Transformer 擅于捕捉复杂上下文的优势,构建了显存与计算效率双优的混合架构。

腾讯指出,Turbo S未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于Turbo S,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型 T1,该模型已在腾讯元宝上线,用户可以选择Deepseek R1 或腾讯混元T1模型进行回答。

腾讯混元表示,正式版的腾讯混元T1模型API也将很快上线,对外提供接入服务。

定价上,Turbo S 输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相比前代混元Turbo模型价格下降数倍。

———————————————

由媒体人雷建平创办,若转载请写明来源。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新