当前位置: 首页 » 资讯 » 人工智能 » 正文

谷歌最便宜AI模型商用:腰斩击穿价 0.15 美元买百万 tokens 输出

IP属地 北京 编辑:柳晴雪 IT之家 时间:2024-10-05 13:50:55

10 月 5 日消息,科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。

曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。

相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊天、转录和长文本翻译任务。

Gemini 1.5 Flash 8B 的另一个亮点是亲民的价格,相关计费将于 10 月 14 日星期一生效,附上相关信息如下:

在低于 128K 上下文窗口下,每百万 tokens 输入提示词费用为 0.0375 美元(当前约 0.26 元人民币) 在低于 128K 上下文窗口下,每百万 tokens 输出提示词费用为 0.15 美元(当前约 1.1 元人民币) 在低于 128K 上下文窗口下,每百万 tokens 缓存提示词费用为 0.01 美元(当前约 0.071 元人民币)

作为对比,Gemini 1.5 Flash 模型的每百万输出 tokens 成本为 0.3 美元,这一价格是在 2024 年 8 月 12 日开始实施的,意味着新版 Gemini 1.5 Flash 8B 的价格相比较原版直接腰斩。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新