当前位置：首页 » 资讯 » 新科技 » 正文

OpenAI找回场子：chatgpt-4o-latest AI模型力压Gemini 1.5 Pro

IP属地北京 编辑：郑浩 IT之家 时间：2024-08-14 12:54:50

8 月 14 日消息，谷歌上周发布最强 Gemini 1.5 Pro 模型，在 LMSYS 的聊天机器人竞技场（Chatbot Arena）比赛中取得第一名，而 OpenAI 迅速“找回场子”，最新 chatgpt-4o-latest 模型重夺第一。
chatgpt-4o-latest 简介
OpenAI 公司上周发布了 gpt-4o-2024-08-06，其 API 支持结构化输出；昨日再次发布了名为 chatgpt-4o-latest 的全新前沿模型，是 GPT-4o 的最新版本，上下文窗口输入最高 128000 个词元（tokens），输出最高 16384 个词元。
LMSYS 的聊天机器人竞技场简介
Chatbot Arena 由伯克利大学主导团队 LMSYS Org 近日发布了一个针对大语言模型的基准平台 Chatbot Arena。
该平台采用匿名、随机的方式让不同的大模型产品进行对抗评测，基于国际象棋等竞技游戏中广泛使用的埃洛等级分系统，通过用户投票产生，系统每次会随机选择两个不同的大模型机器人和用户聊天，并让用户在匿名的情况下选择哪款大模型产品的表现更好一些。
最后系统根据用户的选择判定大模型产品的积分，以排行榜的形式出现在首页中。
chatgpt-4o-latest 最新成绩
谷歌的实验性 Gemini 1.5 Pro 模型上周以 1297 分的成绩夺得第一名，这是谷歌首次登顶 LMSYS 的聊天机器人竞技场。
OpenAI 凭借新的 chatgpt-4o-latest 模型，以 1314 分的最高分夺回了竞技场第一名的宝座。
得分显示，新版 ChatGPT-4o 在编码、指令遵循和硬提示方面都有显著提高，附上相关成绩如下：
总成绩：第一名数学：#1-2 编程：第一名艰难提示词（Hard prompts）：第一名指令跟随（Instruction Following）：第一名长提问（Longer Query）：第一名 Multi-Turn：第一名

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

优派“VA2462-4K-HD”23.8 英寸显示器开售：4K 60Hz，989 元

米哈游《原神》5.2 版本“灵与火的织卷”定档 11 月 20 日上线

酷比魔方掌玩 mini 2 Ultra 平板电脑公布，骁龙 7+ Gen 3 处理器

盛色推出“N50 Pro 5 机械臂版”24.5 英寸显示器，669 元

AYANEO 3掌机官宣：定位“年度旗舰”，可选两种屏幕、两种处理器

闪迪推出 Extreme PRO 2TB TF 存储卡：读速 250MB/s，1599 元

自动驾驶涌向资本市场，“大疆教父”李泽湘携希迪智驾赴港上市

“文旅智变，科技绘景”——《钛度热评》AGI首期线下沙龙在京成功举办，共探科技赋能文旅新路径

曝传音智能戒指即将面世包含多项健康和健身功能

OneXPlayer 飞行家 F1 Pro EVA 联名游戏掌机发布，9399 元起

消息称三星明年 4 月推出 Galaxy S25 Slim“超薄手机”

三星S25 Ultra最新渲染图曝光厚度减薄R角设计更圆润

百度或推内置小度AI助手智能眼镜预计售价低于2139元

苹果将高性能模式扩展至M4 Pro芯片设备此前仅限于Max机型

微软官网下载渠道发出Win10支持将止警告力促用户升级至11

华为Pura80系列预计明年Q2发布潜望长焦有望迎来新变化

谷歌将推出Gemini AI模型2.0更新提高响应速度

摩托罗拉获卷帘屏手机新专利实现屏幕任意位置指纹解锁

智谱发布新清影AI模型支持生成10秒带音效4K 60帧视频

字节跳动Seaweed模型开放使用 60秒生成5秒AI视频

龙腾世纪4销量扑街玩家大量退款

酷凛雪界DX无风扇水冷散热器上市白色款仅售259元

无尽的求生欲！丧尸围城豪华复刻版试玩版来了

美女COSER公开《原神》久岐忍Cosplay作品！

索尼发布财报：PS5出货量同比减少，游戏业务营收暴增

创新散热设计！ APNX推出超酷炫中塔机箱产品

合金弹头：战略版游戏测评 10位玩家好评如潮

全站最新

优派“VA2462-4K-HD”23.8 英寸显示器开售：4K 60Hz，989 元

米哈游《原神》5.2 版本“灵与火的织卷”定档 11 月 20 日上线

酷比魔方掌玩 mini 2 Ultra 平板电脑公布，骁龙 7+ Gen 3 处理器

盛色推出“N50 Pro 5 机械臂版”24.5 英寸显示器，669 元

AYANEO 3掌机官宣：定位“年度旗舰”，可选两种屏幕、两种处理器

闪迪推出 Extreme PRO 2TB TF 存储卡：读速 250MB/s，1599 元

自动驾驶涌向资本市场，“大疆教父”李泽湘携希迪智驾赴港上市

“文旅智变，科技绘景”——《钛度热评》AGI首期线下沙龙在京成功举办，共探科技赋能文旅新路径

热门推荐

优派“VA2462-4K-HD”23.8 英寸显示器开售：4K 60Hz，989 元

米哈游《原神》5.2 版本“灵与火的织卷”定档 11 月 20 日上线

酷比魔方掌玩 mini 2 Ultra 平板电脑公布，骁龙 7+ Gen 3 处理器

盛色推出“N50 Pro 5 机械臂版”24.5 英寸显示器，669 元

AYANEO 3掌机官宣：定位“年度旗舰”，可选两种屏幕、两种处理器

闪迪推出 Extreme PRO 2TB TF 存储卡：读速 250MB/s，1599 元

自动驾驶涌向资本市场，“大疆教父”李泽湘携希迪智驾赴港上市

“文旅智变，科技绘景”——《钛度热评》AGI首期线下沙龙在京成功举办，共探科技赋能文旅新路径

曝传音智能戒指即将面世包含多项健康和健身功能

OneXPlayer 飞行家 F1 Pro EVA 联名游戏掌机发布，9399 元起

消息称三星明年 4 月推出 Galaxy S25 Slim“超薄手机”

三星S25 Ultra最新渲染图曝光厚度减薄R角设计更圆润

百度或推内置小度AI助手智能眼镜预计售价低于2139元

苹果将高性能模式扩展至M4 Pro芯片设备此前仅限于Max机型

微软官网下载渠道发出Win10支持将止警告力促用户升级至11