当前位置：首页 » 资讯 » 新科技 » 正文

Reflection 70B AI 模型第三方基准测试结果不佳

IP属地北京 编辑：吴婷 IT之家 时间：2024-09-11 13:20:48

9 月 11 日消息，科技媒体 The Decoder 昨日（9 月 10 日）报道，对比平台 Artificial Analysis 相关数据表明，Reflection 70B AI 模型在基准测试中的表现，实际上不及 meta 的 LLaMA-3.1-70B。
针对 AI 模型基准测试结果不佳，Reflection 公司首席执行官马特・舒默（Matt Shumer）表示，上传模型权重至 Hugging Face 时遇到问题，所使用的权重是多个不同模型的混合体，而他们内部托管的模型则显示出更佳的结果。
舒默随后向部分用户提供了独家访问内部模型的权限，Artificial Analysis 重做了测试，并报告结果优于公开 API，只是他们无法确认所访问的具体是哪个模型。
Reflection 在 Hugging Face 已上传了新的模型，不过这些模型在测试中的表现明显逊于之前通过私有 API 提供的模型。
查询公开资料，有用户还发现了证据，表明 Reflection API 有时会调用 Anthropic Claude 3.5 Sonnet以及OpenAI。
舒默旗下公司 OthersideAI 此前已宣布计划于本周发布一款基于 LLaMA 3.1 450B 的更大、更强大的模型。
舒默对这一即将发布的版本做出了大胆声明，称其不仅将成为最佳的开源模型，还将是有史以来最优秀的语言模型。
官方回应：

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

域塔物流补办纳斯达克敲钟仪式：公司市值2.5亿美元

【晨报】事关民营经济、民间投资，国家发改委发声；微信朋友圈已支持发布实况照片；工信部征求意见：电动自行车最高设计车速不应超过25km/h

买服装上京东！京东服饰推出全场5折券涵盖大牌鞋靴、男女装等商品

柔性纤维传感器推进至量产，「矩侨工业」获近千万元天使轮融资

悟空爆火背后：带动旅游经济，盗版难题待解，玩家成功通关35.6%

《黑神话：悟空》爆火背后：带动旅游经济，IP 盗版难题待解，玩家通关35.6%！

6.59亿元！隆基、金阳成立HBC电池合资公司

董宇辉也陷“月饼门”？澳门葡记紧急辟谣与辉同行“逃过一劫”

“科八条”发布满三月，上交所多项配套制度正在抓紧制定中

美联储超预期降息，A股和港股受益几何？

高呼别慌！德国央行公开放风：欧洲经济“火车头”恐已进入衰退

《丧尸围城豪华复刻版》正式发售 steam综合评价“多半好评”

《黑神话》Steam通关率35.6%！97.4%人完成序章

《重返未来：1999》Steam页面开放 2024年第四季度上线

实控人失联后，这家A股公司又突发：控股股东股权被公安局冻结！

微信：安卓手机朋友圈发实况照片要“再等等”

哈苏 X2D 100C 大地探索家限量版发售：全球 1000 台，93299 元

技嘉 RTX 4070TI SUPER AI TOP 体验评测

四换券商，大洋泊车能否圆十年上市梦

DJI大疆发布全新超旗舰画质运动相机Osmo Action 5 Pro

铭凡预告AMD Zen5迷你机：强劲旗舰小巧设计

合肥市监局联合调查三只羊；美团辟谣众包骑手达5100万；董宇辉带货月饼被质疑 | 晚报

药品“比价神器”变“涨价暗器”，背后原因耐人寻味

最低价0.6221元/W，华电集团16GW光伏组件集采开标

RCEP概念板块9月19日涨2.22%，朗姿股份领涨，主力资金净流出2520.58万元

董宇辉带货“澳门葡记月饼”，被曝产地在珠海

茅台旗下基金入股英捷信医疗

全站最新

传统假日焕新颜消费迸发新活力

东营区：中秋假期消费市场活力足

冲向万米高空再返回 “朱雀”火箭“回家”有多难

我国一批重点工程建设取得重要成果助力经济高质量发展

探索未知，触摸星空，带你探索太空的神秘奥妙

天文望远镜能看到数亿光年远的星系，为何看不到星球的表面？

累计太空飞行长达3年的航天员即将返回地球！

我国成功发射两颗北斗导航卫星

热门推荐

域塔物流补办纳斯达克敲钟仪式：公司市值2.5亿美元

【晨报】事关民营经济、民间投资，国家发改委发声；微信朋友圈已支持发布实况照片；工信部征求意见：电动自行车最高设计车速不应超过25km/h

买服装上京东！京东服饰推出全场5折券涵盖大牌鞋靴、男女装等商品

苹果Apple Intelligence现已推出公开测试版

OpenAI融资进入决定投资方阶段：Thrive领投，红杉缺席

柔性纤维传感器推进至量产，「矩侨工业」获近千万元天使轮融资

悟空爆火背后：带动旅游经济，盗版难题待解，玩家成功通关35.6%

《黑神话：悟空》爆火背后：带动旅游经济，IP 盗版难题待解，玩家通关35.6%！

6.59亿元！隆基、金阳成立HBC电池合资公司

董宇辉也陷“月饼门”？澳门葡记紧急辟谣与辉同行“逃过一劫”

“科八条”发布满三月，上交所多项配套制度正在抓紧制定中

美联储超预期降息，A股和港股受益几何？

高呼别慌！德国央行公开放风：欧洲经济“火车头”恐已进入衰退

《丧尸围城豪华复刻版》正式发售 steam综合评价“多半好评”

《黑神话》Steam通关率35.6%！97.4%人完成序章