当前位置：首页 » 资讯 » 新科技 » 正文

OpenAI新o3模型基准测试表现出色普及仍需解决高昂成本问题

IP属地北京 编辑：唐云泽太平洋科技 时间：2024-12-25 19:29:32

近日，OpenAI发布了最新模型o3，这是继o1系列模型之后的又一力作。o3模型在多个关键领域取得了新的突破，尤其是在推理、编程和数学问题解决方面。
o3模型在ARC-AGI基准测试中表现出色，成为首个突破该基准的AI模型。在高计算设置下，o3模型取得了87.5%的优异成绩，而在低计算设置下也有75.7%的表现，是o1模型性能的三倍。此外，在EpochAI的Frontier Math基准测试中，o3解决了25.2%的问题，远超其他模型。
尽管o3模型在性能上取得了显著成果，但其高昂的计算成本成为了广泛关注的焦点。据ARC-AGI基准测试的创建者透露，o3模型每项任务在高计算模式下的成本高达数千美元，而o1模型每个任务的成本仅为5美元，o1-mini更是只需几美分。这意味着o3模型在取得高分的同时，消耗了170多倍的计算资源。
鉴于其高昂的成本，o3模型在实际应用中可能难以普及。目前，它更适合用于处理复杂问题，如长期战略决策等。对于日常小问题的解决，o3模型可能并不适用。
为了使o3模型更具实用性，未来可能需要寻求在AI推理芯片和成本效益方面的技术突破。更高效的AI推理芯片和更具成本效益的解决方案，有望降低o3模型的使用成本，从而推动其在更多领域的应用。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

华为：全球首个海拔 5000 米高原露天矿无人驾驶成果发布

洛图科技：2024 年中国便携学习机电商销量将达 182 万台

全国首个“低空+高铁”跨城联运场景在杭州投运

华为Mate 70又“虐机”：火箭冲击、高空坠落、极寒，无一能挡

飞傲 RR11 收音机曝光，预计明年 2 月大批量生产

卖纸杯吸管年收14亿，瑞幸是最大客户，恒鑫生活上市迎新进展

索尼中国 My Sony 会员权益升级：新增铂金等级、售后服务升级

华为数据存储拿下国内双榜第一！与IBM微软并驾齐驱

涉嫌挪用资金罪！这家A股公司实控人，被监视居住！

AGI的终极形态！李想：对“硅基家人”成真无比相信

李想：理想汽车100%会做人形机器人但不是现在

小米AIoT市场部开启社招：招产品传播MO 工作地北京

中国商业火箭公司蓝箭航天获9亿元融资，明年将首飞可重复使用火箭｜钛快讯

网红羊毛月被禁止关注；京东再提高客服固定工资；智己完成94亿元融资 | 晚报

买一片传三代！鑫谷GPE-01超导热石墨烯导热垫片评测：255W下比利民TF9低4度

理想同学跨界登场手机APP即将上线！

华为 Mate 60 Pro / RS 官方翻新手机开售，4999 元起

罗德 RØDE 推出 CasterVideo 音视频一体工作站，7980 元

极空间发布 2025 年 Q1 功能计划

新特能源IPO被终止：曾拟募资88亿，前9个月净亏14亿

豆瓣2024评分最高华语电影！《好东西》票房突破7亿

会说话的汤姆猫被AI“变活”了！AI玩具成了下一个超级风口？

腾讯重写电商故事，“全鹅厂的希望”仍是微信？

李想：我不想当车企CEO了想做一名人工智能企业CEO

李想称智能化不是软件智能而是人工智能理想未来所在

李想称理想汽车百分百会做人形机器人但节奏不是现在

京东物流日本首个自营海外仓，东京 1 号仓开仓

全站最新

华为：全球首个海拔 5000 米高原露天矿无人驾驶成果发布

洛图科技：2024 年中国便携学习机电商销量将达 182 万台

全国首个“低空+高铁”跨城联运场景在杭州投运

华为Mate 70又“虐机”：火箭冲击、高空坠落、极寒，无一能挡

飞傲 RR11 收音机曝光，预计明年 2 月大批量生产

卖纸杯吸管年收14亿，瑞幸是最大客户，恒鑫生活上市迎新进展

索尼中国 My Sony 会员权益升级：新增铂金等级、售后服务升级

华为数据存储拿下国内双榜第一！与IBM微软并驾齐驱

热门推荐

华为：全球首个海拔 5000 米高原露天矿无人驾驶成果发布

洛图科技：2024 年中国便携学习机电商销量将达 182 万台

全国首个“低空+高铁”跨城联运场景在杭州投运

华为Mate 70又“虐机”：火箭冲击、高空坠落、极寒，无一能挡

飞傲 RR11 收音机曝光，预计明年 2 月大批量生产

卖纸杯吸管年收14亿，瑞幸是最大客户，恒鑫生活上市迎新进展

索尼中国 My Sony 会员权益升级：新增铂金等级、售后服务升级

华为数据存储拿下国内双榜第一！与IBM微软并驾齐驱

涉嫌挪用资金罪！这家A股公司实控人，被监视居住！

AGI的终极形态！李想：对“硅基家人”成真无比相信

李想：理想汽车100%会做人形机器人但不是现在

小米AIoT市场部开启社招：招产品传播MO 工作地北京

中国商业火箭公司蓝箭航天获9亿元融资，明年将首飞可重复使用火箭｜钛快讯

网红羊毛月被禁止关注；京东再提高客服固定工资；智己完成94亿元融资 | 晚报

买一片传三代！鑫谷GPE-01超导热石墨烯导热垫片评测：255W下比利民TF9低4度