当前位置：首页 » 资讯 » 新科技 » 正文

天桥脑科学研究院团队自研的OMNE AI大模型框架登上基准测试GAIA榜首

IP属地北京 编辑：吴婷钛媒体APP 时间：2024-10-24 12:21:32

天桥脑科学研究院创始人陈天桥雒芊芊夫妇（图片天桥脑科学研究院官网）
天桥脑科学研究院（Tianqiao and Chrissy Chen Institute，TCCI）的 AI 团队在 AI 技术领域取得了重要进展。
近期，天桥脑科学研究院自研OMNE Multiagent大模型——是一个基于长期记忆（Long Term Memory, LTM）的多智能体协作框架，每个智能体拥有相同且独立的系统结构，能够自主学习和理解完整的世界模型，从而独立理解环境。基于LTM的多智能体协同体系，使AI系统能够实时适应个体行为变化，优化任务规划与执行，推动个性化与高效的自我进化。
根据Hugging Face 发布的 GAIA 基准测试排行榜，目前，OMNE的整体成功率为40.53%，领先于meta、微软、Hugging Face、普林斯顿大学、香港大学、英国 AI 安全研究所、百川等知名机构提交的结果，而GPT-4仅为15%。因此，OMNE Multiagent大模型多智能体框架登上了GAIA基准测试排行榜榜首，超越了包括微软研究院在内的众多顶尖机构提交的多智能体框架。
TCCI表示，这是自去年天桥脑科学研究院创始人、前中国互联网大佬陈天桥宣布All In AI战略以来，旗下AI团队取得的一项重大成果。
GAIA 是由 meta AI、Hugging Face 和 AutoGPT 联合推出的基准测试系统，旨在提供一个涵盖真实世界问题集的测试环境，用于全面评估 AI 助手的能力，包括推理、大模型多智能体处理、网页浏览和工具使用等核心功能，是当前最具挑战性的多代理智能评估数据集。
OMNE框架登上该榜单榜首，充分体现了AI 团队的技术深度与创新能力。本次重大突破在于，借鉴了天桥脑科学研究院多年的大脑研究积累，通过给予Agent长期记忆的能力，让模型能够进行深度慢思考，加强了LLM对复杂问题的决策能力，同时融合了长期记忆的机制，通过长期记忆大幅降低了MCTS的搜索空间，提高了在复杂问题上的决策能力。通过引入更高效的逻辑推理，OMNE不仅提升了单个智能体的智能水平，还通过优化协作机制，显著增强了多智能体系统的整体能力。这一提升机制正是受到了人类大脑皮层柱状结构研究的启发，皮质柱作为大脑认知和行为功能的基础单元，通过复杂的协作机制实现信息处理。AI模型通过强化单体智能与智能体间的协作，可能逐渐产生认知能力的涌现，构建出内部的表征模型，进而推动系统整体智能的飞跃。
天桥脑科学研究院AI团队负责人表示，“我们非常自豪地看到 OMNE 框架登上 GAIA 榜首。这表明了利用LTM进行AI自我进化以及解决现实世界问题的巨大潜力。我们相信，推进长期记忆和AI自进化的研究，对于AI技术的持续发展和实际应用至关重要。”
据悉，天桥脑科学研究院由陈天桥、雒芊芊夫妇出资10亿美元创建，是世界上最大的私人脑科学研究机构之一。研究院始终围绕全球化、跨学科和青年科学家三大重点，支持AI和脑科学研究，致力于造福人类。今年以来，天桥脑科学研究院与《Science》杂志合作推出了全球AI驱动科学大奖，并举办和支持了包括"AI+精神健康"在内的各种高水平国际会议和夏校项目，致力于培养跨学科的青年AI人才。
（本文首发于钛媒体App，作者｜林志佳，编辑｜胡润峰）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

科大讯飞最新大模型评测性能超GPT-4turbo，刘庆峰：AI应用已进入落地深水区

知名游戏《超越善恶2》迎来新创意总监

这款索尼互娱中国之星三期产品，想要做出世界第一梯队的动作游戏

《使命召唤：黑色行动 6》推出音效增强服务，20 美元可使用 5 年

游戏玩家还是喜欢实体光盘索尼PS5主机销售中光驱版占据绝大多数

博古斯总决赛阵容揭晓！大湾区队伍将代表中国参赛

指尖轻触，给生活来点“仪式感”

DLSS 3+Reflex性能飙升，《漫威争锋》终测全面体验

外媒宣传《龙腾世纪4》可攻略角色玩家吐槽：SBI恶臭味

《死亡岛2：终极版》新宣传视频游戏已发售

2024反恐精英世界锦标赛落地上海，10月25日公开售票

浙版传媒股价异常波动背后：蹭《黑神话：悟空》热点监管警示及投资者索赔启动！

继宣布放弃PS VR的支持后《我的世界》也将于明年终止对PC VR的支持

传闻：育碧《雷曼》重制版正在开发中

《魔兽》30周年直播活动宣布将在11月举行

CDPR已将游戏测试工作从波兰拓展到北美

《使命召唤：黑色行动6》推出音效增强服务售价20刀5年

《崛起力量: 测试英雄》登陆Steam 英雄乱战动作RPG

粉丝必买《怪物猎人：荒野》推出限定PS5手柄及盖板

动作生存游戏《永恒天空》正式版延期至2025年初合作模式年内上线

《使命召唤21》首个非二元性别角色出现不知道是男是女

网络短剧、博主卖惨：网络新骗局，如同野草般疯长，中老年人中招

狂送百种福利！《黑色沙漠》国服公测今日盛大启幕

《马力欧&路易吉RPG兄弟齐航》游戏ROM已泄露

《怪物猎人：荒野》BETA公测下周开启 PS+会员可提前参加

疑似动视搁置的大金刚3D新作设定图曝光

GOG宣布《辐射：伦敦》下载量突破100万

全站最新

“中国心”2024年度十佳发动机及混动系统入围实车测试

科大讯飞最新大模型评测性能超GPT-4turbo，刘庆峰：AI应用已进入落地深水区

“中国心”2024年度十佳新能源汽车动力系统实车测试纪实

知名游戏《超越善恶2》迎来新创意总监

这款索尼互娱中国之星三期产品，想要做出世界第一梯队的动作游戏

《使命召唤：黑色行动 6》推出音效增强服务，20 美元可使用 5 年

游戏玩家还是喜欢实体光盘索尼PS5主机销售中光驱版占据绝大多数

博古斯总决赛阵容揭晓！大湾区队伍将代表中国参赛

热门推荐

科大讯飞最新大模型评测性能超GPT-4turbo，刘庆峰：AI应用已进入落地深水区

知名游戏《超越善恶2》迎来新创意总监

这款索尼互娱中国之星三期产品，想要做出世界第一梯队的动作游戏

《使命召唤：黑色行动 6》推出音效增强服务，20 美元可使用 5 年

游戏玩家还是喜欢实体光盘索尼PS5主机销售中光驱版占据绝大多数

博古斯总决赛阵容揭晓！大湾区队伍将代表中国参赛

指尖轻触，给生活来点“仪式感”

DLSS 3+Reflex性能飙升，《漫威争锋》终测全面体验

外媒宣传《龙腾世纪4》可攻略角色玩家吐槽：SBI恶臭味

《死亡岛2：终极版》新宣传视频游戏已发售

2024反恐精英世界锦标赛落地上海，10月25日公开售票

浙版传媒股价异常波动背后：蹭《黑神话：悟空》热点监管警示及投资者索赔启动！

继宣布放弃PS VR的支持后《我的世界》也将于明年终止对PC VR的支持

传闻：育碧《雷曼》重制版正在开发中

《魔兽》30周年直播活动宣布将在11月举行