当前位置：首页 » 资讯 » 新科技 » 正文

曝 Bengio 新动向：世界模型 + 数学证明，确保 AI 系统正常运作

IP属地北京 编辑：孙明 IT之家 时间：2024-08-09 08:17:15

深度学习三巨头之一 Yoshua Bengio 的下一步动向公开了，关于 AI 安全 —— 加入了一个名为 Safeguarded AI（受保护的人工智能）的项目，担任科学总监。
据介绍，Safeguarded AI 旨在：通过结合科学的世界模型和数学证明，构建一个负责理解和降低其它 AI Agent 风险的 AI 系统。
主打的就是一个量化安全保障。
该项目由英国高级研究与发明局（ARIA）提供支持，据说未来 ARIA 将投入共 5900 万英镑（约合 RMB5.37 亿）。
Bengio 表示：

如果你计划部署某种技术，鉴于 AI 行为异常或误用可能带来非常严重的后果，你需要提出充分的理由，最好能提供强有力的数学保证，确保你的 AI 系统将正常运作。
“受保护的 AI”
Safeguarded AI 项目被划分为三个技术领域，每个领域都有特定的目标和预算：
支架（Scaffolding），构建一个可扩展、可互操作的语言和平台，用于维护现实世界模型 / 规范并检查证明文件。机器学习（Machine Learning），使用前沿 AI 帮助领域专家构建一流的复杂现实世界动力学的数学模型，并利用前沿 AI 训练自主系统。应用（Applications），在关键的网络-物理操作环境中部署一个由“把关 AI”保护的自主 AI 系统，通过量化的安全保障释放重要的经济价值。
官方表示，Bengio 加入后将特别关注 TA3 和 TA2，在整个计划中提供科学战略建议。
ARIA 还计划投入 1800 万英镑（约合 RMB1.64 亿）成立一个非营利组织，领导 TA2 的研发工作。
Safeguarded AI 项目总监是前 Twitter 高级软件工程师 David “davidad” Dalrymple，去年 9 月份加入 ARIA。
对于 Bengio 的到来，Dalrymple 还在 X（原推特）上传了俩人的合照：
关于“构建一个负责理解和降低其它 AI Agent 风险的 AI 系统”的具体方法，David “davidad” Dalrymple、Yoshua Bengio 等人写了份文件。
其中提出了一套称为“Guaranteed Safe AI（保证安全的 AI）”的模式，主要是通过三个核心相互作用量化 AI 系统的安全保障：
世界模型，提供数学描述，阐述 AI 系统如何影响外部世界，并妥善处理贝叶斯和奈特不确定性安全规范，定义哪些效果是可接受的数学描述验证器，提供证明 AI 符合安全规范的可审计证书
他们还为创建世界模型的策略，划分了 L0-L5 安全等级：
Level 0：没有明确的世界模型。关于世界的假设隐含在 AI 系统的训练数据和实现细节中。 Level 1：使用经过训练的黑盒世界模拟器作为世界模型。 Level 2：使用机器学习生成的概率因果模型的生成模型，可以通过检查它是否为特定的人类制作的模型（例如科学文献中提出的模型）分配足够的可信度来进行测试。 Level 3：使用（一个或多个）概率因果模型（或它们的分布），可能在机器学习的帮助下生成，这些模型经过人类领域专家的全面审核。 Level 4：使用关于真实世界现象的世界模型，这些模型被正式验证为基本物理定律的合理抽象。 Level 5：不依赖具体的世界模型，而是使用覆盖所有可能世界的全局性安全规范。
“AI 风险”备受学术圈关注
“AI 风险”一直是行业大佬们关注的焦点话题之一。Hinton 离职谷歌，就是为了自由地讨论 AI 风险问题。之前，更是有吴恩达、Hinton、LeCun、哈萨比斯等 AI 巨佬们线上“对喷”的大型场面。
吴恩达曾表示：

对 AI 的最大担忧其实是，AI 风险被过度鼓吹，导致开源和创新被严苛规定所压制。

某些人传播（AI 灭绝人类的）恐惧，只是为了搞钱。
DeepMind CEO 哈萨比斯则认为：

这不是恐吓。AGI 的风险如果不从现在就开始讨论，后果可能会很严重。

我不认为我们会想在危险爆发之前才开始做防范。
Bengio 之前还和 Hinton、姚期智、张亚勤等人工智能大拿，发表了一封公开信《在快速进步的时代管理人工智能风险（Managing AI RIsks in an Era of Rapid Progress）》。
其中就指出人类必须认真对待 AGI 在这 10 年或下一个 10 年内在许多关键领域超越人类能力的可能。建议监管机构应该对 AI 发展全面洞察，尤其警惕那些在价值数十亿美元的超级计算机上训练出来的大模型。
就在一个月前，Bengio 还以“Reasoning through arguments against taking AI safety seriously（回应反对认真对待 AI 安全的观点）”为题写了一篇文章，其中分享了他的最新想法，感兴趣的家人可以康康～
Guaranteed Safe AI：
https://arxiv.org/abs/2405.06624
参考链接：
[1]https://www.technologyreview.com/2024/08/07/1095879/ai-godfather-yoshua-bengio-joins-uk-project-to-prevent-ai-catastrophes/ [2]https://www.reddit.com/r/singularity/comments/1emcwox/ai_godfather_yoshua_bengio_has_joined_a_uk/ [3]https://x.com/davidad/status/1821155265456033803
广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，所有文章均包含本声明。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

又一公司，终止重大资产重组！

钟睒睒的“愤怒”，谁能消解？

成立十年，没有爆款，AI是否Rokid AR眼镜的杀手锏？

《英雄联盟：双城之战》第二季今天完结：臻彩4K限时免费看

AI投毒第一案！GPT写的代码竟有后门程序员被骗1.8万元

樊振东携REDMI K80海报霸气亮相！雷军：当红不让

小米SU7成绩超乎很多人想象这三大原因至关重要

小米驾驶培训来了雷军：小米SU7 Ultra小订车主专属课程

一家中国团队在中东做语聊，不到半年收入接近600万美金，投放形式很“中国”

小鹏的今天，会是蔚来的明天吗？

小米汽车精英驾驶正在筹办，SU7 Ultra准车主预计12月进“驾校”

微软公布 Zero Day Quest 白帽安全竞赛

REDMI Watch 5超大屏惊艳亮相网友直呼小米手环9买早了

周鸿祎谈中国首富“看不起直播带货的企业家”：赞同，我们都应该向雷军学习！

新疆将首次开行贯通南疆东疆“复兴号”动车，单程运行距离 729km

消息称三星 Galaxy Z Flip FE 手机将搭载 Exynos 2400e

从乌镇携手出发，迈进更加美好的“数字未来”——来自2024年世界互联网大会乌镇峰会的观察

鸿蒙生态大会2024行业场景创新分论坛在深圳成功召开

微信PC版，迎来史诗级更新

被遗忘多年后，我也没想到小屏手机还能逆袭...

赵明回应荣耀 GT 系列独立，或将肩负再造荣耀目标

热衷“吃谷”的二次元，又奔向了IP主题餐厅

新一代擎天柱！米家空调Pro新品官宣：更大更广更远

索尼助力珠海航展，创新影像科技科技创新点亮航空盛会

L级HYBRID远摄变焦佳能RF70-200mm F2.8 L IS USM Z外观图赏

第五届“华为影像·金鸡手机电影计划”荣誉作品揭晓，见证移动影像共创之力

首发星穹柔光砂玻璃努比亚Z70 Ultra香珀配色图赏

全站最新

又一公司，终止重大资产重组！

钟睒睒的“愤怒”，谁能消解？

成立十年，没有爆款，AI是否Rokid AR眼镜的杀手锏？

《英雄联盟：双城之战》第二季今天完结：臻彩4K限时免费看

AI投毒第一案！GPT写的代码竟有后门程序员被骗1.8万元

樊振东携REDMI K80海报霸气亮相！雷军：当红不让

小米SU7成绩超乎很多人想象这三大原因至关重要

小米驾驶培训来了雷军：小米SU7 Ultra小订车主专属课程

热门推荐

又一公司，终止重大资产重组！

钟睒睒的“愤怒”，谁能消解？

成立十年，没有爆款，AI是否Rokid AR眼镜的杀手锏？

《英雄联盟：双城之战》第二季今天完结：臻彩4K限时免费看

AI投毒第一案！GPT写的代码竟有后门程序员被骗1.8万元

樊振东携REDMI K80海报霸气亮相！雷军：当红不让

小米SU7成绩超乎很多人想象这三大原因至关重要

小米驾驶培训来了雷军：小米SU7 Ultra小订车主专属课程

一家中国团队在中东做语聊，不到半年收入接近600万美金，投放形式很“中国”

小鹏的今天，会是蔚来的明天吗？

小米汽车精英驾驶正在筹办，SU7 Ultra准车主预计12月进“驾校”

微软公布 Zero Day Quest 白帽安全竞赛

REDMI Watch 5超大屏惊艳亮相网友直呼小米手环9买早了

周鸿祎谈中国首富“看不起直播带货的企业家”：赞同，我们都应该向雷军学习！

新疆将首次开行贯通南疆东疆“复兴号”动车，单程运行距离 729km