当前位置：首页 » 资讯 » 新科技 » 正文

ChatGPT后训练方法被OpenAI离职联创公开，PPT全网转～

IP属地北京 编辑：钟景轩量子位 时间：2025-02-19 08:00:13

西风发自凹非寺
| 公众号 QbitAI
离开OpenAI后，他们俩把ChatGPT后训练方法做成了PPT，还公开了～
正如网友所言，可能没有人比他俩更了解ChatGPT后训练的事儿。
毕竟，一位是OpenAI联合创始人，曾经也是OpenAI后训练共同负责人的 John Schulman，另一位是曾经在OpenAI当后训练研究VP的 Barret Zoph。
John Schulman发推文称：

啊，我和Barret Zoph最近在斯坦福做了一场关于后训练以及分享开发ChatGPT经验的演讲，可惜没被录下来，但我们有PPT。
网友不语，只是一味点赞收藏。
有曾在现场的网友亲证，演讲质量真不戳。
还有网友在感谢完俩人后想要更多：

如果能分享更多关于训练后阶段的最新进展，比如推理模型、DeepSeek RL等，那就太好了。
以下是这次的PPT～
ChatGPT后训练方法PPT版
先是自我介绍。
Barret Zoph和John Schulman曾在OpenAI共同担任后训练联合负责人，从2022年9月开始合作，主要目标是开发一个对齐的聊天机器人，最初的团队被称为“RL”，只有少数几个人。
接着介绍了后训练（Post-Training）阶段是什么：
后训练阶段是模型开发的最后一步，目的是让模型更像一个助手，遵循特定格式，并确保其适合实际生产环境，这一阶段通常与产品团队紧密合作。
用几个具体例子，对比基础模型和后训练模型的区别：
后训练VS预训练总的来说：
计算资源需求更低，迭代周期更快；使用基于人类反馈的强化学习（RLHF）；教模型使用工具；塑造模型个性；引入拒绝/安全行为；行为严重依赖预训练阶段的泛化能力。
后训练包含三个主要组成部分：监督微调（SFT）、奖励模型（RM）训练、强化学习（RL）。
以下是三个组成部分的具体介绍：
随后回顾了ChatGPT和OpenAI后训练的早期发展历程。
包括GPT-3、GPT-3.5的发布、RL团队的工作、GPT-4的准备过程、决定发布ChatGPT的细节以及发布后意外成功，实现病毒式传播。
ChatGPT曾一度被大批涌来的用户挤崩：
随时间推移，ChatGPT模型和功能逐渐更加复杂和多样化：
2022年12月最初版本和2025年1月版本的对比：
添加了许多功能：
然后讲了在功能扩展和公司规模增长的背景下，如何通过主线模型（mainline model）设置来整合变化并降低风险，包括在较小规模上测试；在频繁的更新中逐步整合更改，如果发现问题能够迅速回滚到之前的版本。
在这当中也出现了一些失误和挑战……
比如模型在生成文本时出现了很多拼写错误。
强化学习（RL）后发现拼写错误率有所上升，在监督微调（SFT）数据集中发现了拼写错误的提示。
最终通过对比过程改进，将两个生成的文本（completion 1和completion 2）进行比较，选择改进后的版本，专家会对比这两个文本，有时会写出改进后的版本。
此外还有过度拒绝的情况。
早期的拒绝行为过于冗长：
有一些方法比如通过改变时态，可以绕过模型的拒绝机制。
俩人随后讲解了为何拒绝行为难以处理，有边界问题和人类数据问题。
解决方案包括配对数据、有针对性的边界示例、对标注数据进行分层处理。
另外，模型还会出现偏见。
还可能会生成虚假或误导性的内容。
在涉及品味、主观性和高投入的任务中，如何获取高质量人类反馈也是一大挑战。
通过人类与AI团队协作进行标注是解决方案之一。
他们还探讨了不同来源的人类反馈在提示多样性、标签质量、领域、正确性、意图和合规性等方面的优缺点，并提出了如何利用它们各自优势问题。
而要让模型按照我们的意愿行事，第一步是弄清楚我们想要什么。
俩人表示这一步出乎意料的难，要明确规范。
OpenAI2024年5月发布了模型规范。
还有一个开放性问题，如何保持模型多样性和趣味性。
两人提到通过后训练迭代和模型蒸馏来保持或强化这些特性。
总结了以InstructGPT、Llama 3.1等为代表的“两个时代”的模型训练流程，包括从基础模型到对齐模型的训练步骤，最终目标是生成一个经过多次优化的对齐模型。
提出了一个开放性问题，探讨如何在模型训练和优化过程中恢复并保持基础模型中的多样性和趣味性，包括不同的风格和世界观。
最后他们推荐了一些关于后训练的论文和blog：
俩人都被OpenAI前CTO挖走了
John Schulman和Barret Zoph离开OpenAI后，现在都在干什么——
被曝双双加入了OpenAI前CTO Mira Murati的新创业团队Thinking Machines Lab。
Mira Murati去年9月官宣离职OpenAI，离职后不久，就在10月份，她被曝筹备新公司/AI实验室，吸金超1亿美元。
Mira Murati已经挖到了20多位顶尖研究员和工程师投奔，都是来自OpenAI、谷歌、Anthropic等巨头。
这其中就包括Jonathan Lachman和Barret Zoph。
John Schulman去年8月离开的OpenAI，先是加入了OpenAI竞争对手Anthropic，致力于LLM的对齐工作，短短六个月后再次离职，加入了Murati的创业项目，担任首席科学家。 ‍
至于Barret Zoph，去年9月份和Mira Murati几乎同时离职，随后就加入了Mira Murati的团队，担任CTO。 ‍
参考链接：
[2]https://www.businessinsider.com/openai-employees-joining-mira-murati-new-startup-2025-2#john-schulman-1
— 完—
评选报名｜ 2025年值得关注的AIGC企业&产品
下一个AI“国产之光”将会是谁？
本次评选结果将于4月中国AIGC产业峰会上公布，欢迎参与！

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

观点直击 | 阿里巴巴的AI大考

YouTube 将推出低价无广告套餐 Premium Lite，瞄准特定用户群体

华擎推出其首款“Pro X3D”系列 AMD 主板，但没有任何特殊之处

亚马逊安卓应用商店宣布 8 月 20 日起关闭

扒一扒宇树王兴兴10年知乎生涯，原来他也走了一条“逆转人生”路

超越DeepSeek？Grok3唯一实锤合作商浮现，直供马斯克+高盛抢筹，蓄势待发

冠军之姿：雷蛇毒蝰 V3 专业版 Faker 限定款发布，1399 元

英伟达发布 Game Ready 572.47 WHQL驱动，支持 RTX 5070 Ti 显卡

普门科技发布2024年度业绩快报，盈利3.467亿元，低于分析师预期

普门科技：2024年净利3.47亿元同比增长5.52%

行业首批！腾讯云TI平台支持DeepSeek全系模型精调与推理

超越ChatGPT的AI智能体（英文）

普门科技Q4净利同比下滑近三成拟年内推出中速发光仪器

王兴兴知乎十年：从科技迷到商界精英的“逆转人生”

Epic喜加二：《花园故事》《僵尸世界大战：劫后余生》游戏免费领

R星宣布《GT5A》3 月 4 日可免费升级次世代特性

郭明錤：iPhone 17 全系搭载苹果自研 Wi-Fi芯片以“增强连接性”

海大集团等在长沙成立农牧科技公司

“5G+工业互联网”深度融合加速推动“中国智造”迈向高质量发展

iPhone 16国补后到手4699元：只比iPhone 16e贵200元你怎么选

京东上线iPhone 16e：首发支持国补 3999元起

全车四激光雷达尊界S800首发全向立体融合感知：水沟也能识别了

安宁股份重磅交易，攀枝花富豪收购中核钛白王氏家族资产

微信群如何精细化管理？分享几点微信群运营心得

8999元起！史上最薄折叠屏发布：OPPO剑走偏锋？

小行星采样返回！我国天问二号已运抵发射场：上半年发射

一加 Ace /一加 Ace 竞速版手机开放 ColorOS 15 正式版尝鲜升级

全站最新

观点直击 | 阿里巴巴的AI大考

奔驰大动作！2026款S级改头换面，纯电C级即将登场

搞好中国经济最有效的方法：搞好民企、刺激消费

深耕“五大赛道” 中信银行金融活水注入民营经济

新车泄露天机腾势N9价格呼之欲出

YouTube 将推出低价无广告套餐 Premium Lite，瞄准特定用户群体

华擎推出其首款“Pro X3D”系列 AMD 主板，但没有任何特殊之处

又帅又聪明，上汽奥迪A5L亮相感染力满满

热门推荐

观点直击 | 阿里巴巴的AI大考

YouTube 将推出低价无广告套餐 Premium Lite，瞄准特定用户群体

华擎推出其首款“Pro X3D”系列 AMD 主板，但没有任何特殊之处

亚马逊安卓应用商店宣布 8 月 20 日起关闭

扒一扒宇树王兴兴10年知乎生涯，原来他也走了一条“逆转人生”路

超越DeepSeek？Grok3唯一实锤合作商浮现，直供马斯克+高盛抢筹，蓄势待发

冠军之姿：雷蛇毒蝰 V3 专业版 Faker 限定款发布，1399 元

英伟达发布 Game Ready 572.47 WHQL驱动，支持 RTX 5070 Ti 显卡

普门科技发布2024年度业绩快报，盈利3.467亿元，低于分析师预期

普门科技：2024年净利3.47亿元同比增长5.52%

行业首批！腾讯云TI平台支持DeepSeek全系模型精调与推理

超越ChatGPT的AI智能体（英文）

普门科技Q4净利同比下滑近三成拟年内推出中速发光仪器

王兴兴知乎十年：从科技迷到商界精英的“逆转人生”

Epic喜加二：《花园故事》《僵尸世界大战：劫后余生》游戏免费领