当前位置：首页 » 资讯 » 新科技 » 正文

清华瑞莱联合团队推出“安全增强版DeepSeek”——RealSafe-R1大模型

IP属地北京 编辑：冯璃月砍柴网 时间：2025-02-24 19:32:27

2月23日，清华大学与瑞莱智慧联合团队推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练，在确保性能稳定的基础上，实现了安全性的显著提升，表现优于被认为安全性较好的闭源大模型Claude3.5、GPT-4o等，为开源大模型安全发展与风险治理提供了创新性解决方案。
连日来，国产开源大模型DeepSeek的优异表现令人惊艳，其在自然语言处理和多任务推理方面的能力展现了强大的技术实力，尤其是在复杂问题解决和创造性任务中表现出色。然而，DeepSeek R1和V3在面对越狱攻击等安全性挑战时仍存在一定的局限性。例如，模型可能会被恶意设计的输入误导，生成不符合预期或不安全的响应。这一安全短板并非DeepSeek所独有的难题，而是当前开源大模型的通病，其根本缺陷源于安全对齐机制的深度不足。
为此，清华瑞莱联合团队提出了基于模型自我提升的安全对齐方式，将安全对齐与内省推理相结合，使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险，实现基础模型自身能力的自主进化，可以应用于多种开源、闭源模型。
基于该方法，团队对DeepSeek-R1系列模型进行后训练，正式推出RealSafe-R1系列大模型。实验数据表明，RealSafe-R1安全性提升显著，在多个基准测试中有效增强了对各种越狱攻击的抵抗力，并减轻了安全与性能之间“跷跷板”现象，表现优于被认为安全性较好的闭源大模型Claude3.5、GPT-4o等，不仅为DeepSeek生态添砖加瓦，也为大语言模型树立了新的安全标杆。
据悉，RealSafe-R1各尺寸模型及数据集，将于近期向全球开发者开源。“大模型的安全性瓶颈是本质的，只有通过持续投入和攻坚补齐短板弱项，人工智能产业才能真正实现高质量发展。”瑞莱智慧首席执行官田天表示，这一创新成果将为开源大模型的安全性加固提供有力支持，也为政务、金融、医疗等严肃场景的应用提供更为可靠的坚实基座。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

乔布斯70岁诞辰库克缅怀：他给苹果留下的宝贝何止iPhone

14天涨超40%！这家公司明天停牌：筹划购买资产……

从薇娅注销企业，看直播电商行业的转型启示

三五信息被曝账户仅剩13万元，不久前才从上市公司剥离

兆芯全系整机成功部署DeepSeek-R1：双路64核跑满血671B

谷歌将启动Gmail安全认证升级：告别短信验证码，转向二维码认证

Nothing Phone（3a）系列手机外观公布：后置三摄、圆形模组设计

NASA新一代全空域光谱望远镜SPHEREx 计划3月1日由 SpaceX 发射

人刚毕业，代码一点不会，他纯靠ChatGPT写APP，年入千万美金

揭秘！AI操纵A股新方式

臻镭科技：2024年净利1813.1万元同比下降74.98%

受益市场需求回暖与AI产业趋势推动澜起科技2024年净利增超两倍

美股三大期指集体走高英伟达盘前涨近2%｜今夜看点

明星郑恺被山东信托起诉或涉案5500万元

疑遭赛博围猎：九号正面回应电动车断头谣言

王健林钱紧拟减持万达电影，开年4次股权被冻结，已甩卖7座万达广场

上海明星AI公司澜码科技裁员停薪！CEO被称李开复“关门弟子”

文远知行：新一代量产Robotaxi GXR在北京开启纯无人商业化运营

大疆“全时全域”新品发布会官宣 2 月 27 日举行

患者带DeepSeek看病愁坏医生？业内：增加沟通成本，AI不为建议担责

每周一问大模型 | AI争霸：阿里铺路，腾讯搭桥，字节如何另辟蹊径？

央企″AI算力″龙头，背靠中电科，接入DeepSeek，绑定腾讯+阿里+华为

机器人“战场”：创新、落地与未来

机器人赛道再迎新玩家：宇树云深处之后，海尔兄弟登场！

买空调有好多选择，昨天看了他的空调，我知道错了

苹果CEO库克发文缅怀乔布斯：致敬他永恒的影响力

加码海淘，拼多多出海“补课” | 出海观察

全站最新

乔布斯70岁诞辰库克缅怀：他给苹果留下的宝贝何止iPhone

14天涨超40%！这家公司明天停牌：筹划购买资产……

从薇娅注销企业，看直播电商行业的转型启示

三五信息被曝账户仅剩13万元，不久前才从上市公司剥离

兆芯全系整机成功部署DeepSeek-R1：双路64核跑满血671B

首批新能源车电池退役高峰将至，车主换电池难题何解？

3月车市神仙打架，多款重磅新车即将发布，你的钱包准备好了吗？

风云T8：改写混动SUV市场格局？

热门推荐

乔布斯70岁诞辰库克缅怀：他给苹果留下的宝贝何止iPhone

14天涨超40%！这家公司明天停牌：筹划购买资产……

从薇娅注销企业，看直播电商行业的转型启示

三五信息被曝账户仅剩13万元，不久前才从上市公司剥离

兆芯全系整机成功部署DeepSeek-R1：双路64核跑满血671B

谷歌将启动Gmail安全认证升级：告别短信验证码，转向二维码认证

Nothing Phone（3a）系列手机外观公布：后置三摄、圆形模组设计

NASA新一代全空域光谱望远镜SPHEREx 计划3月1日由 SpaceX 发射

人刚毕业，代码一点不会，他纯靠ChatGPT写APP，年入千万美金

揭秘！AI操纵A股新方式

臻镭科技：2024年净利1813.1万元同比下降74.98%

受益市场需求回暖与AI产业趋势推动澜起科技2024年净利增超两倍

美股三大期指集体走高英伟达盘前涨近2%｜今夜看点

明星郑恺被山东信托起诉或涉案5500万元

疑遭赛博围猎：九号正面回应电动车断头谣言