当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

1年前 (2025-02-24)Deepseek最新资讯566

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

中文网址注册接入DeepSeek,发挥AI优势精准封堵企业知识产权保护漏洞

中文网址注册接入DeepSeek,发挥AI优势精准封堵企业知识产权保护漏洞

中文网址注册服务支持DeepSeek-R1满血版推荐功能,是AI大模型技术落地应用的又一创新典范。该技术大幅提升了中文网址注册的精准度和全面性,可以针对数字时代知识产权保护的痛点、难点为企业提供更为专...

deepseek无法响应怎么办

deepseek无法响应怎么办

deepseek无法响应怎么办如果您遇到DeepSeek无法响应的情况,可以尝试以下几种方法来解决问题:错峰使用:尽量避免在工作日的工作时间、晚上以及周末等高峰时段使用DeepSeek。可以选择在清晨...

浅谈DeepSeek对于数据分析师的赋能

浅谈DeepSeek对于数据分析师的赋能

在数据驱动决策的时代,效率就是生产力。DeepSeek作为AI助手,如何帮助数据分析师解放双手、提升10-100倍效率?本文带你深入了解这一革命性工具。引言数据分析师的日常是什么?清洗数据、探索关系、...

智能应对多种场景 DeepSeek助力四川环境应急

智能应对多种场景 DeepSeek助力四川环境应急

4月6日,记者从四川省生态环境厅获悉,近日新增一位环境应急“助手”——一款基于DeepSeek大模型与生态环境应急指挥平台深度融合的AI助手。目前,通过阶段性探索,该AI助手已初步形成智能问答、智能分...

湛江科技学院DeepSeek版“智能招生问答系统”来啦!

湛江科技学院DeepSeek版“智能招生问答系统”来啦!

湛江科技学院的智能招生问答系统已经华丽大变身,深度融合了DeepSeek大模型,全新升级,重新上线啦!  湛江科技学院的智能招生问答系统已经华丽大变身,深度融合了DeepSeek大模型,全新升级,重新...

全省首个!九江DeepSeek生态环境大模型部署上线

全省首个!九江DeepSeek生态环境大模型部署上线

近日,九江市生态环境局正式部署上线DeepSeek-生态环境大模型,该模型是九江市首个部署上线的DeepSeek大模型,将为九江市乃至全省生态环境系统提供个性化、智能化的AI服务,标志着九江市在“AI...