当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

1年前 (2025-02-24)Deepseek最新资讯563

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

福建泉州:部署DeepSeek大模型,助力智慧教学

福建泉州:部署DeepSeek大模型,助力智慧教学

 中国教育报-中国教育新闻网讯(记者 黄星)日前,福建省泉州市中小学校人工智能素养能力提升培训在泉州市晋光小学东海校区举行。  活动现场,泉州市晋光小学教师许榕鑫在语文课堂上运用AI生图技术,引导学生...

微信接入deepseek,这5个神仙接入口大家知道吗?

微信接入deepseek,这5个神仙接入口大家知道吗?

微信接入DeepSeek的入口,至少有5个,大家都可以试试。 (1)微信灰度测试用户(要看运气)。被幸运被邀请微信搜索灰度测试用户,可以在微信搜索框选择“AI搜索”,进入“深度思考”模式,输入问...

从“浅尝”到“深爱”,华为云Stack打通政企应用DeepSeek最后一公里

从“浅尝”到“深爱”,华为云Stack打通政企应用DeepSeek最后一公里

DeepSeek横空出世火爆全网,在个人用户端,DeepSeek App频登各大应用市场下载量榜首;企业用户端,不完全统计已有几百家企业机构用户宣布部署DeepSeek。“全民AI”的浪潮从DeepS...

李国杰院士“七问”DeepSeek都说了些什么?

李国杰院士“七问”DeepSeek都说了些什么?

近日,DeepSeek的横空出世,在全球科技领域激起千层浪,引发了从学界到业界的广泛热议与深度思考。《科技导报》2025年第3期刊发李国杰院士的《DeepSeek引发的AI发展路径思考》一文,深入剖析...

“财透”上半年·科技篇|DeepSeek概念股“冰火两重天”,9只翻倍牛股业绩大幅分化

“财透”上半年·科技篇|DeepSeek概念股“冰火两重天”,9只翻倍牛股业绩大幅分化

在2025年以来的资本市场上,以DeepSeek为核心的AI概念板块持续领跑。同花顺iFinD数据显示,截至4月30日,36只DeepSeek概念股年内涨幅超50%,其中年内股价翻倍的个股有9只,分别...

DeepSeek创作诗词首次亮相联合国中文日活动

DeepSeek创作诗词首次亮相联合国中文日活动

4月20日是联合国中文日。连日来,联合国举办了一系列以“诗意中国.浪漫风华”为主题的活动。多个不同国家、不同肤色的联合国职员用中文朗诵了中国古典诗词,来自中国的外交官还朗诵一首由深度求索(DeepSe...