当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

7个月前 (02-24)Deepseek最新资讯412

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

微信接入deepseek,这5个神仙接入口大家知道吗?

微信接入deepseek,这5个神仙接入口大家知道吗?

微信接入DeepSeek的入口,至少有5个,大家都可以试试。 (1)微信灰度测试用户(要看运气)。被幸运被邀请微信搜索灰度测试用户,可以在微信搜索框选择“AI搜索”,进入“深度思考”模式,输入问...

炮制假网站、虚假宣传诱导购买AI课程 有不法分子披着DeepSeek外衣行骗

炮制假网站、虚假宣传诱导购买AI课程 有不法分子披着DeepSeek外衣行骗

本报讯 (记者姜雨晴)“页面制作得太逼真了!”3月31日,四川的菲菲告诉记者,日前她在网页搜索知名科技公司DeepSeek网站时,被诱导付费后才发现误入钓鱼网站陷阱。经过长时间的申诉,对方最终迫于监管...

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

【消息称DeepSeek-R2或下周发布 官方暂无回应】财联社3月11日电,有消息称,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式发布。截至目前,DeepSee...

deepseek能用来干啥-deepseek有什么用途

deepseek能用来干啥-deepseek有什么用途

DeepSeek是一款基于人工智能技术的工具,旨在帮助用户高效处理和分析数据、生成内容、优化工作流程等。其应用场景非常广泛,具体功能和使用场景包括但不限于以下几个方面:一、数据分析与可视化数据导入:支...

Deepseek回应Manus横空出世:我要展示自信,AI的目标是拓展而非取代人类

Deepseek回应Manus横空出世:我要展示自信,AI的目标是拓展而非取代人类

3月6日凌晨,全球第一款通用AI智能体Manus震撼发布,发布4小时后,其官网的访问量突破千万量级,一夜之间刷爆“科技圈”。有人认为,Manus有望成为继DeepSeek后的最大黑马。那么,DeepS...

DeepSeek引爆AI应用

DeepSeek引爆AI应用

激活AI产业链 DeepSeek持续扩大生态圈湖南日报2025-02-09 08:52● 本报记者 杨洁DeepSeek(深度求索)成为继ChatGPT之后的又一现象级AI产品。据国内AI产品榜统计数...