当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

8个月前 (02-24)Deepseek最新资讯415

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

商络电子:公司正计划引入DeepSeek大模型

商络电子:公司正计划引入DeepSeek大模型

商络电子在互动平台表示,公司正计划引入Deepseek大模型,搭建私有化的AI平台,应用于数据的分析和预测,为公司提供辅助决策能力;另外将AI能力无缝对接通用业务场景,用于提升公司整体效率和能力。(本...

极光Adpub接入DeepSeek,开创应用变现新模式

极光Adpub接入DeepSeek,开创应用变现新模式

中国领先的客户互动与营销科技服务商极光(Aurora Mobile)宣布,其广告变现平台Adpub已成功接入先进的大语言模型(LLM)DeepSeek。通过这一接入,Adpub将充分利用DeepSee...

思想者 | 金耀辉:DeepSeek破局,中国式创新如何改变AI未来?

思想者 | 金耀辉:DeepSeek破局,中国式创新如何改变AI未来?

【编者按】今年年初DeepSeek的出圈,让人看到国产大模型的巨大潜力。技术正以惊人的速度改变着人们的生活和工作方式,而如何认知技术正在成为互联网时代的“必修课”。在上海交通大学电信学院长聘教授金耀辉...

AI数学天花板来了?DeepSeek新模型低调开源,网友直呼:R2指日可待!

AI数学天花板来了?DeepSeek新模型低调开源,网友直呼:R2指日可待!

就在所有人都在期待DeepSeek官宣R2大模型之际,公司却出其不意地在"五一"前夕投下了另一枚技术炸弹。4月30日,DeepSeek在Hugging Face平台上悄然开源了其最...

飞书低代码平台已全面接入Deepseek R1模型能力

飞书低代码平台已全面接入Deepseek R1模型能力

钛媒体App 2月14日消息,飞书低代码平台已全面接入Deepseek R1模型能力。平台提供大量AI增强能力,开发者可在流程中直接调用DeepSeekR1模型,对数据进行批量自动化处理。此外,页面中...

济宁中山公用水务率先完成DeepSeek网络安全本地化部署

济宁中山公用水务率先完成DeepSeek网络安全本地化部署

目前,济宁中山公用水务有限公司完成DeepSeek大模型的本地化部署工作,顺利接入公司自主搭建的Web应用防火墙,为公司网络安全及信息管理升级注入强大动力。DeepSeek大模型的本地化部署是公司提升...