当前位置:首页 > Deepseek最新资讯 > 正文内容

谷歌新发现:DeepSeek 推理分裂出多重人格,左右脑互搏越来越聪明

5个月前 (01-20)Deepseek最新资讯78

  研究发现,当遇到 GPQA graduate-level 科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突会变得更加激烈。

  团队通过分析 DeepSeek-R1 和 QwQ-32B 等模型的思维轨迹发现,它们的推理过程充满了对话感。

  团队借助稀疏自编码器 SAE,对 AI 的推理黑盒进行了深度解码,成功“监听”到了 AI 的脑内群聊。

  首先,研究者让 AI 执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

  将这些激活数据输入 SAE,通过 SAE 的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

  通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

  再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了 AI 内部的多角色对话行为deepseek

  通过对比 DeepSeek-R1 与 DeepSeek-V3、Qwen-2.5-32B-IT 这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高。

  当团队通过激活添加法强化模型的对话特征,放大“哦!”这类表达惊讶、转折的话语标记时,模型在 Countdown 算术推理任务中的准确率直接从 27.1% 翻倍至 54.8%。

  研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

  而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

  在 Qwen-2.5-3B 和 Llama-3.2-3B 两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出 10% 以上,Llama-3.2-3B 到训练后期差距甚至扩大到 22%。原文出处:谷歌新发现:DeepSeek 推理分裂出多重人格,左右脑互搏越来越聪明,感谢原作者,侵权必删!

标签: deepseek

“谷歌新发现:DeepSeek 推理分裂出多重人格,左右脑互搏越来越聪明” 的相关文章

3月10日DeepSeek预测:灰熊vs篮网,莫兰特缺阵,篮网主场能否逆袭?

3月10日DeepSeek预测:灰熊vs篮网,莫兰特缺阵,篮网主场能否逆袭?

  两支处于重建期的球队将在巴克莱中心展开较量。篮网作为知名球队,本赛季仅取得16胜47负的惨淡战绩,排名东部第13;而灰熊则以23胜39负位列西部第11。尽管双方都已无缘季后赛,但这场比...

从AlphaGo到DeepSeek R1,推理的未来将走向何方?

从AlphaGo到DeepSeek R1,推理的未来将走向何方?

  如果把人生看作一个开放式的大型多人在线游戏(MMO),那么游戏服务器在刚刚完成一次重大更新的时刻,规则改变了。   自 2022 年 ChatGPT 惊艳亮相以来,世...

Deepseek推荐全国旅游百强区第62名:浙江宁波市鄞州区

Deepseek推荐全国旅游百强区第62名:浙江宁波市鄞州区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

南京片仔癀博物馆祝贺DeepSeek赋能财务知识培训会成功召开

南京片仔癀博物馆祝贺DeepSeek赋能财务知识培训会成功召开

  近日,常州航天信息分公司在常瑞宾馆举办DeepSeek赋能财务:解锁财务工作自动化线下课,来自常州各地区企业财务总监,财务经理,税务会计,会计人员110余人参加此次培训,带大家探索智能...

DeepSeek预测:巴黎圣日耳曼VS纽卡斯尔,姆巴佩接班人维蒂尼亚能否率队复仇

DeepSeek预测:巴黎圣日耳曼VS纽卡斯尔,姆巴佩接班人维蒂尼亚能否率队复仇

  2025-26赛季欧冠联赛第8轮即将迎来一场重磅对决,卫冕冠军巴黎圣日耳曼将在王子公园球场迎战英超劲旅纽卡斯尔联。目前大巴黎以13分排名第6,纽卡斯尔同积13分排名第7,这场直接对话将...

DeepSeek预测:曼联VS热刺!红魔主场狂轰滥炸,B费率队3-1碾压伦敦军

DeepSeek预测:曼联VS热刺!红魔主场狂轰滥炸,B费率队3-1碾压伦敦军

  英超第25轮焦点战即将打响!曼联坐镇老特拉福德迎战热刺,前者以41分稳居欧冠区,后者仅积29分排名第14。这场对决不仅是积分榜两端的较量,更是B费(12助攻领跑英超)与热刺残阵的正面碰...