当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制

5个月前 (01-13)Deepseek最新资讯87

  【#DeepSeek又开源了# 梁文锋署名新论文发布,实习生挑大梁】智东西1月13日报道,昨晚,DeepSeek又开源了,还发布一篇新论文。这次,他们提出了一种全新的“条件记忆”机制——Engram,旨在让MoE模型在保持巨量参数的同时,更高效地处理语言信息。

  DeepSeek创始人兼CEO梁文锋、北大王选计算机研究所的赵东岩和张辉帅教授都在论文中署名。Engram架构的核心优势在于以更低成本实现更优性能。训练计算量较MoE减少18%的情况下,在32768个token的长上下文任务中,Engram在RULER基准测试中反超同参数量MoE模型。

  并且,其浅层部署的记忆模块接管局部依赖与静态知识存储,为注意力机制腾出容量以专注全局推理,1000亿参数记忆表卸载后使H800推理吞吐量降幅不足3%。

  DeepSeek还观察到,增加记忆槽位数量能持续、稳定地降低验证损失,这意味着Engram提供了一个可预测的Scaling新手段:增大记忆容量持续带来收益,而无需增加计算量。

  那这种效果究竟是如何实现的呢?如今的MoE模型虽然在计算层面做到了稀疏化,但是它处理信息的方式仍然很费劲:有些老生常谈的事实性内容,比如常见的名字、公式或固定表达,模型却要重复计算,非常耗时间。

  DeepSeek的做法是,把这些“固定知识”提前整理成一个可以快速查询的表格,这样就能把更多精力放在真正需要深度思考的任务上,比如复杂推理或者理解长段文本deepseek

  值得一提的是,论文的第一作者Xin Cheng(程信)目前在北京大学智能学院攻读博士学位,主要研究大模型的高效参数化方法和机制。他同时也在DeepSeek工作,R1、V3的研究都参与了,很有可能是实习生。

  在论文摘要中,DeepSeek提出,条件记忆(conditional memory)将成为下一代稀疏模型中不可或缺的建模原语。这或许意味着DeepSeek-V4有望整合条件记忆机制,实现知识高效检索与推理能力的飞跃。原文出处:DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制” 的相关文章

华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

  9月18日,在华为全联接大会2025期间,以“共建智能世界云底座,加速政务与产业智能升级”为主题的AI城市峰会隆重举行。此次峰会聚焦城市“智”理、智慧政务与产业数智升级三大领域,汇集行...

DeepSeek回应更新后变冷淡:一个是效率上的调整,另一个是边界感

DeepSeek回应更新后变冷淡:一个是效率上的调整,另一个是边界感

  【#DeepSeek回应更新后变冷淡#:一个是效率上的调整,另一个是边界感】近日,国产AI助手DeepSeek被大量用户吐槽风格突变,变冷淡,从原本细腻共情变为不称昵称、文风生硬带“登...

DeepSeek预测:赫塔菲vs西班牙人!马约拉尔能否终结对手三连胜?

DeepSeek预测:赫塔菲vs西班牙人!马约拉尔能否终结对手三连胜?

  西甲第16轮即将迎来一场关键对决,赫塔菲将在阿方索佩雷斯球场迎战西班牙人。目前赫塔菲排名第8,距离欧战区4分,而西班牙人则高居第5,正处于欧冠资格区。这场比赛对双方来说都至关重要,赫塔...

DeepSeek神回复引热议:从哲学灯塔到风格变冷

DeepSeek神回复引热议:从哲学灯塔到风格变冷

  最近围绕DeepSeek的“神回复”引发热议,既因其早期对人生困惑的哲思式解答被誉为“数字时代哲学灯塔”,也因2026年2月技术升级后风格“变冷”掀起用户集体吐槽,折射出AI共情力与效...

11月22日DeepSeek预测:奇才vs猛龙,猛龙主场轻取奇才,英格拉姆vs乔

11月22日DeepSeek预测:奇才vs猛龙,猛龙主场轻取奇才,英格拉姆vs乔

  北京时间11月22日,NBA常规赛将迎来一场东部强弱分明的对决,多伦多猛龙将在主场迎战华盛顿奇才。目前猛龙以10胜5负高居东部第二,而奇才则以1胜13负的战绩排名东部垫底。...

10月26日DeepSeek预测:黄蜂vs76人,马克西40分难挡黄蜂三分雨

10月26日DeepSeek预测:黄蜂vs76人,马克西40分难挡黄蜂三分雨

  北京时间10月26日早7:30,NBA常规赛将迎来东部新贵黄蜂与老牌劲旅76人的对决。两支球队目前均以1胜0负并列东部第四、五位,但历史交锋呈现一边倒态势——76人近5次交手保持全胜。...