当前位置:首页 > Deepseek最新资讯 > 正文内容

传DeepSeek曝新模型,梁文锋再放“王炸”?

5个月前 (01-21)Deepseek最新资讯98

  近日,DeepSeek在FlashMLA代码库更新中意外曝光了一个名为Model1的新模型,这一发现迅速在技术社区引发热议。

  神秘的 Model1不仅出现在代码和注释中,还拥有与 DeepSeek-V3.2 并列的独立文件。这或意味着其并未沿用 V3 系列的参数配置或基础架构,或是一条全新的技术路径。

  需要指出的是,截至目前,DeepSeek 官网及微信公众号尚未披露任何关于Model1 的相关信息,其最新一篇推送仍停留在 2025年12月1日发布的 DeepSeek-V3.2正式版公告。

  在过去一年中,DeepSeek 以“小步快跑”的方式持续推进 V3 模型的迭代,重点围绕复杂推理、编程能力和工具调用等方向进行深度优化与架构创新deepseek,同时将 R1 作为稳定基线持续赋能生态。

  业界之所以猜测DeepSeek会在今天春节复刻去年R1的“核爆”,主要基于两条线索。一是有外媒称,DeepSeek预计将于2月中旬推出其下一代人工智能模型V4。

  二是2025年12月底至2026年1月,DeepSeek团队发表了两篇有梁文锋署名的论文,主要解决大模型基础架构中训练稳定性与知识检索效率这两个瓶颈,为下一代模型的扩展扫清关键技术障碍。

  其中《mHC: Manifold-Constrained Hyper-Connections》提出了“流形约束超连接”(mHC)框架。其核心是通过数学上的流形投影,将HC的残差连接空间约束在特定流形上,从而在保留其强大表达能力的同时,强制恢复网络的恒等映射特性,从根源上保障了训练的稳定性。

  而DeepSeek 与北大合作的论文《Conditional Memory via Scalable Lookup》提出“条件记忆”模块(Engram),将高频静态知识(如固定短语、代码片段)以嵌入表形式注入 Transformer 层。通过解耦知识存储与神经计算,引入一种稀疏性分配定律,并证明用基于哈希的查找表替代约 20% 的混合专家(MoE)参数,可显著提升推理与知识任务性能。

  DeepSeek两篇旨在攻克模型训练稳定性与知识检索效率两大瓶颈的论文,以及Model1悄然现身等线索都指向同一个焦点——DeepSeek的下一代新模型或已箭在弦上。原文出处:传DeepSeek曝新模型,梁文锋再放“王炸”?,感谢原作者,侵权必删!

标签: deepseek

“传DeepSeek曝新模型,梁文锋再放“王炸”?” 的相关文章

美团开源龙猫大模型,推理速度超DeepSeek-V3 50%

美团开源龙猫大模型,推理速度超DeepSeek-V3 50%

  #智见科技快讯 王兴向AI进攻了!美团发布并开源“龙猫”大模型,推理速度比DeepSeek-V3还快50%。#新华智见   微信QQ已支持绑定Steam账号,可展示游...

10月17日DeepSeek预测:奇才vs活塞,康宁汉姆轮休或成胜负关键

10月17日DeepSeek预测:奇才vs活塞,康宁汉姆轮休或成胜负关键

  底特律活塞作为上赛季东部第6的季后赛球队,将在主场迎战上赛季垫底的华盛顿奇才。尽管是季前赛,但两队近5次交锋活塞3胜2负稍占优势,最近一次交手(2025年3月14日)活塞主场125-1...

疯狂!DeepSeek引爆寒武纪,市值超越中芯国际,股价直逼茅台

疯狂!DeepSeek引爆寒武纪,市值超越中芯国际,股价直逼茅台

  智东西8月22日报道,在DeepSeek-V3.1正式发布并放出“针对即将发布的下一代国产芯片设计”讯息后,今日国内AI芯片概念股一片飘红,   ...

DeepSeek母公司总监被查!套取上亿佣金

DeepSeek母公司总监被查!套取上亿佣金

  幻方量化,是今年在科技圈惊艳四座的DeepSeek母公司,它们的创始人都是梁文锋。成立仅十年,其便因市场总监的行为卷入亿元级风暴。   据报道,李橙曾任职于招商证券,...

DeepSeek母公司亿元腐败案背后

DeepSeek母公司亿元腐败案背后

  ,作者:凤凰网财经《公司研究院》,原文标题:《DeepSeek母公司亿元腐败案背后:当事人曾是招商证券员工》,头图来自:AI生成   2025年8月,一起腐败案将国内...

11月24日DeepSeek预测:篮网vs猛龙,猛龙主场大胜,英格拉姆对决波特

11月24日DeepSeek预测:篮网vs猛龙,猛龙主场大胜,英格拉姆对决波特

  北京时间11月24日07:00,NBA常规赛将迎来一场东部对决,多伦多猛龙将在主场迎战布鲁克林篮网。目前猛龙以11胜5负高居东部第二,而篮网则以3胜12负排名东部第13,两队实力差距明...