当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek后又一神作!清华校友出手,终结ResNet十年统治?

6个月前 (01-02)Deepseek最新资讯96

  【新智元导读】2026年架构革命的枪声已经打响!ResNet用十年证明了「加法捷径」能救训练,但也暴露了「只加不减」的天花板。DeepSeek新年王炸之后,普林斯顿和UCLA新作DDL让网络学会忘记、重写和反转deepseek

  斯坦福著名教授Christopher Manning读完后直言,「2026年,将成为改进残差连接之年」。

  一个是mHC流形约束超连接,一个是DDL深度增量学习,几乎在同一时间,传递出一个强烈的信号:

  2015年,ResNet(残差网络)横空出世后,「加法捷径(shortcut)」几乎成为了深度网络的默认配置。

  ResNet通过残差学习,解决了深度神经网络训练中的核心难题——层数加深,AI性能不升反降。

  如今,无论是CNN、ViT,还是各种混合架构,那条「直接把输入加回去」的残差连接,成为了标配。

  这意味着,对应的线性算子所有特征方向的特征值都是+1,网络只能「平移」状态,而不能反转、选择性遗忘。

  换句话说,旧特征很难被彻底清除,中间表示几乎不会被「反转」,深度网络在表达复杂动态时,显得有些笨重。

  这个设计,让网络状态具备了「记忆矩阵」的含义,也为后续的Delta Rule的对齐埋下了伏笔。

  这是一个rank-1 的对称线性算子,其谱结构异常简单。即d−1个特征值恒为1,只有一个特征值是1−β。

  某些特征会被直接「翻转符号」,深度网络第一次具备了「反向表达」的能力,这对建模振荡、对立关系非常关键。

  DDL明确引入了忘记、重写、反转,让网络可以主动清理无用特征,重构中间表示,让建模成为非单调动态过程。

  DDL不会推翻ResNet,当门控(gate)关闭时,它就是普通残差网络,当它完全打开时,便进入了全新的表达空间。

  这就像是一个「时代切换」的信号,过去模型变强=更大+更深+更多参数,现在「模型变强=更合理的结构约束」。

  此前,他获得了清华大学交叉信息研究院计算机科学硕士学位并成为博士候选人;本科毕业于北京大学元培学院,获数学与计算机科学理学学士学位。

  Yifeng Liu是加州大学洛杉矶分校的计算机博士,本科毕业于清华信息科学与技术学院,姚班出身。

  个人研究方向包括机器学习、强化学习、生成式AI、AI for science以及智能系统应用。

  他曾获得伊利诺伊大学厄巴纳-香槟分校计算机科学博士学位,分别于2007年和2010年获得了清华大学学士和硕士学位。

  个人研究方向是人工智能与机器学习,重点包括非凸优化、深度学习、强化学习、LLM以及深度生成模型。原文出处:DeepSeek后又一神作!清华校友出手,终结ResNet十年统治?,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek后又一神作!清华校友出手,终结ResNet十年统治?” 的相关文章

1月17日DeepSeek预测:森林狼vs火箭,杜兰特率队主场止颓,爱德华兹缺阵

1月17日DeepSeek预测:森林狼vs火箭,杜兰特率队主场止颓,爱德华兹缺阵

  西部季后赛卡位战一触即发!北京时间1月17日10:30,休斯顿火箭将坐镇丰田中心迎战明尼苏达森林狼。这是两队本赛季首次交锋,也是西部第6与第4的正面较量,胜负将直接影响季后赛席位争夺格...

元脑SD200超节点AI服务器助力DeepSeek R1创造国内大模型最快tok

元脑SD200超节点AI服务器助力DeepSeek R1创造国内大模型最快tok

  (全球TMT2025年11月10日讯)近日,在2025人工智能计算大会上,浪潮信息公布,基于元脑SD200超节点AI服务器,DeepSeek R1大模型token生成速度仅需8.9毫秒...

3月18日DeepSeek预测:马刺vs国王,文班亚马率队冲击五连胜

3月18日DeepSeek预测:马刺vs国王,文班亚马率队冲击五连胜

  北京时间3月18日10:00,西部第2的马刺(50胜18负)将客场挑战西部第15的国王(18胜51负)。本赛季马刺以73.5%的胜率展现统治力,而国王仅26.1%的胜率深陷重建泥潭。此...

2月12日DeepSeek预测:活塞vs猛龙,东部榜首大战,康宁汉姆能否延续统治

2月12日DeepSeek预测:活塞vs猛龙,东部榜首大战,康宁汉姆能否延续统治

  北京时间2月12日早8:30,NBA常规赛将迎来一场东部焦点战,排名东部第一的底特律活塞(39胜13负)客场挑战多伦多猛龙(32胜22负)。作为加拿大唯一NBA球队,猛龙坐镇主场渴望终...

12月31日DeepSeek预测:76人vs灰熊,恩比德缺阵马克西能否带队逆袭?

12月31日DeepSeek预测:76人vs灰熊,恩比德缺阵马克西能否带队逆袭?

  2025年收官战,东部第七的76人(16胜14负)将客场挑战西部第九的灰熊(15胜17负)。两支胜率不足55%的球队相遇,这场卡位战或将直接影响季后赛席位争夺格局。...

DeepSeek分析:一台比亚迪秦实际成本及毛利,毛利率仅8%合理吗?

DeepSeek分析:一台比亚迪秦实际成本及毛利,毛利率仅8%合理吗?

  网友热议:比亚迪毛利率8%到底靠谱吗?一篇关于比亚迪秦系列车型成本分析的行业报告近日引发广泛讨论。第三方机构基于公开资料及行业数据进行模型推演,以指导价9.98万元的秦L DM-i版本...