当前位置:首页
> deepseek 第85页
新年贺词里的中国信心
“我们要锚定目标任务,坚定信心、乘势而上,扎实推动高质量发展,进一步全面深化改革开放,推进全体人民共同富裕,续写中国奇迹新篇章。” 一个幸福的约定,一份共同的期待...
下一代模型呼之欲出?!DeepSeek的新年礼物mHC是个啥?
为AI模型带来了“智能稳定器”,在保持模型宽度的同时,通过“双随机矩阵”的流形约束,解决了超连接(HC)不稳定性问题,确保模型训练稳健,配合算子融合等优化,mHC在MATH、GSM8K...
视频丨海外吸引力与好感度持续攀升 “酷中国”圈粉世界
“中国变酷了!”2025年,谈及中国的海外吸引力与好感度,“酷炫中国”成为外媒高频评价词。这一年,中国文化创意之酷、科技创新之酷、开放活力之酷,在全球掀起一个个热议话题。...
梁文锋带队DeepSeek,重置深度神经网络最底层的「定海神针」
作者列表里,除了三位一作(Zhenda Xie、Yixuan Wei、Huanqi Cao),还出现了神龙见首不见尾的传奇人物 这篇论文要解决的,其实是一个“基础...
美媒称要向DeepSeek学习
【#美媒称要向DeepSeek学习#】#东南亚成中国微短剧核心粉丝区# “中国变酷了!”2025年,谈及中国的海外吸引力与好感度,“酷炫中国”成为外媒高频评价词。这一年,中国文化创意之...
梁文锋署名,DeepSeek元旦新论文要开启架构新篇章
新年第一天,DeepSeek 发布了一篇新论文,提出了一种名为mHC(流形约束超连接)的新架构。 简单来说,DeepSeek 提出的 mHC 通过将传统 Tran...
DeepSeek开年炸场!梁文锋最新论文要动AI界“承重墙”
当业界都在卷应用卷智能体,DeepSeek却回头修补AI的地基,mHC方案无需引入任何新的超参数deepseek,用极小的额外训练开销,就换来性能和稳定性提升。 ...
DeepSeek发布新论文提出更为高效的AI开发方法
【DeepSeek发布新论文提出更为高效的AI开发方法】财联社1月2日电,DeepSeek近日发布论文,阐述了一种更为高效的人工智能开发方法。该论文由创始人梁文锋参与撰写,提出了名为“...
26年春节又热闹了 新论文暗示DeepSeek V4已完成训练
快科技1月2日消息,刚刚过去的2025年中,万众期待的DeepSeek全新大模型没有问世,但是DeepSeek并没有闲着,这一年中继续打磨了DeepSeek V3.X大模型,还发布了多...
DeepSeek后又一神作!清华校友出手,终结ResNet十年统治?
【新智元导读】2026年架构革命的枪声已经打响!ResNet用十年证明了「加法捷径」能救训练,但也暴露了「只加不减」的天花板。DeepSeek新年王炸之后,普林斯顿和UCLA新作DDL...


