当前位置:首页 > deepseek 第71页

微软研报称DeepSeek在中国AI市场份额达89%

3个月前 (01-13)Deepseek最新资讯98
微软研报称DeepSeek在中国AI市场份额达89%
  IT之家 1 月 13 日消息,《金融时报》今天(1 月 13 日)发布博文deepseek,报道称微软总裁布拉德 · 史密斯(Brad Smith)表示,称中国正凭借“低成本开源模型...

Anthropic筑墙,DeepSeek修路

3个月前 (01-13)Deepseek最新资讯102
Anthropic筑墙,DeepSeek修路
  对于Vibe Coding的开发者来说,这两天无疑是至暗时刻。大量使用OpenCode、Cursor等第三方工具的用户突然发现,他们赖以生存的Claude工作流被切断了。...

DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制

3个月前 (01-13)Deepseek最新资讯84
DeepSeek开源Engram论文,梁文锋领衔提出条件记忆新机制
  【#DeepSeek又开源了# 梁文锋署名新论文发布,实习生挑大梁】智东西1月13日报道,昨晚,DeepSeek又开源了,还发布一篇新论文。这次,他们提出了一种全新的“条件记忆”机制—...

DeepSeek最新论文:直指Transformer要害,让AI学会翻“字典”了

3个月前 (01-13)Deepseek最新资讯83
DeepSeek最新论文:直指Transformer要害,让AI学会翻“字典”了
  这篇由梁文锋、DeepSeek 研究团队与北京大学联合署名的论文,一经发表就引发了广泛讨论。   此次研究带来了一项突破:在业界广泛采用的“混合专家模型”(MoE)之...

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

3个月前 (01-13)Deepseek最新资讯73
刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了
  :目前大语言模型主要通过混合专家(MoE)来实现稀疏化,这被称为「条件计算」。但是,现有的 Transformer 缺少原生的知识查找机制,只能被迫通过计算过程低效地模拟检索行为。...

梁文锋署名,DeepSeek论文上新

3个月前 (01-13)Deepseek最新资讯98
梁文锋署名,DeepSeek论文上新
  继去年底发布一篇新论文后,1月12日晚,DeepSeek又上新了一篇论文,这次聚焦的是大模型的条件记忆模块,在结论中DeepSeek 认为,这将成为下一代稀疏大模型中不可或缺的核心建模...

DeepSeek下一代稀疏模型提前剧透DeepSeek开源大模型记忆模块

3个月前 (01-13)Deepseek最新资讯78
DeepSeek下一代稀疏模型提前剧透DeepSeek开源大模型记忆模块
  #DeepSeek发布梁文锋署名论文#【#DeepSeek下一代稀疏模型提前剧透##DeepSeek开源大模型记忆模块#】DeepSeek节前开始蓄力!最新论文直接给Transform...

DeepSeek论文上新!下一代大模型实现“记忆分离”,V4不远了?

3个月前 (01-13)Deepseek最新资讯65
DeepSeek论文上新!下一代大模型实现“记忆分离”,V4不远了?
  继去年底发布一篇新论文后,1月12日晚,DeepSeek又上新了一篇论文,这次聚焦的是大模型的条件记忆模块,在结论中DeepSeek 认为,这将成为下一代稀疏大模型中不可或缺的核心建模...

DeepSeek发布梁文锋署名新论文

3个月前 (01-13)Deepseek最新资讯97
DeepSeek发布梁文锋署名新论文
  该论文为北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋。论文提出条件记忆(conditional memory)deepseek,通过引入可扩展的查找记忆结构,在等参数、...

DeepSeek-V4 即将发布,算力效率与性能双升级!低费率云计算ETF华夏、

3个月前 (01-13)Deepseek最新资讯105
DeepSeek-V4 即将发布,算力效率与性能双升级!低费率云计算ETF华夏、
  1月13日,三大指数盘中再次翻绿,科技板块随市调整。截止10:45,聚焦通信+电子算力硬件的通信ETF华夏(515050)跌幅扩大至2.39%,持仓股涨跌分化:海格通信、烽火通信实现连...