当前位置:首页 > Deepseek最新资讯 > 正文内容

中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510

3周前 (10-14)Deepseek最新资讯115

  DeepSeek在年初发布了R1以后,受到了各界普遍关注。后续来看,DeepSeek并没有如期发布更先进的模型R2,而是在进行更多小版本的更新换代。结合每个阶段的发展重点,我们将其划分为3个主要的发展阶段。

  阶段一:性能提升。DeepSeek在3月推出的V3-0324和5月推出的R1-0528,通过后训练实现了模型能力的提升,弥补了和头部模型之间的差距。

  阶段二:实现混合推理架构、Agent能力提升、与国产芯片协同优化。从8月以后,DeepSeek也顺应了海外混合推理架构和Agent能力提升的大趋势,推出了V3.1和V3.1-Terminus,Agent能力有了较大提升,思考效率也有提升。V3.1采用UE8M0FP8缩放格式训练,针对即将发布的下一代国产芯片设计,实现国产大模型和国产芯片协同设计的优化deepseek,对国产化芯片的应用起到积极的推动作用。

  阶段三:提效降价,国产适配加速。9月发布的V3.2-Exp,基于V3.1-Terminus构建,引入了新的注意力机制DSA,在保持模型性能的稳定的同时,在训练推理效率方面有了较大的提升,带来了模型较大幅度的降价。考虑到当前大模型之间能力差距在缩小,成本的下降意味着模型具有更好的性价比和可推广性,也将促进应用端实现更多功能的落地。DeepSeek新兴AI编程语言选用TileLang这个新兴AI编程语言,可以实现对不同硬件平台的支撑,极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题,为国产大模型软硬件生态建立起到了极大的推动作用。发布的当天,国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配,国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。原文出处:中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-251014,感谢原作者,侵权必删!

标签: deepseek

“中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510” 的相关文章

Deepseek推荐全国旅游百强区第50名:贵州贵阳市观山湖区

Deepseek推荐全国旅游百强区第50名:贵州贵阳市观山湖区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

  今年 6 月,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),用循环架构打破了传统思维链(CoT)的架构限制,对大模型推理结构产生了重大的影响。H...

DeepSeek预测:水晶宫vs利物浦!红军不败金身恐遭终结?萨拉赫PK马特塔引

DeepSeek预测:水晶宫vs利物浦!红军不败金身恐遭终结?萨拉赫PK马特塔引

  英超第6轮焦点战即将在塞尔赫斯特公园打响,目前排名第5的水晶宫(2胜3平0负)将迎战全胜领跑的利物浦(5胜0平0负)。主队本赛季仅丢2球(联赛最少)deepseek,而客队狂轰11球(...

与WAIC同频共振,元聚变炬宝AIEO重构AI搜索时代品牌生存法则

与WAIC同频共振,元聚变炬宝AIEO重构AI搜索时代品牌生存法则

  在2025世界人工智能大会(WAIC2025)的聚光灯下,一场关于“品牌生存权”的暗战正悄然升级。当用户向DeepSeek询问“高端SUV推荐”,或对腾讯元宝咨询“健康零食排行榜”时,...

DeepSeek推荐:能养你一辈子的9个好习惯

DeepSeek推荐:能养你一辈子的9个好习惯

  倘若家里太脏、太乱deepseek,我们就会生活在一个负能量的环境里,最终会给我们的精神造成负担,也让心情变差。   要交的工作,拖到了前一晚,才火急火燎地开始;说好...

DeepSeek大事件引爆AI芯片行情!寒武纪20%涨停,半导体设备ETF涨超3

DeepSeek大事件引爆AI芯片行情!寒武纪20%涨停,半导体设备ETF涨超3

  今年以来截至8月11日,半导体设备ETF(561980)跟踪的中证半导指数累涨6.53%,领跑同类指数,寒武纪权重占比达8.19%,“寒王”权重在同类型指数中相对较高。...