当前位置:首页 > Deepseek最新资讯 > 正文内容

华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效

5个月前 (10-13)Deepseek最新资讯294

  技术层面:1)DeepSeek Spare Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。根据各领域性能公开评测集结果(通用、搜索、代码、代码智能体、数学),DeepSeek-V3.2-Exp表现与V3.1-Terminus基本持平;2)开源TileLang与CUDA两种算子,TileLang由北大团队研发,专为简化高难度GPU算子开发而设计,将成为替代主流OpenAI领域特定语言Triton的有力备选,TileLang将调度空间与数据流解耦,使开发者能够直观地控制数据在硬件中的流动,根据TileLang在GitHub的说明文档,不仅支持英伟达CUDA,还已扩展支持华为昇腾等国产芯片。DeepSeek使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段deepseek,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。

  受益于新模型服务成本大幅降低,API调用价格相应下调。目前DeepSeek-V3.2-Exp API价格为输入0.2元/百万tokens(缓存命中),2元/百万tokens(缓存未命中),输出3元/百万tokens。

  新价格政策下开发者调用DeepSeek API的成本将降低50%以上。我们认为,DeepSeek-V3.2-Exp在技术层面探索了新的稀疏注意力机制,推动中国算力生态协同创新与演进,进一步将模型与算法层面的创新,与中间层的编译语言与更底层的计算芯片协同起来,推动中国算力生态的成长。模型发布后华为昇腾和寒武纪均第一时间宣布完成适配工作,表明国产AI算力生态已进入模型与芯片协同设计阶段。相关公司:神州数码、寒武纪、品高股份、北京利尔、安博通、优刻得、浪潮信息、紫光股份、超讯通信、首都在线。

  1)下游预算限制信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。原文出处:华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效,API同步降价-251012,感谢原作者,侵权必删!

标签: deepseek

“华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效” 的相关文章

DeepSeek预测:水晶宫vs利物浦!红军不败金身恐遭终结?萨拉赫PK马特塔引

DeepSeek预测:水晶宫vs利物浦!红军不败金身恐遭终结?萨拉赫PK马特塔引

  英超第6轮焦点战即将在塞尔赫斯特公园打响,目前排名第5的水晶宫(2胜3平0负)将迎战全胜领跑的利物浦(5胜0平0负)。主队本赛季仅丢2球(联赛最少)deepseek,而客队狂轰11球(...

信凯科技(001335.SZ):目前没有与Deepseek在自研国产芯片材料外着

信凯科技(001335.SZ):目前没有与Deepseek在自研国产芯片材料外着

  公司目前没有与Deepseek在自研国产芯片材料外着色供应方面有合作。公司的主要业务集中在有机颜料等着色剂的产品开发deepseek、销售及服务方面;产品广泛应用于油墨、涂料和塑料等领...

第四届MUST Awards顺利举办,科技行业年终盛典收官

第四届MUST Awards顺利举办,科技行业年终盛典收官

  1月22日,第四届MUST Awards麻瓜青年选择奖在杭州成功举办。作为国内首个由科技内容创作者与大众消费者共同投票评选的消费科技奖项,MUST Awards延续“不卖奖、不端水”的...

挑战OpenAI!消息称DeepSeek今年底推出更先进模型:具备AI智能体能力

挑战OpenAI!消息称DeepSeek今年底推出更先进模型:具备AI智能体能力

  据9月4日彭博社援引知情人士消息,DeepSeek正在开发一款具备更先进AI智能体功能的人工智能模型。该模型将能够在用户仅提供最少指令的情况下,代表用户完成多步操作,并能根据以往操作不...

Runway与DeepSeek发布新一代基础模型,性能超越行业巨头算法

Runway与DeepSeek发布新一代基础模型,性能超越行业巨头算法

  初创公司Runway AI Inc.和DeepSeek今日发布了两个新的基础模型,声称其性能超越了科技行业巨头开发的算法。   Runway的新算法Gen-4.5提供...

后R1时代:DeepSeek发展的三大阶段

后R1时代:DeepSeek发展的三大阶段

  ,还是以基础模型 DeepSeek V3-Base 为基座,通过后训练实现了模型能力的提升,弥补了和头部模型之间的差距。   8月21日,Deep在发布V3.1的同时...