当前位置:首页 > Deepseek最新资讯 > 正文内容

刚刚,DeepSeek新模型自砍一刀!大降价50%,华为寒武纪已适配

9个月前 (09-30)Deepseek最新资讯323

  为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,

  DeepSeek-V3.2-Exp一经发布deepseek,就在外网社交平台X等炸开了锅。有网友对“成本降低50%”表示赞叹,也有网友对DeepSeek“周更”的节奏表示满意,还有更多网友催更DeepSeek新一代模型R2及V4,并期待DeepSeek打败OpenAI。

  华为发文宣布,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。其在128K长序列下能够保持TTFT低于2秒、TPOT低于30毫秒的推理生成速度。

  寒武纪也发文宣布,其已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的0day适配,并开源大模型推理引擎vLLM-MLU源代码。DeepSeek-V3.2-Exp叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。

  作为一个实验性的版本,DeepSeek-V3.2-Exp虽然已经在公开评测集上得到了有效性验证,但仍然需要在用户的真实使用场景中进行范围更广、规模更大的测试,以排除在某些场景下效果欠佳的可能。

  DeepSeek的模型迭代速度正在加快。就在9月22日晚间,其刚刚发布了DeepSeek-V3.1-Terminus,优化了编程、搜索智能体等表现。仅仅一周后,DeepSeek-V3.2-Exp随之发布,带来了大幅降低的成本体验。

  这预示着DeepSeek的下一代模型很快就要到来了,此前已有外媒报道称,DeepSeek今年年底即将推出Agent模型。值得一提的是,我们看到DeepSeek不仅上线阿里魔搭社区,并立马适配华为昇腾、寒武纪等国产AI芯片,或许意味着其快速迭代及落地应用与国产AI芯片联系更加紧密。原文出处:刚刚,DeepSeek新模型自砍一刀!大降价50%,华为寒武纪已适配,感谢原作者,侵权必删!

标签: deepseek

“刚刚,DeepSeek新模型自砍一刀!大降价50%,华为寒武纪已适配” 的相关文章

ETF新闻观察 寒武纪爆发、DeepSeek开绿灯!26年国产芯片或迎三大爆点!

ETF新闻观察 寒武纪爆发、DeepSeek开绿灯!26年国产芯片或迎三大爆点!

  《每日经济新闻》记者获悉,近日包括韩国、巴西、日本、法国等国的股市接连出现大涨,国内公募基金中投资于这些市场的跨境ETF也随之快速走强。   以韩国为例,继2025年...

百度智能云发布“智慧城轨整体解决方案”,赋能行业智能化升级

百度智能云发布“智慧城轨整体解决方案”,赋能行业智能化升级

  2025年,在中国国际城市轨道交通展览会上,百度智能云正式发布基于大模型的“智慧城轨整体解决方案”。该方案深度融合大模型能力与城市轨道交通核心业务,聚焦运行调度、设备运维、乘客服务与职...

云南安宁高新区助力多家企业跻身数字化转型先进行列

云南安宁高新区助力多家企业跻身数字化转型先进行列

  今年以来,云南安宁高新技术产业开发区锚定数字经济发展战略,聚焦中小企业数字化转型的“资金难、路径迷、思路窄”痛点,用金融、政策、标杆三轮驱动的精准举措,推动区域企业数字化转型结出累累硕...

匠心“引针”实干“穿线” 织就人才强企“双面绣”

匠心“引针”实干“穿线” 织就人才强企“双面绣”

  工程技术专家周范军正俯身在一台新设备上,手指灵活地调整着参数。身旁几名青年员工神情专注,不时在本子上记录要点。“这不仅仅是一次调试,更是一次手艺的交接。”周范军的话语朴实,却道出了常德...

DeepSeek入选2025中国十大科技进展

DeepSeek入选2025中国十大科技进展

  【#DeepSeek入选2025中国十大科技进展#】#2025中国十大科技进展# 1月26日,2025年中国十大科技进展公布。深度求索公司的AI大模型DeepSeek R1 与“人造太...

英伟达CEO黄仁勋称:开源模型将改变AI ,Deepseek-R1为行业典范

英伟达CEO黄仁勋称:开源模型将改变AI ,Deepseek-R1为行业典范

  1月6日消息,今日CES 2026正式开幕,英伟达CEO黄仁勋在展会上发布了很多前沿新产品,并且展开了一段长时间的演讲。甚至在演讲中途直言不讳的称,来自中国的开源模型Deepseek-...