当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配

1个月前 (09-30)Deepseek最新资讯155

  9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,据称能够有效降低计算资源消耗并提升模型推理效率。此外,DeepSeek还大幅下调了API价格,降价幅度超过50%。

  据“华为计算”微信公众号29日消息,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。

  寒武纪29日表示,已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配。依托DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。

  30日上午,海光信息在官方微信公众号宣布,其DCU实现对DeepSeek-V3.2-Exp的无缝适配+深度调优,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。

  受此消息提振,9月30日,市场早盘震荡拉升,科创50指数表现强势,其中AI芯片、华为昇腾概念表现活跃。截至下午1点30分,品茗科技涨超19%,铂科新材涨超14%,恒烁股份涨超11%,云天励飞-U、昆仑万维(维权)等跟涨。

  业界分析指出,此次软硬件“双向奔赴”的意义远超单点技术突破deepseek,标志着国产AI生态从“可用”向“好用”演进,通过芯片与模型的联合创新,形成了从底层算力到上层应用的闭环。在全球AI竞争加剧的背景下,自主可控的技术链条不仅降低了对外部供应链的依赖,也为行业提供了更具竞争力的软硬件一体化解决方案。

  国泰海通证券表示,大模型与生成式AI正快速从云端走向消费终端,各巨头加紧构建软硬件一体的AI生态:短期有望提升产品附加值和用户黏性,长期看谁能率先打造出“AI+硬件”的杀手级应用,谁就能在下一波计算平台竞争中占得先机。这也将成为资本市场衡量科技公司成长性的关键指标。原文出处:DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配” 的相关文章

让更多耐心资本陪跑创新型企业

让更多耐心资本陪跑创新型企业

  一段时间以来,深圳、浙江等地出台相关政策,积极培育壮大耐心资本,服务新质生产力发展。壮大耐心资本、培育长期投资市场生态、推动中长期资金入市等理念和举措,正成为金融支持实体经济高质量发展...

道通科技:持续对包括ChatGPT、DeepSeek等国内外前沿基础大模型算法进

道通科技:持续对包括ChatGPT、DeepSeek等国内外前沿基础大模型算法进

  证券日报网讯 道通科技9月10日在互动平台回答投资者提问时表示,在模型能力方面,公司持续对包括ChatGPTdeepseek、DeepSeek、Llama、Qwen等国内外前沿基础大模...

DeepSeek严正声明:任何冒用公司名义开展“算力租赁”、“融资”等行为均属违

DeepSeek严正声明:任何冒用公司名义开展“算力租赁”、“融资”等行为均属违

  财联社9月18日讯,9月17日晚,深度求索(DeepSeek)发布声明指出,近期,有不法分子冒充“深度求索”公司或在职员工deepseek,伪造工牌、营业执照等材料,在多个平台以“算力...

九章+DeepSeek双擎驱动,好未来AI重塑教育全链条

九章+DeepSeek双擎驱动,好未来AI重塑教育全链条

  T4学习机的AI助手正引导一名孩子逐步拆解复杂的数学难题;而几步之遥,另一名小观众则沉浸在素养机器人的拼搭挑战中——在上海世博展览馆内学而思展台上围满了前来体验的小观众们。随着以大模型...

DeepSeek R2没来,V3.1先来了

DeepSeek R2没来,V3.1先来了

  【TechWeb】8月19日消息,DeepSeek小助手宣布线上模型版本已升级至V3.1,上下文长度拓展至128k,模型参数约为685B,可通过官方网页、APPdeepseek、小程序...

DeepSeek完成7亿美元C轮融资?多位投资人称是假消息

DeepSeek完成7亿美元C轮融资?多位投资人称是假消息

  8月15日,有消息称,“据企查查消息,DeepSeek已于8月14日完成超过7亿美元的C轮融资,由国家产业投资基金领投,多家顶级风险资本、科技巨头投资部门以及主权财富基金等共同参与。本...