当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek -V3.1让国产算力迎新机遇

3周前 (08-29)Deepseek最新资讯122

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

  就此,速途研究院院长丁道师告诉《中国经营报》记者,这次版本的升级,性能更强大了,更好用了。但核心还不是这些升值,而是针对国产芯片的优化,这个才是重中之重。

  爱分析首席李喆告诉本报记者,V3.1版本融合了大语言模型和推理模型,做了Agent适配和国产芯片适配。整体来看,模型能力本身没有大提升,主要是工程化方面做了很多优化,更适合在模型之上开发各类应用。

  丁道师认为,英伟达芯片不安全了,我们就要开启国产化了,在这个背景下,DeepSeek进行了这次大升级。“所以说要把这些背景全部结合起来看,才能一目了然看到这一次升级的本质,就是说现在我国大模型人工智能产业要实现自主可控,要不被美国的产品卡脖子,我们就需要在模型、芯片、算法等多个层面实现自主突破,这样就能理解此次DeepSeek的升级,以及华为芯片的升级之所以备受关注的原因所在了,这背后是整个国家战略的支撑。”

  据了解,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片,实现“低卡高能”部署,带动全产业链发展。在政策推动下,其与昇腾组合切入关键领域,打破垄断,对国产算力及AI产业发展意义重大。

  根据中研网预测,2025年中国AI算力市场达1200亿元。华西证券表示,DeepSeek-V3.1通过技术迭代带动芯片、服务器和云服务的联动优化。国产算力链条呈现出“外部受阻、内部加速”的格局,标志着中国大模型生态正在进入自主化与规模化并进的新阶段。

  近日,硅谷顶级风投a16z发布了新一期的AI应用百大榜单。ChatGPT依旧稳坐第一,但这个宝座越来越不稳固了。Google的Gemini用户数已经追到它的一半,它俩现在是两大顶级的新一代人工智能平台。

  马斯克的Grok靠着一款二次元虚拟伴侣Ani,硬是从0发展到2000万月活。DeepSeek在今年年初爆火后,月活跃用户出现下降,移动端下降了22%,网页端达到了40%。不过其他国产应用表现继续亮眼,移动端Top 50的应用中,预计有22款是由中国团队开发的应用。

  在前20名里,阿里的夸克、字节的豆包、月之暗面的Kimi同时上榜。其中,Kimi作为新兴创业团队的一款产品,能和ChatGPT、Gemini这些巨头产品同台竞争,已经说明了国内用户对中文大模型的强烈需求。

  “DeepSeek -V3.1的优势是继续降低了token使用量,降低使用成本。性能与效果层面,V3.1和其他基模无显著差异。后续各家基模能力上不会有特别大差别deepseek,大概率都围绕着如何降低使用成本、提升使用体验和输出稳定性方面进行不断优化。新一轮模型价格战要开始了。”李喆说。

  要论2024年国内最风光的AI明星,DeepSeek认第二,可能没人敢认第一。QuestMobile数据显示,去年一季度它的下载量冲到8111万次,相当于每16个中国人就有1人装了其APP,比当年微信刚出朋友圈还火。

  不过,后来有第三方数据显示,DeepSeek用户使用率和官网流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

  比如,Kimi K2就用了MOE架构,总参数1T,激活参数32B。另外,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。原文出处:DeepSeek -V3.1让国产算力迎新机遇,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek -V3.1让国产算力迎新机遇” 的相关文章

DeepSeek预测:那不勒斯vs卡利亚里!孔蒂军团2-0碾压,德布劳内剑指连斩

DeepSeek预测:那不勒斯vs卡利亚里!孔蒂军团2-0碾压,德布劳内剑指连斩

  北京时间8月31日凌晨,马拉多纳球场将迎来意甲第2轮的重头戏——领头羊那不勒斯坐镇主场迎战中游球队卡利亚里。首轮比赛中deepseek,孔蒂的球队以2-0完胜萨索洛,而卡利亚里则1-1...

宇树科技冲 IPO,DeepSeek 竟成“隐藏赢家”?

宇树科技冲 IPO,DeepSeek 竟成“隐藏赢家”?

  宇树科技在社交平台上说,打算在2025年10到12月之间,向证券交易所提交上市申请,到时候公司的运营数据都会公开。   当时市场就猜它可能要准备上...

DeepSeek与华为模型算力共生推动中国AI系统级突围

DeepSeek与华为模型算力共生推动中国AI系统级突围

  DeepSeek与华为“模型+算力”共生关系,其实给中国产业打开了一扇“系统级突围”的大门——以前我们习惯单点突破(芯片、模型、应用各干各的),现在第一次出现了“硬件-软件-场景”在同...

国内AI原生应用TOP10 榜单揭晓 豆包、DeepSeek、腾讯元宝位列前三

国内AI原生应用TOP10 榜单揭晓 豆包、DeepSeek、腾讯元宝位列前三

  快科技9月16日消息,今日,国内第三方数据机构QuestMobile发布最新AI应用行业报告,豆包、DeepSeek、元宝、Kimi、文小言、AQ等入围中国AI原生应用Top10。...

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% 字节南大开源

  该框架创新性地将评估模型置于核心位置。通过强化学习训练的CriticLeanGPT模型,能像数学专家一样精准判断形式化代码是否贴合原始语义,配合迭代优化机制,让生成的定理证明既符合语法...

DeepSeek引领AI创新突破:建筑设计行业技术革新深度解析

DeepSeek引领AI创新突破:建筑设计行业技术革新深度解析

  行业专家普遍觉得,跟着深度进修模型的赓续优化和硬件算力的继续提升,未来,开启了“智能设计”新期间。更标志着AI在专业设计领域的深度交融,赞助设计师实现“从草稿到成品”的高效转变。经由历...