当前位置:首页 > Deepseek最新资讯 > 正文内容

叫板OpenAI,DeepSeek-V3.1正式发布

10个月前 (08-21)Deepseek最新资讯403

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。

  更重要的是,经过思维链压缩训练,新版模型在生成结果时的token数量减少了20%至50%(同前代模型DeepSeek-R1-0528相比),这不仅带来响应速度的提升,也直接降低了使用成本。

  配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。

  除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。

  在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。

  在商业与生态层面,DeepSeek 选择了“双轨”策略deepseek,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与后训练版本已在Hugging Face和魔搭同步开源。

  值得一提的是,在这一次的官方发布说明中,DeepSeek提到“V3.1使用了 UE8M0 FP8 Scale的参数精度”,更为通俗的说,它设置了一个适配于即将发布的新一代国产芯片的技术规范与设计标准。“建议有部署需求的用户仔细阅读新版说明文档。”而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱,除非再做专门的软件适配。

  本次DeepSeek-V3.1的发布也似有与GPT5对垒的意味,都支持超长上下文,都有更强的复杂任务处理能力,基础模型调用更为灵活,成本更为弹性。原文出处:叫板OpenAI,DeepSeek-V3.1正式发布,感谢原作者,侵权必删!

标签: deepseek

“叫板OpenAI,DeepSeek-V3.1正式发布” 的相关文章

12月30日DeepSeek预测:老鹰vs雷霆,西部霸主主场轻取残阵老鹰?亚历山

12月30日DeepSeek预测:老鹰vs雷霆,西部霸主主场轻取残阵老鹰?亚历山

  北京时间12月30日,NBA常规赛将迎来一场东西部对决——亚特兰大老鹰客场挑战俄克拉荷马雷霆。目前雷霆以27胜5负高居西部第一,而老鹰15胜18负仅列东部第10。从近期状态来看,老鹰遭...

全村人都在等着DeepSeek上桌吃饭了

全村人都在等着DeepSeek上桌吃饭了

  上个周末,包括英国《金融时报》在内的一些外媒报道称:DeepSeek V4将在本周一(3月2日)发布。还有报道宣称,V4将针对国产芯片进行优化,是该系列大模型当中第一个完全基于国产算力...

助力中国马拉松力压日本,中国跑鞋迎来“DeepSeek时刻”?

助力中国马拉松力压日本,中国跑鞋迎来“DeepSeek时刻”?

  在32公里这一跑者最恐惧的撞墙期,中国选手丰配友持续提速,赶超日本选手桥本龙一,位列亚洲选手第一。   最后500米,日本选手大迫杰突然追了上来。丰配友知道,这是位劲...

用先进算力,为AGI加速!华为云企业快成长AI技术创新论坛南京站圆满落幕

用先进算力,为AGI加速!华为云企业快成长AI技术创新论坛南京站圆满落幕

  当前,生成式人工智能(AGI)正加速重塑商业格局,不仅推动各行业效率革命,更成为企业突破增长瓶颈的关键变量。然而,众多企业在拥抱AI的过程中仍面临战略落地难、成本高、技术门槛高等挑战。...

黄仁勋最新发声:DeepSeek的问世惊艳世界

黄仁勋最新发声:DeepSeek的问世惊艳世界

  美国时间1月5日,黄仁勋26年首场演讲提及DeepSeek:称Deepseek R1推动了整个行业变革deepseek。原文出处:黄仁勋最新发声:DeepSeek的问世惊艳世界,感谢原...

10月27日 DeepSeek预测 湖人vs国王:东契奇带伤出战,湖人险胜国王

10月27日 DeepSeek预测 湖人vs国王:东契奇带伤出战,湖人险胜国王

  北京时间10月27日上午9点,NBA常规赛将迎来一场西部焦点战,洛杉矶湖人队将客场挑战萨克拉门托国王队。两支球队目前战绩均为1胜1负,但国王凭借胜负关系暂列西部第五,湖人则排名第九。本...