当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构

8个月前 (08-21)Deepseek最新资讯490

  8月21日,DeepSeek正式发布其最新版本DeepSeek-V3.1,该版本采用了UE8M0 FP8 Scale的参数精度。据悉,这一技术规格专门为即将发布的下一代国产芯片进行优化设计。

  新版本在技术架构方面实现重要突破,引入了混合推理架构设计。该架构允许单一模型同时支持思考模式与非思考模式两种运行状态。用户可通过官方应用程序或网页端的深度思考按钮自由切换不同模式。

  与此同时,V3.1版本在运行效率方面取得显著提升。相比前代DeepSeek-R1-0528,新版本能够在更短时间内提供响应结果。通过思维链压缩训练技术,模型在输出token数量减少20%至50%的情况下,仍能保持相同的任务表现水平。

  在智能体能力方面,V3.1通过后训练优化实现了质的飞跃。新模型在工具使用、编程任务以及复杂搜索等智能体相关任务中表现获得较大幅度提升。在代码修复测评SWE与命令行终端环境测试中,该模型展现出更强的处理能力。

  技术规格方面,V3.1版本将上下文窗口扩展至128K,并新增对Anthropic API格式的支持。API接口同步升级deepseek,提供deepseek-chat与deepseek-reasoner两个不同接口,分别对应非思考模式和思考模式。

  值得注意的是,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。这些调整旨在更好地适配即将推出的国产芯片硬件环境。

  官方应用程序与网页端模型已同步升级为DeepSeek-V3.1版本。据了解,公司计划于2025年9月6日起执行新的API定价方案并取消夜间优惠政策。原文出处:DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构” 的相关文章

12月2日DeepSeek预测:骑士vs步行者,米切尔率队客场复仇

12月2日DeepSeek预测:骑士vs步行者,米切尔率队客场复仇

  12月2日,NBA常规赛将迎来骑士(客)与步行者(主)的较量。目前骑士以12胜9负位列东部第7,而步行者4胜16负排名东部第13。两队近期均取得2胜3负,但骑士在整体实力和排名上占据明...

DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?

DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?

  DeepSeek 近期刚发布《DeepSeek-OCR:基于视觉压缩的大模型长上下文增强方案》,模型名字虽然带 OCR,可别只当它是更准的文字识别工具,它真正的价值,是帮大模型解决 “...

Deepseek推荐全国旅游百强区第19名:湖南长沙市岳麓区

Deepseek推荐全国旅游百强区第19名:湖南长沙市岳麓区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》deepseek,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...

12月29日DeepSeek预测:灰熊vs奇才,莫兰特率队客场取胜

12月29日DeepSeek预测:灰熊vs奇才,莫兰特率队客场取胜

  北京时间12月29日07:00,华盛顿奇才将在主场迎战孟菲斯灰熊。奇才作为东部知名球队,目前以6胜23负的战绩排名东部第14,而灰熊则以15胜16负位列西部第9。这场比赛对于双方来说都...

12月28日DeepSeek预测:尼克斯vs老鹰,布伦森率队冲击四连胜

12月28日DeepSeek预测:尼克斯vs老鹰,布伦森率队冲击四连胜

  北京时间12月28日09:00,NBA常规赛将迎来一场东部焦点战,亚特兰大老鹰坐镇主场迎战纽约尼克斯。作为东部传统劲旅的老鹰(15胜17负,东部第10)正遭遇五连败颓势,而势头正盛的尼...

中国联通亮相2025服贸会:“AI+”数智领航,共筑 全球数字新生态

中国联通亮相2025服贸会:“AI+”数智领航,共筑 全球数字新生态

  9月10日,2025年中国国际服务贸易交易会在北京首钢园盛大启幕。中国联通聚焦人工智能、算网融合、数实融合等前沿技术领域,集中展示包括双万兆网络、云计算服务、元景大模型及多项人工智能创...