当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构

10个月前 (08-21)Deepseek最新资讯496

  8月21日,DeepSeek正式发布其最新版本DeepSeek-V3.1,该版本采用了UE8M0 FP8 Scale的参数精度。据悉,这一技术规格专门为即将发布的下一代国产芯片进行优化设计。

  新版本在技术架构方面实现重要突破,引入了混合推理架构设计。该架构允许单一模型同时支持思考模式与非思考模式两种运行状态。用户可通过官方应用程序或网页端的深度思考按钮自由切换不同模式。

  与此同时,V3.1版本在运行效率方面取得显著提升。相比前代DeepSeek-R1-0528,新版本能够在更短时间内提供响应结果。通过思维链压缩训练技术,模型在输出token数量减少20%至50%的情况下,仍能保持相同的任务表现水平。

  在智能体能力方面,V3.1通过后训练优化实现了质的飞跃。新模型在工具使用、编程任务以及复杂搜索等智能体相关任务中表现获得较大幅度提升。在代码修复测评SWE与命令行终端环境测试中,该模型展现出更强的处理能力。

  技术规格方面,V3.1版本将上下文窗口扩展至128K,并新增对Anthropic API格式的支持。API接口同步升级deepseek,提供deepseek-chat与deepseek-reasoner两个不同接口,分别对应非思考模式和思考模式。

  值得注意的是,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。这些调整旨在更好地适配即将推出的国产芯片硬件环境。

  官方应用程序与网页端模型已同步升级为DeepSeek-V3.1版本。据了解,公司计划于2025年9月6日起执行新的API定价方案并取消夜间优惠政策。原文出处:DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构” 的相关文章

舒华体育打造中国首家AI健身房,重塑健身行业生态

舒华体育打造中国首家AI健身房,重塑健身行业生态

  近日,舒华健身上海中骏广场店完成AI焕新————新增加了舒华V10+智能商用跑步机、BioFit数智力量系列等AI产品,搭配自研的来一场 小程序,实现了AI在健身房内的全面落地应用。本...

DeepSeek预测:卡利亚里vsAC米兰,红黑军团客场碾压?莱奥+普利西奇双星

DeepSeek预测:卡利亚里vsAC米兰,红黑军团客场碾压?莱奥+普利西奇双星

  新年首战,意甲第18轮将迎来一场悬殊对决——排名第14的卡利亚里主场迎战积分榜次席的AC米兰。主队目前仅领先降级区6分,而客队距离榜首国际米兰仅1分之差。从赛季目标来看,这是一场保级队...

DeepSeek预测:多特蒙德vs奥格斯堡!大黄蜂主场狂轰滥炸,吉拉西领衔锋线屠

DeepSeek预测:多特蒙德vs奥格斯堡!大黄蜂主场狂轰滥炸,吉拉西领衔锋线屠

  德甲第26轮即将上演一场实力悬殊的对决,多特蒙德坐镇伊杜纳信号公园球场迎战奥格斯堡。目前大黄蜂以53个进球高居联赛第三,而奥格斯堡仅打入31球排名第11。从历史交锋来看,多特蒙德近5次...

12月2日DeepSeek预测:雄鹿vs奇才,字母哥率队客场轻取?

12月2日DeepSeek预测:雄鹿vs奇才,字母哥率队客场轻取?

  作为NBA历史悠久的知名球队,华盛顿奇才本赛季陷入泥沼(2胜16负东部垫底),场均失分高达127.7分联盟最差。反观密尔沃基雄鹿虽暂列东部第11,但字母哥领衔的阵容仍保有季后赛竞争力。...

襄阳联通AI驱动智能工具箱,赋能网络运营提质增效

襄阳联通AI驱动智能工具箱,赋能网络运营提质增效

  面对网络运营中系统操作繁琐、数据维护效率低、人力投入占比高等现实问题,襄阳联通坚持技术赋能与流程重构双轮驱动,自主研发“交付中心智能工具箱”,以AI技术为核心,通过模块化、自动化手段实...

两个一级部门合并!小鹏汽车成立“通用智能中心”!何小鹏:要第一个抓住自动驾驶的“

两个一级部门合并!小鹏汽车成立“通用智能中心”!何小鹏:要第一个抓住自动驾驶的“

  2月3日,有消息称,小鹏汽车在近日将两个智能化一级部门自动驾驶中心、智能座舱中心合并为通用智能中心。新部门由原自动驾驶负责人刘先明主导,直接向小鹏汽车董事长、CEO何小鹏汇报。《每日经...