当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构

10个月前 (08-21)Deepseek最新资讯497

  8月21日,DeepSeek正式发布其最新版本DeepSeek-V3.1,该版本采用了UE8M0 FP8 Scale的参数精度。据悉,这一技术规格专门为即将发布的下一代国产芯片进行优化设计。

  新版本在技术架构方面实现重要突破,引入了混合推理架构设计。该架构允许单一模型同时支持思考模式与非思考模式两种运行状态。用户可通过官方应用程序或网页端的深度思考按钮自由切换不同模式。

  与此同时,V3.1版本在运行效率方面取得显著提升。相比前代DeepSeek-R1-0528,新版本能够在更短时间内提供响应结果。通过思维链压缩训练技术,模型在输出token数量减少20%至50%的情况下,仍能保持相同的任务表现水平。

  在智能体能力方面,V3.1通过后训练优化实现了质的飞跃。新模型在工具使用、编程任务以及复杂搜索等智能体相关任务中表现获得较大幅度提升。在代码修复测评SWE与命令行终端环境测试中,该模型展现出更强的处理能力。

  技术规格方面,V3.1版本将上下文窗口扩展至128K,并新增对Anthropic API格式的支持。API接口同步升级deepseek,提供deepseek-chat与deepseek-reasoner两个不同接口,分别对应非思考模式和思考模式。

  值得注意的是,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。这些调整旨在更好地适配即将推出的国产芯片硬件环境。

  官方应用程序与网页端模型已同步升级为DeepSeek-V3.1版本。据了解,公司计划于2025年9月6日起执行新的API定价方案并取消夜间优惠政策。原文出处:DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构” 的相关文章

寒武纪股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

寒武纪股价破1200大关创历史新高 DeepSeek适配国产芯片成直接原因

  今日,寒武纪股价突破1200元!8月单月涨幅100%、市值站上5200亿,成为继贵州茅台之后的A股史上第二只千元股。   寒武纪是中国AI芯片设计领军者,其国内云端训...

【中原计算机】人工智能专题:DeepSeek的稀疏注意力机制给AI产业释放更大的

【中原计算机】人工智能专题:DeepSeek的稀疏注意力机制给AI产业释放更大的

  人类在处理信息时选择性地关注关键信息,从而提高了处理效率和准确性。深度学习模仿人类的这种能力引入了注意力机制,从而给长文本处理带来了可能性。   由于注意力机制面临显...

1月27日DeepSeek预测:老鹰主场迎战步行者,特雷杨率队冲击三连胜

1月27日DeepSeek预测:老鹰主场迎战步行者,特雷杨率队冲击三连胜

  北京时间1月27日凌晨2:30,NBA常规赛将迎来一场东部对决,亚特兰大老鹰队将在主场迎战印第安纳步行者队。老鹰目前排名东部第10,战绩为22胜25负,胜率46.8%;步行者则排名东部...

1月20日DeepSeek预测:雷霆vs骑士,西部榜首力克东部劲旅,亚历山大对决

1月20日DeepSeek预测:雷霆vs骑士,西部榜首力克东部劲旅,亚历山大对决

  1月20日,NBA常规赛将迎来一场焦点战,西部第一的雷霆客场挑战东部第五的骑士。雷霆目前以35胜8负的战绩高居联盟榜首,而骑士则以24胜19负排名东部第五。这场比赛对于双方来说都至关重...

DeepSeek预测:皇家马德里vs巴塞罗那,姆巴佩VS莱万,银河战舰主场力擒巴

DeepSeek预测:皇家马德里vs巴塞罗那,姆巴佩VS莱万,银河战舰主场力擒巴

  西甲第10轮将迎来本赛季首次国家德比,领头羊皇家马德里(8胜0平1负,进20球失9球)坐镇伯纳乌迎战仅差2分的巴塞罗那(7胜1平1负,进24球失10球)。两队近期均保持欧冠+联赛双线连...

特斯拉将在中国推出集成DeepSeek和豆包AI模型的车机语音助手

特斯拉将在中国推出集成DeepSeek和豆包AI模型的车机语音助手

  特斯拉公司计划在中国市场推出车机语音助手功能,搭载深度求索的DeepSeek和字节跳动的豆包这两款人工智能(AI)模型,以追赶提供类似功能的本地竞争对手。根据特斯拉官网上传的文件,该技...