当前位置:首页 > Deepseek最新资讯 > 正文内容

R2没等来,DeepSeek V3.1模型发布:价格涨了,智能体能力加强

10个月前 (08-22)Deepseek最新资讯479

  在OpenAI发布GPT-5模型14天后,梁文锋终于出招了,新模型版本DeepSeek-V3.1正式发布。

  本次升级的核心亮点是采用了混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式,实现了DeepSeek-R1和DeepSeek-V3的合体。

  DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。

  在技术与产品更新之外,DeepSeek的API接口调用价格有所上涨,并取消夜间优惠。从北京时间2025年9月6日凌晨起,自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens(此前V3为2元/百万tokens);输出价格调整为12元/百万tokens(此前V3为8元/百万tokens)。。

  混合推理架构已成为大模型领域的一大趋势。除了DeepSeek外,此前发布的阿里通义千问Qwen3、GPT-5也都把推理模型与非推理模型进行融合。

  不过,这类混合推理架构的实际效果仍有待观察。在GPT-5模型发布后,为了平息用户争议,OpenAI已将 GPT-4o 已重新上线。

  而DeepSeek-V3.1发布后,《科创板日报》记者也看到不少用户反馈称,在体验了DeepSeek-V3.1的推理能力后,更习惯DeepSeek R1的回答。

  IDC中国研究总监卢言霞对《科创板日报》表示deepseek,思考与非思考模式的融合可以说是必然的趋势,也是大模型发展史上的一个小迭代。“DeepSeek V3.1并非大版本,更值得期待的是大版本更新,但不知道何时。”

  谈及基础模型的迭代速度,卢言霞表示,目前看确实有所放缓。“未来变革式的突破是不可预测的 就像创新不可被计划,这使得迭代放缓。但何时能大突破,也难以预测。”

  开放传神(OpenCSG)联合创始人陈冉也认为,DeepSeek-V3.1综合看来在预期以下。“效率确实有提升,但突破较少。”

  值得一提的是,深度求索正式发布DeepSeek-V3.1后,称其为“迈向Agent(智能体)时代的第一步”。DeepSeek-V3.1具有更智能的工具调用能力,可以支持多种Code Agent框架,开发者可以自己搭建智能体。

  目前,大模型厂商已经纷纷将重点放在了智能体的应用上,今年 7 月,月之暗面发布了拥有万亿参数规模的混合专家(MoE)模型。在其官方演示案例中, Kimi K2 迈出了智能体化的一步,可帮助用户直接制定旅行计划并预订机票和酒店。

  而智谱 AI 在 7 月 28 日发布的 GLM-4.5 系列,也定位为 Agent 原生基础模型 ,并在 8 月 20 日发布了全球首个手机 Agent(智能体)AutoGLM2.0,可以帮助用户 Agent 代理操作,具备推理、代码与多模态的全能能力,比如可以一键订票、订咖啡。

  此次DeepSeek则称其在智能体能力方面实现了突破。编程智能体方面,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比前代模型有显著进步,所需轮数更少。

  在搜索智能体测评方面,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。

  有业内人士对《科创板日报》记者表示,今年属于智能体元年,在探索中发现很多挑战,也在逐步落地。“到明年的话或许会迎来真正的爆发年,随着标杆案例的成熟,预计将达到规模化发展。”原文出处:R2没等来,DeepSeek V3.1模型发布:价格涨了,智能体能力加强,感谢原作者,侵权必删!

标签: deepseek

“R2没等来,DeepSeek V3.1模型发布:价格涨了,智能体能力加强” 的相关文章

2月4日DeepSeek预测:尼克斯vs奇才,布伦森率队延续连胜,奇才主场难挡强

2月4日DeepSeek预测:尼克斯vs奇才,布伦森率队延续连胜,奇才主场难挡强

  华盛顿奇才将在主场迎战纽约尼克斯,这是一场东部第二与倒数第二的较量。奇才作为NBA传统球队,虽然本赛季战绩不佳,但拥有普尔、库兹马等知名球星,仍具备一定关注度。而尼克斯则在布伦森和唐斯...

DeepSeek新模型MODEL1代码曝光,或为V4独立分支

DeepSeek新模型MODEL1代码曝光,或为V4独立分支

  1月21日,据APPSO,在DeepSeek-R1发布一周年之际,官方GitHub代码库意外曝光了代号为“MODEL1”的全新模型线索。在代码逻辑结构中,“MODEL1”是作为与“V3...

详解Kimi K2 Thinking:谢谢DeepSeek,我先去干掉GPT-5

详解Kimi K2 Thinking:谢谢DeepSeek,我先去干掉GPT-5

  Kimi K2 Thinking是基于 Kimi K2 模型训练而来的,专注于提升Agentic能力和推理能力。这是一个拥有1万亿总参数的混合专家模型(Mixture-of-Exper...

当我问DeepSeek谁会获得诺贝尔生理学或医学奖,它让我关注这俩人

当我问DeepSeek谁会获得诺贝尔生理学或医学奖,它让我关注这俩人

  再过几个小时,万众瞩目的2025年诺贝尔生理学或医学奖就将揭晓。在一个多世纪的历程中,诺贝尔奖表彰了基础科学的重要突破,也见证了大量科学进展进入临床,改变了疾病治疗的格局。...

叫板OpenAI,DeepSeek-V3.1正式发布

叫板OpenAI,DeepSeek-V3.1正式发布

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式...

数智融合 为天津高质量发展注入新动能

数智融合 为天津高质量发展注入新动能

  7月31日,以“数智世界 津门有为”为主题的“华为中国行2025·天津新质生产力城市峰会”成功举办。华为天津政企业务总经理叶紫阳在媒体沟通会上,围绕华为在天津的技术落地与生态共建成果,...