当前位置:首页 > Deepseek最新资讯 > 正文内容

一口气上架两个大模型,DeepSeek大动作来了!推理能力全球领先,输出长度大幅

5个月前 (12-01)Deepseek最新资讯152

  12月1日晚间,DeepSeek正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale。官方网页端、App及API已同步更新至V3.2版本。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。DeepSeek-V3.2-Speciale的目标是将开源模型的推理能力推向极致,探索模型能力的边界。

  根据官方数据显示,在公开的推理基准测试中,DeepSeek-V3.2的推理能力达到GPT-5水平,与Gemini-3.0-Pro接近,相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间。

  DeepSeek-V3.2-Speciale 是 DeepSeek-V3.2 的长思考增强版,同时结合了 DeepSeek-Math-V2 的定理证明能力。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro(见表1)。更令人瞩目的是,V3.2-Speciale 模型成功斩获 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及 IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平。

  不过,目前,DeepSeek-V3.2-Speciale 仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。

  此次DeepSeek提出了一种大规模 Agent 训练数据合成方法,构造了大量「难解答,易验证」的强化学习任务(1800+ 环境,85,000+ 复杂指令),大幅提高了模型的泛化能力。DeepSeek-V3.2 模型在智能体评测中达到了当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。值得说明的是,V3.2 并没有针对这些测试集的工具进行特殊训练,DeepSeek认为,V3.2 在真实应用场景中能够展现出较强的泛化性。

  8月21日下午,DeepSeek正式发布DeepSeek-V3.1。本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章提到,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。

  9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。此款,模型在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。

  2023年4月,梁文锋控制的幻方量化公告称“将集中资源和力量,全力投身人工智能技术,成立新的独立研究组织,探索AGI的本质”,随后成立深度求索(DeepSeek)公司。

  今年1月20日,DeepSeek推出大模型R1,并表示“在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版”,但DeepSeek-R1的推理成本仅为29.4万美元deepseek,低到惊人。即便加上约600万美元的基础模型训练开销,整体成本依然远低于国外巨头。

  1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。对此,《黑神话:悟空》制作人冯骥表示DeepSeek可能是个国运级别的科技成果。

  随后A股迎来DeepSeek时刻,中国资产被重估,A股算力租赁、云计算等指数春节后飙涨逾40%。新炬网络走出10连板,杭钢股份实现17天13板,路桥信息、每日互动等概念股年内最高涨幅均超300%。

  8月12日,市场上突然传出消息称DeepSeek-R2的预计发布时间窗口为2025年8月15日至8月30日,但具体日期尚未官宣。此前市场期盼DeepSeek-R2已经有一段时间,而在ChatGPT-5发布之后,市场对此的预期更盛。

  随后,接近DeepSeek人士表示,该消息不实,并确认DeepSeek-R2在8月内并无发布计划。原文出处:一口气上架两个大模型,DeepSeek大动作来了!推理能力全球领先,输出长度大幅降低,显著减少计算开销与用户等待时间,感谢原作者,侵权必删!

标签: deepseek

“一口气上架两个大模型,DeepSeek大动作来了!推理能力全球领先,输出长度大幅” 的相关文章

DeepSeek将于下周发布V4模型 原生支持多模态

DeepSeek将于下周发布V4模型 原生支持多模态

  据悉,这是一款具有图片、视频和文本生成功能的“多模态”模型目前,DeepSeek已开始对代号为“sealion-lite”的V4预览版进行闭门内测。   相较于现有模...

12月1日DeepSeek预测:凯尔特人vs骑士,布朗对决米切尔,绿军客场险胜

12月1日DeepSeek预测:凯尔特人vs骑士,布朗对决米切尔,绿军客场险胜

  北京时间12月1日,NBA常规赛将迎来一场东部焦点战,波士顿凯尔特人(10胜9负,东部第9)客场挑战克利夫兰骑士(12胜8负,东部第6)。两支球队胜场差仅2场,此役将直接影响东部季后赛...

12月19日DeepSeek预测勇士vs太阳:库里对决布克,太阳主场险胜

12月19日DeepSeek预测勇士vs太阳:库里对决布克,太阳主场险胜

  西部季后赛卡位战即将打响!北京时间12月19日上午10点deepseek,金州勇士将客场挑战菲尼克斯太阳。目前太阳以14胜12负暂列西部第7,勇士13胜14负紧随其后,这场胜负或将直接...

艾泽eze来了,厄德高可以改后腰吗?

艾泽eze来了,厄德高可以改后腰吗?

  艾泽的持球盘带能力肯定优于队长(前腰位置可以是艾泽和恩瓦的顺位)。当然如果艾泽打左边,恩瓦可以首发。   当然作为后腰的厄德高的站位、拦截能力不能说特别好,可以再练练...

HALO崛起,SaaS震荡:软件行业的DeepSeek时刻到了吗?

HALO崛起,SaaS震荡:软件行业的DeepSeek时刻到了吗?

  软件股哀鸿遍野之际,另一类资产却在悄然崛起。石油石化、煤炭、有色金属等“重资产、低淘汰”板块逆势暴涨,美国拖拉机巨头迪尔年内涨幅约33%。华尔街将这一策略命名为HALO(Heavy A...

12月1日DeepSeek预测:鹈鹕vs湖人,湖人主场轻取鹈鹕,东契奇再创神迹

12月1日DeepSeek预测:鹈鹕vs湖人,湖人主场轻取鹈鹕,东契奇再创神迹

  西部垫底的鹈鹕将客场挑战高居西部第二的湖人,双方实力悬殊明显。鹈鹕目前仅取得3胜17负的糟糕战绩,胜率低至15%,而湖人则以14胜4负的战绩稳居西部前列,胜率高达77.8%。...