当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!

5个月前 (12-03)Deepseek最新资讯161

  12月1日,国产大模型厂商DeepSeek正式发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。其中,V3.2版已全面上线至网页端、App和API,正式取代之前的测试版本;而Speciale版则作为临时API向社区开放,用于评测和研究。

  DeepSeek-V3.2主打日常使用,重点提升了推理能力与输出效率。据小事哥了解,在公开的推理类Benchmark中,DeepSeek-V3.2表现已接近GPT-5,仅略低于Google的Gemini-3.0-Pro。相比Kimi-K2-Thinking,它的输出更短,节省了大量计算资源和等待时间。这让它在问答、代码生成和多轮对话等场景中表现更加稳定。

  而Speciale版本可以说是DeepSeek的一次极限挑战。它在V3.2的基础上,加入了更强的推理和数学证明能力,结合了DeepSeek-Math-V2的定理验证模块。这个模型不仅能更好地理解复杂指令,还在多个国际顶级竞赛中取得出色成绩。

  据官方披露,Speciale版模型在2025年的IMO(国际数学奥林匹克)、CMO(中国数学奥林匹克)、ICPC全球总决赛和IOI信息学奥赛中均获得金牌。特别是在ICPC和IOI比赛中,其成绩甚至超过绝大多数人类选手,分别达到第二名和第十名的水平。

  不过,DeepSeek也坦言,Speciale版模型虽然强大,但资源消耗极高,目前仅供科研使用,不建议用于日常对话或写作。它暂时也不支持工具调用功能。

  但在标准版V3.2中,DeepSeek首次实现了“思考”和“工具调用”的结合。以往大模型在进入思考模式后往往无法调用工具,这次V3.2打破了这个限制,用户可以在模型推理的同时使用外部工具,比如搜索、计算器等。这项功能对提升Agent任务表现非常关键deepseek,比如在多步规划、复杂问答中更灵活。

  DeepSeek还公布了它们的训练方法。他们自研了一种大规模Agent训练数据合成方式,生成了超过1800个环境和8.5万个复杂指令任务。这类“难解答、易验证”的任务大幅提升了模型泛化能力。原文出处:DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!” 的相关文章

900 万、DeepSeek 部署大单

900 万、DeepSeek 部署大单

  需求概况:有效支撑各委办局在政务场景下对大模型等智能化应用的迫切需求,以政府采购服务的方式搭建岳阳市市级政务云智算专区,部署...

为下一代国产芯片设计!DeepSeek新版本再次震惊科技界

为下一代国产芯片设计!DeepSeek新版本再次震惊科技界

  【为下一代国产芯片设计!#DeepSeek新版本再次震惊科技界#】#外媒热议DeepSeek升级#中国人工智能初创企业深度求索21日正式发布其旗舰模型升级版DeepSeek-V3.1。...

1月16日DeepSeek预测:爵士vs独行侠,马尔卡宁缺阵恐难阻独行侠主场复仇

1月16日DeepSeek预测:爵士vs独行侠,马尔卡宁缺阵恐难阻独行侠主场复仇

  西部两支挣扎中的球队将在达拉斯展开对决,爵士(14胜26负)与独行侠(15胜26负)本赛季第三次交锋。尽管爵士在历史交锋中以3胜2负稍占优势,但核心球员马尔卡宁的缺阵可能改变战局。...

国内AI应用赛道呈现“马太效应”:豆包断层领先,DeepSeek、元宝分列二三位

国内AI应用赛道呈现“马太效应”:豆包断层领先,DeepSeek、元宝分列二三位

  【TechWeb】第三方数据机构QuestMobile最新发布的2025年12月AI原生App月活数据显示,国内AI应用赛道“一超多强”的竞争格局已基本定型。其中,字节跳动旗下的豆包以...

不止于展示 松下在进博会构建“技术引力场”

不止于展示 松下在进博会构建“技术引力场”

  东海之滨,黄浦江畔,象征开放与机遇的“四叶草”再次迎风绽放。第八届中国国际进口博览会(以下简称“进博会”)盛大启幕,全球共享合作新机遇、共赢发展新未来。“进博老友”松下如约而至,围绕“...

DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本

DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本

  据介绍,DeepSeek-OCR 参数量约3B ,是对“光学二维映射压缩”技术在长文本上下文处理中的可行性的一次初步探索deepseek。   模型核心由 DeepE...