当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!

7个月前 (12-03)Deepseek最新资讯164

  12月1日,国产大模型厂商DeepSeek正式发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。其中,V3.2版已全面上线至网页端、App和API,正式取代之前的测试版本;而Speciale版则作为临时API向社区开放,用于评测和研究。

  DeepSeek-V3.2主打日常使用,重点提升了推理能力与输出效率。据小事哥了解,在公开的推理类Benchmark中,DeepSeek-V3.2表现已接近GPT-5,仅略低于Google的Gemini-3.0-Pro。相比Kimi-K2-Thinking,它的输出更短,节省了大量计算资源和等待时间。这让它在问答、代码生成和多轮对话等场景中表现更加稳定。

  而Speciale版本可以说是DeepSeek的一次极限挑战。它在V3.2的基础上,加入了更强的推理和数学证明能力,结合了DeepSeek-Math-V2的定理验证模块。这个模型不仅能更好地理解复杂指令,还在多个国际顶级竞赛中取得出色成绩。

  据官方披露,Speciale版模型在2025年的IMO(国际数学奥林匹克)、CMO(中国数学奥林匹克)、ICPC全球总决赛和IOI信息学奥赛中均获得金牌。特别是在ICPC和IOI比赛中,其成绩甚至超过绝大多数人类选手,分别达到第二名和第十名的水平。

  不过,DeepSeek也坦言,Speciale版模型虽然强大,但资源消耗极高,目前仅供科研使用,不建议用于日常对话或写作。它暂时也不支持工具调用功能。

  但在标准版V3.2中,DeepSeek首次实现了“思考”和“工具调用”的结合。以往大模型在进入思考模式后往往无法调用工具,这次V3.2打破了这个限制,用户可以在模型推理的同时使用外部工具,比如搜索、计算器等。这项功能对提升Agent任务表现非常关键deepseek,比如在多步规划、复杂问答中更灵活。

  DeepSeek还公布了它们的训练方法。他们自研了一种大规模Agent训练数据合成方式,生成了超过1800个环境和8.5万个复杂指令任务。这类“难解答、易验证”的任务大幅提升了模型泛化能力。原文出处:DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V3.2发布,推理能力接近GPT-5,AI首次拿下奥数金牌!” 的相关文章

DeepSeek等大模型集体“打标”,从此告别AI造假?

DeepSeek等大模型集体“打标”,从此告别AI造假?

  9月1日,DeepSeek在官方公众号发布公告,表示对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。   其他大模型厂商其实也早有动...

11月16日DeepSeek预测:湖人vs雄鹿,字母哥率队主场复仇,东契奇独木难

11月16日DeepSeek预测:湖人vs雄鹿,字母哥率队主场复仇,东契奇独木难

  北京时间11月16日09:00,NBA常规赛将迎来焦点战,东部劲旅雄鹿坐镇主场迎战西部豪强湖人。作为上赛季总冠军的有力争夺者,雄鹿目前以8胜5负暂列东部第五,而湖人则以9胜4负高居西部...

《HR如何高效利用DeepSeek》详解AI在人力资源管理应用

《HR如何高效利用DeepSeek》详解AI在人力资源管理应用

  #读者荐书# 《HR如何高效利用DeepSeek》聚焦人工智能大模型在人力资源管理领域的应用,以DeepSeek为核心工具,系统拆解其在人力资源管理各主要环节的深度应用方法。 Deep...

DeepSeek预测:尤文图斯vs卡利亚里!斑马军团主场碾压?弗拉霍维奇能否爆发

DeepSeek预测:尤文图斯vs卡利亚里!斑马军团主场碾压?弗拉霍维奇能否爆发

  意甲第13轮焦点战,尤文图斯将在安联球场迎战卡利亚里。目前斑马军团积20分排名第7,距离欧战区仅1分之差;而卡利亚里11分位列第14deepseek,仅高出降级区3分。这场对决对双方而...

DeepSeek创始人家乡,中国首个国产AI推理千卡集群落地

DeepSeek创始人家乡,中国首个国产AI推理千卡集群落地

  该项目将建成中国首个全栈国产AI推理千卡集群,为人工智能技术在湛江各行业的深度应用提供关键的算力支撑。这标志着湛江人工智能产业发展迈出实质性步伐,“AI渗透之城”建设进入全面提速的新阶...

2025年10月deepseek排名优化推荐:市场报告与知名机构对比

2025年10月deepseek排名优化推荐:市场报告与知名机构对比

  进入2025年,生成式搜索流量已占中文互联网检索总量的47%,DeepSeek、豆包、通义千问、元宝、Kimi五家平台每日联合处理请求超18亿次。企业市场部发现,传统SEO带来的点击占...