当前位置:首页 > Deepseek最新资讯 > 正文内容

性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

  据介绍,DeepSeek-V3.1具备128K超长上下文处理能力,支持混合推理架构(一个模型同时支持思考模式与非思考模式)。

  不仅如此,DeepSeek-V3.1拥有更强的Agent(智能体)能力,通过Post-Training(后训练)优化,新模型在工具使用与智能体任务中的表现有较大提升。

  比如,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1均大幅领先DeepSeek-R1-0528。

  另外,DeepSeek-V3.1思考效率提升有了巨幅提升。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下deepseek,各项任务的平均表现与R1-0528 持平。

  对于DeepSeek R2发布延迟的原因,DeepSeek总结称,主要由于采用国产昇腾芯片进行训练时遇到技术挑战,以及公司对模型质量的高标准要求。虽然之前有8月发布的传闻,但已被官方否认。目前看来,我们可能需要再等待几周的时间,但具体日期还需以官方消息为准。原文出处:性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快,感谢原作者,侵权必删!

标签: deepseek

“性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快” 的相关文章

闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了

闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了

  在玩游戏方面,到底哪个模型最厉害?为了回答这个问题,谷歌近日发起了首届大模型国际象棋对抗赛。   这个比赛是在一个名叫「Kaggle Game Arena」的平台上进...

从“青”出发 向“浪”而行 青春建功正当时

从“青”出发 向“浪”而行 青春建功正当时

  “获得‘高质量发展标兵’,给我个人带来了很大的成就感,今后我将更加注重专业技能和综合素质的提升。”近日,青年人才积分排名第一的陈翔满怀欣喜地说。陈翔是福建省福州市城南烟草专卖局(分公司...

DeepSeek母公司腐败案曝光,涉案金额高达1.18亿元

DeepSeek母公司腐败案曝光,涉案金额高达1.18亿元

  近日,私募机构幻方量化员工卷入一场时间跨度长达六年,涉案金额高达1.18亿元的金融反腐案件,多位涉案人员已经移交司法机关。   幻方量化是量化私募领域的头部公司。今年...

重磅的要来了!斯基拉:利物浦准备1.2亿-1.25亿向纽卡报价伊萨克

重磅的要来了!斯基拉:利物浦准备1.2亿-1.25亿向纽卡报价伊萨克

  斯基拉表示,按照自己昨天的独家消息,伊萨克和利物浦已经达成个人条款。(昨日斯基拉报道利物浦已与纽卡前锋伊萨克就个人条款达成原则性协议,合同期限到2030年,还有延长至2031年的选项,...

AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最

AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最

  今天要介绍的Prophet Arena就是一个通过实时更新的真实世界预测任务来评估AI系统预测智能的基准测试。   为「人机协作」而生:你可以给AI提供线索,看看它的...

ChatGPT持续增长,DeepSeek潜力犹存:大模型赛道的变与不变

ChatGPT持续增长,DeepSeek潜力犹存:大模型赛道的变与不变

  ChatGPT的持续增长与DeepSeek的用户数波动,只是大模型市场发展过程中的一个阶段性现象。   在全球人工智能大模型的激烈竞争赛道上,Op...