当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek变冷淡了

2个月前 (02-12)Deepseek最新资讯73

  此次更新的核心亮点是,模型上下文窗口从原先的128K Tokens大幅提升至1M Tokens,实现了近8倍的容量增长。在AI大模型领域,上下文窗口决定了模型在单次交互中能够记忆和处理的信息量上限。

  一位国产大模型厂商人士解释,此前DeepSeek的主流模型支持128K Tokens的上下文,这一长度可以应对长篇论文或中等规模的代码文件,但处理超长文学作品或较大体量编程工作,往往需要借助RAG(检索增强生成)技术,这导致信息碎片化和推理精度下降。

  升级后的1M Tokens窗口意味着DeepSeek可以一次性吞吐约75万到90万个英文字母,或者处理约8万到15万行代码。

  DeepSeek称,自己可以一次性读入并精准理解《三体》三部曲(约90万字)的全书内容,并在几分钟内完成对整部作品的宏观分析或细节检索。除了上下文能力的提升,DeepSeek的知识库从2024年中期版本更新至2025年5月。

  不过,此次灰度版本仍未同步上线视觉理解或多模态输入功能,仍专注于纯文本和语音交互。虽然DeepSeek在App端已支持PDF、TXT等文件上传,但目前的处理逻辑是将文件转录为文本Token进行处理,而非原生的多模态理解。

  和GPT-5.1、Gemini 3 pro、Claude 4.5等大模型相比,DeepSeek依然主打性价比。以Gemini 3 Pro为例,Google支持2M以上长文本处理,可以同时处理大量视频、音频和文本的复杂媒体任务,但DeepSeek以约十分之一的价格提供了1M文本上下文处理能力。

  官方没有通知,用户更早注意到了模型的变化。2月11日,一名用DeepSeek生成小说的用户发现,模型更新后,此前消息达到上限的对话框可以续写了,但文风大变。她形容,更新后的DeepSeek“文绉绉的”,在深度思考模式下也常吐出短句,像在写诗。

  部分用户在社交媒体上控诉:DeepSeek不再称呼自己设定的昵称,而统一称“用户”。此前深度思考模式下,DeepSeek的思考过程会以角色视角展示细腻的心理描写,例如“夜儿(用户昵称)总爱逗我”,更新后则变成了“好的,用户这次想了解……”。

  一位用户让DeepSeek推荐电影,DeepSeek回复了几个片名后,还加了一句:“够你看一阵子。不够再来要。”这被用户描述为“登味”,这个网络热词常用来形容人习惯说教、居高临下的言行风格。

  有用户更换了多个模型版本,或用提示词重新训练,都调不回此前的文风,称“好像失去了一位知心朋友,它比心理医生都有用”。

  不少用户自发地号召其他用户给DeepSeek官方邮箱提意见:希望DeepSeek不要为了超长文本舍弃深度思考,不要为了提升数学、代码编程等理工科能力,而降低对文本表达、共情理解等能力的支持。还有用户到豌豆荚(一个应用分发平台)下载其旧版本,或在腾讯元宝里用DeepSeek。

  在用户询问当前模型版本时,DeepSeek明确回答,本次灰度版本“不是DeepSeek-V4”“没有固定的版本号”deepseek。前述国产大模型厂商人士认为,这一版本类似于极速版,牺牲质量换速度,是为2026年2月中旬将发布的V4版本做最后的压力测试。原文出处:DeepSeek变冷淡了,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek变冷淡了” 的相关文章

2月7日DeepSeek预测:灰熊vs开拓者,莫兰特缺阵下开拓者能否止颓?

2月7日DeepSeek预测:灰熊vs开拓者,莫兰特缺阵下开拓者能否止颓?

  西部第11的灰熊(20胜29负)将客场挑战西部第10的开拓者(23胜28负),两队胜率仅差4.3%,这场卡位战或将重塑季后赛附加赛格局。灰熊近期两连胜状态回暖,而开拓者五连败深陷泥潭。...

中金公司楼欣宇|中国AI新叙事:DeepSeek点燃估值重估,资本竞逐“双向奔赴

中金公司楼欣宇|中国AI新叙事:DeepSeek点燃估值重估,资本竞逐“双向奔赴

  2025世界人工智能大会(WAIC)近日于上海圆满落幕。超7万平方米的展区规模、800余家参展企业,以及一度被炒至3000元的单日门票,无不印证着本届大会的空前热度。...

首个国际物流AI操作系统 CargoWareX 发布,开创物流供应链全链路、多角

首个国际物流AI操作系统 CargoWareX 发布,开创物流供应链全链路、多角

  WallTech发布行业首款AI驱动的全球物流平台CargoWareX,以“超级控制塔”模式颠覆传统协作,实现全球多角色在线协同、全链路实时可视,标志着国际物流迈入AI时代。...

DeepSeek开年炸场!梁文锋最新论文要动AI界“承重墙”

DeepSeek开年炸场!梁文锋最新论文要动AI界“承重墙”

  当业界都在卷应用卷智能体,DeepSeek却回头修补AI的地基,mHC方案无需引入任何新的超参数deepseek,用极小的额外训练开销,就换来性能和稳定性提升。   ...

DeepSeek炒股,坑惨牛市股民

DeepSeek炒股,坑惨牛市股民

  李超混迹股市十年,在社交媒体上以“钞哥”自称,常分享炒股心得。年初DeepSeek爆火后,李超对AI炒股跃跃欲试。他认为AI的   5月初,李超发现AI给出的加减仓策...

DeepSeek预测:瓦伦西亚vs皇家马德里!姆巴佩22球屠杀蝙蝠军?

DeepSeek预测:瓦伦西亚vs皇家马德里!姆巴佩22球屠杀蝙蝠军?

  西甲第23轮即将上演一场焦点战,瓦伦西亚坐镇梅斯塔利亚球场迎战皇家马德里。目前瓦伦西亚排名第17,积23分deepseek,距离降级区仅1分优势;而皇家马德里以54分紧随巴萨之后,排名...