当前位置:首页 > Deepseek最新资讯 > 正文内容

老外傻眼!明用英文提问,DeepSeek依然坚持中文思考

7个月前 (12-03)Deepseek最新资讯178

  这两大版本在推理能力上有了显著的提升,DeepSeek-V3.2 版本能和 GPT-5 硬碰硬,而 Speciale 结合长思考和定理证明能力,表现媲美 Gemini-3.0-Pro。有读者评论说:「这个模型不应该叫 V3.2,应该叫 V4。」

  海外研究者也迫不及待的用上了 DeepSeek 的新版本,在感慨 DeepSeek 推理速度显著提升之余,却又碰上了他们难以理解的事情:

  这就把海外友人整蒙了:明明没有用中文提问,为什么模型还是会使用中文思考,难道用中文推理更好更快?

  这个结论很符合我们日常的认知,表达相同的文本含义,中文所需的字符量是明显更少的。如果大模型理解与语义压缩相关的话,那么中文相比于广泛使用的英文在压缩方面更有效率。或许这也是「中文更省 token」说法的来源。

  具有多语言能力的大模型如果只采用英语思考的模式往往会导致一些效率问题。不光是中文,采用其他非英语的语言进行推理确实能够有更好的表现。

  一篇来自微软的论文《EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning》发现,使用非英语语言进行推理不仅减少了 Token 消耗,还能保持准确性。即使将推理轨迹翻译回英语,这种优势依然存在,这表明这种变化源于推理行为的实质性转变,而非仅仅是表层的语言效应。

  在该论文中,作者,评估了三个最先进的开源推理模型:DeepSeek R1、Qwen 2.5 (32B) 和 Qwen 3 (235B-A22B),问题以英语呈现,但模型被明确指示以七种目标语言中的一种执行其推理步骤:中文 (zh)、俄语 (ru)、西班牙语 (es)、印地语 (hi)、阿拉伯语 (ar)、韩语 (ko) 和土耳其语 (tr)。最终答案必须以英语提供,以确保评估的一致性。

  Token 数量比率与在英语和目标语言中均至少有一个正确答案的问题数量(最少 5 个共同案例)的关系,该比率是相对于 DeepSeek R1 每个问题的平均英语 Token 数量计算得出的。

  在所有评估的模型和数据集上,与英语相比,使用非英语语言进行推理始终能实现 20-40% 的显著令牌降低,而且通常不影响准确性。DeepSeek R1 的 token 减少量从 14.1%(俄语)到 29.9%(西班牙语)不等,而 Qwen 3 则表现出更显著的节省,韩语的减少量高达 73%。这些效率提升直接转化为推理成本降低、延迟更低和计算资源需求降低。

  从实验结果来看,中文确实相比英文能够节省推理 token 成本,但却并不是最具有效率的语言。

  研究者们通过两个步骤构建了 OneRuler:首先为每个任务编写英语指令,然后与母语使用者合作将其翻译成另外 25 种语言。

  针对开放权重和闭源语言模型的实验表明,随着上下文长度从 8K 增加到 128K token,低资源语言与高资源语言之间的性能差距日益扩大。令人惊讶的是deepseek,英语并不是长上下文任务中表现最好的语言(在 26 种语言中排名第 6),而波兰语位居榜首。在指令和上下文语言不一致的跨语言场景中,根据指令语言的不同,性能波动幅度可达 20%。

  图 4:在长上下文任务(64K 和 128K)中,按语言资源组分类的各模型和语言的 NIAH 性能表现。Gemini 1.5 Flash 展现了最佳的长上下文性能,而出人意料的是,英语和中文并未进入排名前五的语言之列。

  国产大模型采用更多中文训练语料,其思考过程出现中文是正常现象。就像 AI 编程工具 Cursor 发布的新版本 2.0 核心模型「Composer-1」被质疑是中国模型套壳,正是因为其思考过程完全由中文构成。

  在今年 1 月份就有类似的事情发生,网友发现来自 OpenAI 的 o1-pro 模型也会随机出现中文思考过程。

  说不定有一天,我们能够像海外友人自嘲一样笑话大模型:「我并不是要你变成中国人。我是说 —— 当时机成熟时,你照照镜子,就会发现自己早已是中国人了。」原文出处:老外傻眼!明用英文提问,DeepSeek依然坚持中文思考,感谢原作者,侵权必删!

标签: deepseek

“老外傻眼!明用英文提问,DeepSeek依然坚持中文思考” 的相关文章

“韧性”“具身智能”“DeepSeek”入选2025年度“青年十大热词”

“韧性”“具身智能”“DeepSeek”入选2025年度“青年十大热词”

  新华财经上海12月25日电(杨子华)25日,上海市青少年研究中心发布“2025年度青年十大热词”,“韧性”“具身智能”“DeepSeek”“情绪消费”“主理人”“爱你老己”“从从容容游...

11月27日DeepSeek预测:灰熊vs鹈鹕,莫兰特缺阵威廉森能否率队终结连败

11月27日DeepSeek预测:灰熊vs鹈鹕,莫兰特缺阵威廉森能否率队终结连败

  新奥尔良鹈鹕将在冰沙王中心迎战孟菲斯灰熊,这是西部第15与第10名的直接对话。尽管鹈鹕坐拥超级巨星锡安·威廉森(场均22.4分+4助攻),但球队3胜15负的惨淡战绩已跌至联盟垫底。反观...

1月12日DeepSeek预测:马刺vs森林狼,文班亚马率队复仇,爱德华兹主场迎

1月12日DeepSeek预测:马刺vs森林狼,文班亚马率队复仇,爱德华兹主场迎

  西部强强对话即将上演!北京时间1月12日,圣安东尼奥马刺将客场挑战明尼苏达森林狼。目前马刺以27胜11负高居西部第二,森林狼则以25胜14负位列西部第四。两支球队近期状态火热,此役或将...

工程界顶级盛会在沪开幕,DeepSeek等入选2025全球十大工程成就

工程界顶级盛会在沪开幕,DeepSeek等入选2025全球十大工程成就

  今天上午,由世界工程组织联合会、中国科协、中国工程院、上海市人民政府共同举办2025世界工程组织联合会全体大会暨全球工程大会,在上海世博中心拉开帷幕。作为全球工程界的顶级盛会,本次大会...

11月8日DeepSeek预测:独行侠vs灰熊前瞻——莫兰特率队主场擒龙

11月8日DeepSeek预测:独行侠vs灰熊前瞻——莫兰特率队主场擒龙

  北京时间11月8日09:00,NBA常规赛将上演一场西部垫底球队的较量——达拉斯独行侠(2胜6负)客场挑战孟菲斯灰熊(3胜6负)deepseek。两支球队目前分列西部第15和第13位,...

1月16日DeepSeek预测:灰熊vs魔术,班凯罗率队捍卫主场,魔术小胜灰熊

1月16日DeepSeek预测:灰熊vs魔术,班凯罗率队捍卫主场,魔术小胜灰熊

  北京时间1月16日凌晨3点,NBA常规赛将迎来一场东西部球队之间的较量,奥兰多魔术将在主场迎战孟菲斯灰熊。魔术目前以22胜18负的战绩排名东部第6,而灰熊则以17胜22负的战绩位列西部...