当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini

3个月前 (01-27)Deepseek最新资讯83

  【新智元导读】DeepSeek开源DeepSeek-OCR2,引入了全新的DeepEncoder V2视觉编码器deepseek。该架构打破了传统模型按固定顺序(从左上到右下)扫描图像的限制,转而模仿人类视觉的「因果流(Causal Flow)」逻辑。

  这一次,DeepSeek更进一步,对视觉编码器下手了,提出了一种全新的DeepEncoder V2架构,实现了视觉编码从「固定扫描」向「语义推理」的范式转变!

  DeepSeek-OCR2不仅能像人类一样按逻辑顺序阅读复杂文档,还在多项基准测试中刷新了SOTA。

  这就像是给机器装上了「人类的阅读逻辑」,让AI不再只是死板地从左上到右下扫描图像,而是能根据内容语义灵活调整阅读顺序。

  DeepSeek在论文中指出,传统的视觉语言模型(VLM)通常采用光栅扫描(Raster-Scan)顺序处理图像,即固定地从左到右、从上到下。

  人类在看图或阅读文档时,目光是随着逻辑流动的:先看标题,再看正文,遇到表格会按列或按行扫视,遇到分栏会自动跳跃。

  它最大的特点是用一个轻量级的大语言模型(Qwen2-0.5B)替换了原本的CLIP编码器,并设计了一种独特的「因果流查询」(Causal Flow Query)机制。

  它不仅处理视觉Token,还引入了一组可学习的「查询Token」(Query Tokens)。

  编码器通过可学习的查询对视觉Token进行语义重排,随后的LLM解码器则在这个有序序列上进行自回归推理。

  这意味着,DeepSeek-OCR2在编码阶段就已经把图像里的信息「理顺」了,而不是一股脑地扔给解码器。

  DeepSeek披露,在处理在线用户日志图像时,OCR结果的重复率从6.25%降到了4.17%;在PDF数据生产场景中,重复率从3.69%降到了2.88%。

  这不仅是一个OCR模型的升级,更是迈向原生多模态(Native Multimodality)的重要一步。

  未来,同一个编码器只要配备不同的模态查询嵌入(Query Embeddings),就能处理文本、图片、音频等多种模态的数据,真正实现万物皆可Token,万物皆可因果推理。

  DeepSeek表示,虽然目前光学文本识别(OCR)是LLM时代最实用的视觉任务之一,但这只是视觉理解宏大图景的一小部分。原文出处:DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek又拿第一!首创「因果流」视觉推理,超越Gemini” 的相关文章

盘中必读豆包月活超越DeepSeek!字节概念大涨,线上线下20CM封板

盘中必读豆包月活超越DeepSeek!字节概念大涨,线上线下20CM封板

  9月16日,A股市场字节跳动概念股集体走强,其中线上线下早盘快速拉升,20CM封涨停,截至午市收盘,线上线下报单日成交额超6亿元,换手率激增至18%,领涨整个字节生态板块。与此同时,板...

11月5日DeepSeek预测:魔术vs老鹰,班凯罗对决约翰逊,老鹰主场险胜

11月5日DeepSeek预测:魔术vs老鹰,班凯罗对决约翰逊,老鹰主场险胜

  北京时间11月5日,NBA常规赛将迎来一场东部中游球队的焦点对决,奥兰多魔术客场挑战亚特兰大老鹰。两支球队目前战绩同为3胜4负,分列东部第9和第10位,这场比赛的胜负将直接影响季后赛席...

DeepSeek预测:巴塞罗那vs比利亚雷亚尔巅峰对决!莱万+亚马尔领衔宇宙队碾

DeepSeek预测:巴塞罗那vs比利亚雷亚尔巅峰对决!莱万+亚马尔领衔宇宙队碾

  北京时间2月28日23:15,西甲第26轮将上演焦点战——领头羊巴塞罗那坐镇Spotify诺坎普球场迎战第三名比利亚雷亚尔。目前巴萨以61分领跑积分榜,仅领先第二名皇马1分;而黄潜51...

周鸿祎发布2026年20个AI预言:我们正迈向百亿智能体时代

周鸿祎发布2026年20个AI预言:我们正迈向百亿智能体时代

  1月9日,360集团创始人周鸿祎在其个人社交平台发布题为《2026年AI全景预测:迈向百亿智能体时代的20个发展趋势》的重磅观点,系统提出对人工智能未来一年发展的二十大核心预测。他指出...

吉大通信:公司的智慧食堂平台已接入deepseek

吉大通信:公司的智慧食堂平台已接入deepseek

  请问贵公司在通信网络技术、算力数据中心建设、智慧食堂等业务中,是否积累了大量数据资源?而数据资源作为宝贵的数据类资产,这些数据资源是否经过运用数据清洗deepseek、数据分析、数据挖...

3月11日DeepSeek预测:灰熊vs76人,马克西缺阵或成胜负手

3月11日DeepSeek预测:灰熊vs76人,马克西缺阵或成胜负手

  在3月11日的NBA常规赛中,费城76人将在主场迎战孟菲斯灰熊。这场比赛对于两支球队来说都至关重要,76人目前以34胜30负的战绩排名东部第8,正处于季后赛附加赛的关键位置;而灰熊则以...