当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源全新OCR模型！弃用CLIP改用Qwen轻量小模型

5个月前 (01-28)Deepseek最新资讯78

　　相较于去年10月20日发布的初代模型，DeepSeek-OCR 2的核心突破在于打破了传统模型死板的“光栅扫描”逻辑，实现了

　　为此，DeepSeek-OCR 2弃用了前作中的CLIP组件，转而使用轻量化的语言模型（Qwen2-0.5B）构建DeepEncoder V2，在视觉编码阶段就引入了“因果推理”能力。

　　编码器负责将图像离散化为视觉标记（Visual Tokens），解码器则结合这些标记与用户指令生成最终文本输出。

　　传统的视觉编码器通常按照固定的“光栅扫描”（从左到右、从上到下）顺序处理图像，这在面对复杂版面（如双栏文档、错落的表格）时，往往会切断语义的逻辑连贯性。

　　将此前的CLIP组件替换为轻量化的LLM架构（Qwen2-0.5B），这一转变赋予了编码器因果推理能力

　　为了实现这种智能重排，DeepEncoder V2引入了一种全新的双流注意力机制，其底层逻辑通过一个定制的注意力掩码（Attention Mask）来约束：

　　这种设计使得视觉标记之间互不干扰（保持原始特征），但每一个查询标记却被强制要求只能“看到”它之前的标记以及所有的视觉标记。

　　相比传统的交叉注意力结构，这确保视觉信息在所有层中都保持“活跃”，从而与因果查询进行深度信息交换。

　　而在V2中，通过查询标记（Learnable Query）的重排，模型在进入主解码器之前，就已经在编码器内部完成了一次“逻辑理顺”

　　首先是一开头的视觉分词器（SAM），其沿用了此前的架构，采用了80M参数的SAM-base架构，并结合两层卷积层。

　　输出维度从前代的1024优化缩减至896，以对齐后续管线，这套分词器的设置实现了16倍的标记压缩

　　这种基于压缩的设计，以极小的参数开销，极大地释放了后续全局注意力模块的计算压力，让模型运行更轻快。

　　此外，为了在处理不同分辨率图像时“不丢细节”，DeepSeek-OCR 2在编码阶段还引入了灵活的裁剪方案：

　　最终输入LLM的标记总数稳定在256到1120之间，与Gemini-1.5 Pro的视觉预算相匹配。

　　最后，在后端解码器部分，DeepSeek-OCR 2保留了3B参数的MoE结构（实际激活参数仅约 500M）。

　　在数据策略上，DeepSeek-OCR 2延续了与前代相同的数据源，OCR相关数据占比达80%deepseek。

　　二是标签精简化，合并了如“图片说明”与“标题”等语义相似的布局标签。这种极小的底层差异，确保了其与基准测试之间具备高度的一致性与可比性。

　　在实验阶段，DeepSeek-OCR 2主要在OmniDocBench v1.5上进行评估，包含1355个页面，涵盖杂志、学术论文、研究报告等9大类文档。

　　在实际生产中，在线用户日志的重复率从6.25%降至4.17%，PDF 生产数据重复率从 3.69% 降至 2.88%，证明了模型逻辑视觉理解能力的提升。

　　整体来看，DeepSeek-OCR 2在保持高压缩率的同时实现了显著的性能提升验证了使用语言模型架构作为视觉编码器的可行性，这为迈向统一的全模态编码器（omni-modal encoder）提供了路径。

　　李宇琨，谷歌学术论文近万引研究员，也持续参与了包括DeepSeek V2/V3在内的多款模型研发。原文出处：DeepSeek开源全新OCR模型！弃用CLIP改用Qwen轻量小模型，感谢原作者，侵权必删！

标签: deepseek

返回列表

上一篇：DeepSeek重大发布，国产AI大模型再掀狂潮！港股通科技ETF汇添富(520

下一篇：中智集团：以央企担当为高质量发展夯实人才根基

“DeepSeek开源全新OCR模型！弃用CLIP改用Qwen轻量小模型” 的相关文章

百度文心大模型X1.1正式发布：超越DeepSeek R1、打平GPT-5

　　百度王海峰介绍，文心大模型X1是基于文心大模型4.5训练而来的深度思考模型，升级后的X1.1主要采用了迭代式混合强化学习训练框架。　　一方面通过混合强化学习，同时提...

华为昇腾AI芯片调试中，后续将加速deepseek进程并保障安全

　　刚开始用华为昇腾AI芯片，不匹配是正常的deepseek，等调试好了，后面deepseek就进展快了，而且还能保证安全。用英伟达的说不定就有后门！原文出处：华为昇腾AI芯片调试中，后续...

12月30日DeepSeek预测：老鹰vs雷霆，西部霸主主场轻取残阵老鹰？亚历山

　　北京时间12月30日，NBA常规赛将迎来一场东西部对决——亚特兰大老鹰客场挑战俄克拉荷马雷霆。目前雷霆以27胜5负高居西部第一，而老鹰15胜18负仅列东部第10。从近期状态来看，老鹰遭...

1月10日DeepSeek预测：老鹰vs掘金，约基奇缺阵，掘金主场险胜

　　北京时间1月10日上午10点，NBA常规赛将迎来一场东西部对决，西部第三的丹佛掘金（25胜12负）坐镇高原主场迎战东部第九的亚特兰大老鹰（18胜21负）。尽管掘金近期遭遇核心约基奇伤停...

2月23日DeepSeek预测：骑士vs雷霆，米切尔率队挑战西部霸主，骑士有望复

　　NBA常规赛即将迎来一场东西部强强对话，东部第四的克利夫兰骑士将客场挑战西部第一的俄克拉荷马雷霆。这场比赛不仅是东西部顶级球队的较量，更是骑士队寻求复仇的良机，他们在本赛季首次交锋中以...

DeepSeek预测：拉齐奥vs罗马！蓝鹰主场能否啄伤红狼？苏莱vs卡斯特拉诺斯

　　2025赛季意甲第4轮将迎来焦点战——拉齐奥坐镇罗马奥林匹克球场迎战同城死敌罗马。目前拉齐奥3分排名第12，罗马6分暂列第6，两队分差仅3分却横跨欧战区门槛。蓝鹰若胜将反超对手跻身欧战...