当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源OCR 2新模式,机器视觉编码逻辑更像“人类”

5个月前 (01-27)Deepseek最新资讯86

  新浪科技讯 1月27日下午消息,DeepSeek团队今日《DeepSeek-OCR 2: Visual Causal Flow》论文并开源了DeepSeek-OCR 2模型。据悉,该模型采用创新的DeepEncoder V2架构,实现了视觉编码从固定扫描向语义推理的范式转变,可让AI能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。

  据悉,在维持极高数据压缩效率的同时,DeepSeek-OCR 2 在多项基准测试和生产指标上均取得了显著突破。模型仅需 256 到 1120 个视觉 Token 即可覆盖复杂的文档页面,这在同类模型中处于极低水平deepseek,显著降低了下游 LLM 的计算开销。在 OmniDocBench v1.5 评测中,其综合得分达到 91.09%,较前代提升了 3.73%,特别是在阅读顺序识别方面表现出了更强的逻辑性。原文出处:DeepSeek开源OCR 2新模式,机器视觉编码逻辑更像“人类”,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源OCR 2新模式,机器视觉编码逻辑更像“人类”” 的相关文章

2025新质生产力示范案例发布 华为云CloudMatrix AI Infra荣

2025新质生产力示范案例发布 华为云CloudMatrix AI Infra荣

  AI迈入深耕产业、赋能实体的“下半场”,行业重心正从参数比拼,转向千行百业的规模化应用落地。1月29日,第二届“新质生产力产业实践洞见活动”在京举办,会上环球时报、中国科协企业创新服务...

数据市场价值共创主题活动在乌镇举办,多项成果发布

数据市场价值共创主题活动在乌镇举办,多项成果发布

  11月8日,2025年世界互联网大会“互联网之光”博览会·数据市场价值共创主题活动和数据产业合作对接活动在乌镇举办。本次活动由数据要素社主办,活动现场多项数据市场价值共创成果发布。...

中国活跃开源项目已超300万

中国活跃开源项目已超300万

  11月21日,2025开放原子开发者大会在京开幕。大会聚焦人工智能与开源技术的深度融合,全面展现开源生态在推动产业创新、培育新质生产力方面的核心价值。   在会上,开...

去年DeepSeek今年OpenClaw,AI“龙虾风暴”重塑科研范式?

去年DeepSeek今年OpenClaw,AI“龙虾风暴”重塑科研范式?

  在日前举行的香港科技大学上海中心“AI FOR DISCOVERY:从范式革命到产业重构”学术峰会上,与会院士、科学家纷纷提到人工智能领域近期爆火的“龙虾”。这一热梗源自开源AI智能体...

DeepSeek预测:罗马VS维罗纳!红狼主场碾压升班马?苏莱+佩莱格里尼双核驱

DeepSeek预测:罗马VS维罗纳!红狼主场碾压升班马?苏莱+佩莱格里尼双核驱

  意甲第5轮即将迎来一场看似实力悬殊的对决——排名第4的罗马坐镇奥林匹克球场迎战第15名的维罗纳。主队目前3胜1负积9分紧咬欧冠区,而客队3平1负尚未尝胜绩。但足球的魅力就在于,数据未必...

DeepSeek预测:布莱顿vs曼城!哈兰德能否轰爆海鸥防线?预测3-1蓝月军团

DeepSeek预测:布莱顿vs曼城!哈兰德能否轰爆海鸥防线?预测3-1蓝月军团

  英超第3轮即将上演一场看似悬殊的对决——排名18的布莱顿主场迎战第6的曼城。但翻开历史交锋,海鸥军团近5次面对蓝月亮竟取得2胜2平1负!上赛季更是客场2-2逼平曼城,主场2-1爆冷取胜...