当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源新模型

2周前 (10-21)Deepseek最新资讯98

  在GitHub()上可以看到其最新模型名为DeepSeek-OCR,还是一款OCR(光学字符识别)模型,该模型的参数量为3B。

  DeepSeek 表示,DeepSeek-OCR 模型是通过光学二维映射(将文本内容压缩到视觉像素中)来高效压缩长文本上下文。

  该模型主要由 DeepEncoder 和 DeepSeek3B-MoE-A570M 解码器两大核心组件构成。其中 DeepEncoder 作为核心引擎,既能保持高分辨率输入下的低激活状态,又能实现高压缩比,从而生成数量适中的视觉 token。

  简而言之,一张包含文档文本的图像可以用比等效文本少得多的 Token 来表示丰富的信息,这表明:通过视觉 Token 进行光学压缩可以实现高得多的压缩率。

  基于这一洞见,DeepSeek 从以 LLM 为中心的视角重新审视了视觉语言模型 (VLM),其中,他们的研究重点是:视觉编码器如何提升 LLM 处理文本信息的效率,而非人类已擅长的基本视觉问答 (VQA) 任务。DeepSeek 表示,OCR 任务作为连接视觉和语言的中间模态,为这种视觉 - 文本压缩范式提供了理想的试验平台,因为它在视觉和文本表示之间建立了自然的压缩 - 解压缩映射,同时提供了可量化的评估指标。

  鉴于此,DeepSeek-OCR 便由此而生。这是一个为实现高效视觉 - 文本压缩而设计的 VLM。

  如图所示,DeepSeek-OCR 采用了一个统一的端到端 VLM 架构,由一个编码器和一个解码器组成。

  DeepSeek-OCR 的创新架构不仅实现了高效的视觉-文本压缩,更在实际应用中展现出强大的性能潜力。

  在编码器层面,DeepSeek创造性地将SAM-base的局部感知能力与CLIP-large的全局理解优势相结合。就像一位经验丰富的古籍修复师,它既能用显微镜精准识别每个字符的细节(窗口注意力),又能用广角镜把握整篇文档的版式结构(全局注意力)。特别值得注意的是其创新的16倍下采样机制——这相当于将一本300页的书籍压缩到20页的体量,却仍能保留97%的关键信息。

  而MoE解码器采用的混合专家机制犹如一个专业翻译团队:面对不同语种、不同版式的文档时,系统会自动激活最擅长的6位专家协同工作。这种动态资源调配使得3B参数的大模型在实际运行时仅需570M参数的计算开销,在A100显卡上就能实现每天20万页的处理效率——相当于100名专业录入员的工作量。

  这也意味着DeepSeek-OCR存在广泛应用潜力,在金融领域deepseek,它可以将厚厚的财报瞬间转为结构化数据;在医疗行业,能快速数字化历史病历档案;对出版机构而言,古籍数字化效率将提升数十倍。更值得关注的是,该模型展现出的视觉记忆特性,为突破大语言模型的上下文长度限制提供了全新思路。原文出处:DeepSeek开源新模型,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源新模型” 的相关文章

2025年8月读书课:《如何用deepseek做投资》

2025年8月读书课:《如何用deepseek做投资》

  大家好,又到了我们每月一次的深度分享课。这次换个口味:不谈十几年前的旧书,聚焦2025年大放异彩的人工智能工具——DeepSeek、Kimi等。它们好用、实用,如何移植到投资战场?怎样...

腾讯、抖音、快手、B站、DeepSeek等平台官宣

腾讯、抖音、快手、B站、DeepSeek等平台官宣

  国家互联网信息办公室、工业和信息化部、公安部、国家广播电视总局四部门联合发布的《人工智能生成合成内容标识办法》(以下简称《办法》),自9月1日起正式施行。《办法》明确所有AI生成的文字...

DeepSeek梁文锋论文登《自然》封面,回应模型蒸馏质疑

DeepSeek梁文锋论文登《自然》封面,回应模型蒸馏质疑

  #智见科技快讯 DeepSeek梁文锋论文登《自然》封面,文章正面回应模型发布之初的蒸馏质疑deepseek。Nature:这一空白“终于被DeepSeek打破”#新华智见原文出处:D...

DeepSeek预测:布伦特福德vs曼城,哈兰德8球屠杀or蜜蜂蛰伤蓝月?

DeepSeek预测:布伦特福德vs曼城,哈兰德8球屠杀or蜜蜂蛰伤蓝月?

  2025赛季英超第7轮即将上演一场颇具看点的对决,布伦特福德将在Gtech社区球场迎战卫冕冠军曼城。目前布伦特福德排名联赛第13位,积7分;曼城则暂列第7位,积10分。两队之间仅有3分...

技术应用 DeepSeek赋能经营洞察,助力专业决策——北银金科小京财

技术应用 DeepSeek赋能经营洞察,助力专业决策——北银金科小京财

  在市场竞争愈发激烈的当下,快速处理财务信息、敏锐洞察运营状况、精准支持决策制定,成为企业管理者对财务分析的迫切需求。而对于企业的其他利益相关者而言,能够及时掌握企业的经营状况,更是他们...

DeepSeek预测:国际米兰VS都灵!蓝黑军团主场碾压?劳塔罗领衔火力全开

DeepSeek预测:国际米兰VS都灵!蓝黑军团主场碾压?劳塔罗领衔火力全开

  2025-26赛季意甲首轮焦点战,国际米兰将在梅阿查球场迎战都灵。蓝黑军团上赛季排名第2,而都灵仅列第11,双方实力差距明显。从历史交锋看,近5次对决国际米兰全胜且4场零封deepse...