当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞

1周前 (10-22)Deepseek最新资讯92

  据新浪科技报道,近日DeepSeek再次新发布并开源的OCR模型,从根本上改变了AI游戏规则。Github开源项目DeepSeek-OCR,一夜收获超4k星。相关论文(《DeepSeek OCR:上下文光学压缩》)解释了这一研究成果。

  传统OCR如同“文字扫描仪”,通过光学技术将图像中的文字提取转换为计算机和人都能理解的格式。比如,在将大量票据、证件、表单等数据电子化时,OCR发挥关键作用。

  但DeepSeek却反其道而行之——将文本信息“绘制”为视觉图像,再通过视觉模型实现高效理解。如此创新尝试就是为了解决大模型的核心痛点——处理长文本时面临的计算挑战deepseek

  10页密密麻麻的文本报告,被压缩成一张图片,AI能够一眼读懂它。这样的信息处理效率意味着大幅降低了计算复杂度,用最直接的方式节约成本。

  最近还在锐评AI发展的OpenAI创始团队成员、特斯拉前AI总监Karpathy,对DeepSeek新成果直言喜爱,并指出“早就该让视觉成为AI核心,而非依赖烂透了的文本分词器。”

  更有业内大佬感叹,“当文本能被转化为视觉可理解的结构,语言与视觉的统一或许不再是理论。这可能是通往 AGI(通用人工智能)的关键一步。

  深度学习模型的记忆以分布式参数形式存储,这种非结构化存储导致传统神经网络在学习新任务时,旧知识的参数空间会被新知识覆盖,模型无法做到像人类一样进行连贯推理。

  而DeepSeek的想法是,通过视觉-文本压缩范式和动态分层遗忘机制,让AI“记住该记住的,忘记该忘记的”。

  其核心思路是将文本信息转化为视觉token,通过光学压缩实现高效记忆管理,同时模拟人类遗忘曲线动态调整信息留存。原文出处:DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞” 的相关文章

10月25日DeepSeek预测:爵士vs国王,爵士客场力克国王,凯斯勒与拉文对

10月25日DeepSeek预测:爵士vs国王,爵士客场力克国王,凯斯勒与拉文对

  NBA常规赛即将迎来一场西部对决,爵士客场挑战国王。爵士作为西部排名第4的球队,本赛季开局表现出色,而国王则暂列西部第12,急需一场胜利来提升排名。   爵士目前1胜...

九章+DeepSeek双擎驱动,好未来AI重塑教育全链条

九章+DeepSeek双擎驱动,好未来AI重塑教育全链条

  T4学习机的AI助手正引导一名孩子逐步拆解复杂的数学难题;而几步之遥,另一名小观众则沉浸在素养机器人的拼搭挑战中——在上海世博展览馆内学而思展台上围满了前来体验的小观众们。随着以大模型...

Deepseek推荐全国旅游百强区第34名:安徽黄山市屯溪区

Deepseek推荐全国旅游百强区第34名:安徽黄山市屯溪区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

陈天桥联手清华教授代季峰首发最强开源AI模型项目,全力打造下一个DeepSeek

陈天桥联手清华教授代季峰首发最强开源AI模型项目,全力打造下一个DeepSeek

  国内 AI 领域科学家、清华大学电子工程系副教授代季峰,与创新企业家、慈善家、天桥脑科学研究院创始人陈天桥联手筹备一家致力于打造通用人工智能(AGI)新公司一事,引发广泛关注。...

10月30日DeepSeek预测:国王vs公牛,武切维奇率队捍卫主场,拉文难救主

10月30日DeepSeek预测:国王vs公牛,武切维奇率队捍卫主场,拉文难救主

  东部劲旅公牛坐镇联合中心迎战西部弱旅国王,目前公牛以3胜0负(胜率100%)高居东部第二,而国王1胜3负(胜率25%)仅列西部第13。此役若公牛取胜将巩固榜首位置,国王若再败则可能跌至...

2025上半年用户增速最快的亿级APP:DeepSeek 豆包 红果

2025上半年用户增速最快的亿级APP:DeepSeek 豆包 红果

  数智世界风起云涌,互联网新旧迭代,AIGC蓬勃而出。前瞻钱瞻联合m360推出每日科技互联网前瞻,从更全面的视野、更广阔的视域,洞察行业跌宕起伏,在趋势前瞻中把握市场脉动,引领敏捷增长风...