当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞

8个月前 (10-22)Deepseek最新资讯269

  据新浪科技报道,近日DeepSeek再次新发布并开源的OCR模型,从根本上改变了AI游戏规则。Github开源项目DeepSeek-OCR,一夜收获超4k星。相关论文(《DeepSeek OCR:上下文光学压缩》)解释了这一研究成果。

  传统OCR如同“文字扫描仪”,通过光学技术将图像中的文字提取转换为计算机和人都能理解的格式。比如,在将大量票据、证件、表单等数据电子化时,OCR发挥关键作用。

  但DeepSeek却反其道而行之——将文本信息“绘制”为视觉图像,再通过视觉模型实现高效理解。如此创新尝试就是为了解决大模型的核心痛点——处理长文本时面临的计算挑战deepseek

  10页密密麻麻的文本报告,被压缩成一张图片,AI能够一眼读懂它。这样的信息处理效率意味着大幅降低了计算复杂度,用最直接的方式节约成本。

  最近还在锐评AI发展的OpenAI创始团队成员、特斯拉前AI总监Karpathy,对DeepSeek新成果直言喜爱,并指出“早就该让视觉成为AI核心,而非依赖烂透了的文本分词器。”

  更有业内大佬感叹,“当文本能被转化为视觉可理解的结构,语言与视觉的统一或许不再是理论。这可能是通往 AGI(通用人工智能)的关键一步。

  深度学习模型的记忆以分布式参数形式存储,这种非结构化存储导致传统神经网络在学习新任务时,旧知识的参数空间会被新知识覆盖,模型无法做到像人类一样进行连贯推理。

  而DeepSeek的想法是,通过视觉-文本压缩范式和动态分层遗忘机制,让AI“记住该记住的,忘记该忘记的”。

  其核心思路是将文本信息转化为视觉token,通过光学压缩实现高效记忆管理,同时模拟人类遗忘曲线动态调整信息留存。原文出处:DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞” 的相关文章

期待开启属于智驾领域的“DeepSeek时刻”(附图片)

期待开启属于智驾领域的“DeepSeek时刻”(附图片)

  今年全国两会,全国人大代表、小鹏汽车董事长兼CEO何小鹏聚焦产业科技创新相关热点话题,带来了关于加快推动自动驾驶技术从L2跨越到L4,完善法规与管理政策的建议。   ...

DeepSeek预测:富勒姆vs热刺!农场主主场狂轰滥炸,热刺防线崩盘在即?

DeepSeek预测:富勒姆vs热刺!农场主主场狂轰滥炸,热刺防线崩盘在即?

  英超第28轮即将上演一场伦敦德比,富勒姆将在克拉文农场球场迎战热刺。目前富勒姆排名第10,积37分,距离欧战区8分;而热刺仅排名第16,积29分,距离降级区仅有4分之差。这场比赛对于双...

DeepSeek新模型MODEL1曝光

DeepSeek新模型MODEL1曝光

  【TechWeb】1月21日消息,DeepSeek的下一代旗舰模型疑似提前曝光。在其官方GitHub代码库的更新中,一个名为“MODEL1”的新模型名称在多个技术文件中频繁出现,引发了...

3月17日DeepSeek预测:独行侠vs鹈鹕,弗拉格对决墨菲三世,鹈鹕主场险胜

3月17日DeepSeek预测:独行侠vs鹈鹕,弗拉格对决墨菲三世,鹈鹕主场险胜

  北京时间3月17日,NBA常规赛将迎来一场西部中下游球队的较量,鹈鹕将在主场迎战独行侠。两支球队目前分别排名西部第13和第12,胜率均不足35%,但近期状态有所回升,这场比赛对于双方来...

紫光股份(000938.SZ):控股子公司新华三与DeepSeek在大模型训练等

紫光股份(000938.SZ):控股子公司新华三与DeepSeek在大模型训练等

  公司控股子公司新华三与DeepSeek在大模型训练、推理优化deepseek、解决方案及一体机部署等领域保持持续深度的常态化沟通和技术合作,目前在政府、企业、运营商、电力能源、教育、医...

行业最多!海尔3项案例入选2025年度中国轻工业数字化转型“领航者”

行业最多!海尔3项案例入选2025年度中国轻工业数字化转型“领航者”

  近日,以“AI赋能 消费焕新”为主题的第十五届中国轻工业信息化大会在北京召开,大会正式发布《2025年度轻工业数字化转型“领航者”案例名单》,为轻工行业企业深入推进新型工业化建设提供路...