当前位置:首页 > Deepseek最新资讯 > 正文内容

汇正财经预测:DeepSeek的出现,有望让AI终端落地

1年前 (2025-02-25)Deepseek最新资讯549

2025年1月20日,DeepSeek 发布并开源DeepSeek-R1模型,其在极少标注数据下通过强化学习极大提升推理能力,在各项任务上性能比肩OpenAIo1正式版,获英伟达等众多国内外科技巨头支持,软件下载量全球居首。作为一家专业的投资咨询机构,汇正财经预测,DeepSeek的出现,有望加速AI终端商业落地进程。

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。2025年1月20日,DeepSeek 正式发布DeepSeek-R1模型,在仅有极少标注数据的情况下,极大提升了模型推理能力。其成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了 Meta 内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。

在2024年美国数学邀请赛里,R1得分率是79.8%,比o1的79.2%还高;MATH-500 测试里,R1得分率97.3%,同样高于o1的96.4%;软件工程任务测试,R1得分49.2%,也比o1的48.9%高;代码测试Codeforces里,R1得分率只比o1低0.3%,整体性能和o1差不多。而且,DeepSeek 团队还根据R1的输出,提炼出6个小模型也开源了。其中 32B 和70B参数的模型,好多能力都和 OpenAIo1-mini 差不多。

面对如此优秀的成绩,国内外各大互联网公司都宣布把DeepSeek-R1模型用到自己的云服务或者硬件里。到2月1日,DeepSeek的AI软件在全球140个市场的移动应用下载量排第一。

在AI行业里,大模型调用成本降低,说明这个行业在走向成熟,中小规模的市场应用就能更多地调用模型,AI就能用到更多细分领域。经汇正财经分析,DeepSeek-R1模型既能通用,能力又能扩展,还开源了模型权重,允许用户用模型输出、通过模型蒸馏等方法训练其他端侧模型,这就给各种AI终端开发者提供了机会,很可能让AI终端更快地在商业上落地。


“汇正财经预测:DeepSeek的出现,有望让AI终端落地” 的相关文章

DeepSeek在政务服务智能审批有哪些优势?

DeepSeek在政务服务智能审批有哪些优势?

DeepSeek在政务服务智能审批中展现出诸多优势,这些优势显著提升了政务服务的效率和质量。以下是DeepSeek在政务服务智能审批中的主要优势:1. 高效响应与处理速度快速响应:DeepS...

DeepSeek致谢腾讯大模型网络提速技术方案贡献,助力大模型通信性能提升30%

DeepSeek致谢腾讯大模型网络提速技术方案贡献,助力大模型通信性能提升30%

5月7日,科技领域迎来一则备受瞩目的消息:腾讯技术团队针对DeepSeek开源的DeepEP通信框架展开了深度且细致的优化工作,经过不懈努力,成功让该框架在多种复杂多变的网络环境下均实现了显著的性能提...

R2来之前,DeepSeek又放了个烟雾弹

R2来之前,DeepSeek又放了个烟雾弹

5 月前后,DeepSeek 的动作倒是频繁,却都不是大家期待的 R2。不过,一系列前菜已经给 R2 做足了铺垫。5 月 14 日,一篇 DeepSeek V3 论文,揭示了梁文峰是如何做到 &quo...

美图设计室AI图文接入DeepSeek R1,解锁一站式创作新体验

美图设计室AI图文接入DeepSeek R1,解锁一站式创作新体验

近日,美图公司旗下美图设计室AI图文宣布接入DeepSeek大模型,实现文案、笔记封面和内页排版的一键输出,为用户解锁一站式AI图文创作新体验,提升自媒体内容生产效率和笔记点击率。效率低、专业门槛高、...

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

机器之心报道机器之心编辑部开源社区的人应该对 vLLM 不陌生,它是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和资源利用率(尤...

高能云科技:中国创新药迎来“DeepSeek时刻”产业跃迁

高能云科技:中国创新药迎来“DeepSeek时刻”产业跃迁

2025年5月29日,国家药监局单日批准11款国产创新药上市,创下月度纪录新高。其中7款为的1类新药,覆盖肿瘤、内分泌等重大疾病领域。与此同时,中国药企在ASCO年会携71项研究成果震撼全球,首付款超...