当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

1年前 (2025-03-25)Deepseek最新资讯709

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

特斯联极特DeepSeek一体机发布,加速智能体商业场景落地

特斯联极特DeepSeek一体机发布,加速智能体商业场景落地

计算成本的加速下降,令大模型持续向端侧及边缘侧落地,越来越多的企业开始尝试用大模型技术实现不同模态数据间的相互理解和转换,催生了智能体的出现。有业内人士表示,智能体或将成为人类充分利用AI的关键所在。...

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 Dee...

启明创投创始人:中国创新药的“DeepSeek时刻”

启明创投创始人:中国创新药的“DeepSeek时刻”

中国AI DeepSeek引爆全球,但生物技术领域正在发生一场更为静默的革命。曾经生产仿制药的中国制药公司,现在正崛起成为快速、高效的药物发现领域的全球领导者。近日,资本市场关注到了创新药领域的这场革...

deepseek无法响应怎么办

deepseek无法响应怎么办

deepseek无法响应怎么办如果您遇到DeepSeek无法响应的情况,可以尝试以下几种方法来解决问题:错峰使用:尽量避免在工作日的工作时间、晚上以及周末等高峰时段使用DeepSeek。可以选择在清晨...

读懂DeepSeek+|DeepSeek提供的购车指南靠谱吗?

读懂DeepSeek+|DeepSeek提供的购车指南靠谱吗?

蛇年春节期间,DeepSeek横空出世。大量用户向DeepSeek抛出各种各样的问题,形成了“别管啥事儿问AI”的热潮。有人用它来制定健身减肥计划,有人用它来做投资规划,甚至还有人上传了自己股票持仓情...

华为首款鸿蒙电脑接入 DeepSeek,模型与芯片深度协同

华为首款鸿蒙电脑接入 DeepSeek,模型与芯片深度协同

IT之家 5 月 8 日消息,在今日盛大举行的鸿蒙电脑技术与生态沟通会上,华为首款鸿蒙电脑正式揭开神秘面纱,惊艳亮相。这一消息瞬间引发了科技圈的广泛关注,众多业内人士与科技爱好者都对这款具有开创性意义...