当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

3个月前 (03-25)DeepSeek技术交流245

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

体制内、党政机关写材料,DeepSeek写公文提示词大全

体制内、党政机关写材料,DeepSeek写公文提示词大全

一、通知类文书作为[机构全称]的[职位信息],拟制[特定事项]工作通知。必备模块:[职责划分]、[关键环节]、[执行标准],行文参照《党政机关公文格式》,禁用修饰语,采用"一、二、三&quo...

和而泰:智能化业务板块已接入DeepSeek大模型并完成本地化部署和测试

和而泰:智能化业务板块已接入DeepSeek大模型并完成本地化部署和测试

金融界4月2日消息,有投资者在互动平台向和而泰提问:请问贵公司多个行业数智化模型(方案)已全面接入DeepSeek并进行了本地化部署,同时已启动应用于多个行业头部客户业务场景的相关合作项目。这些行业数...

信安世纪:已完成包括DeepSeek在内的主流大模型本地化部署

信安世纪:已完成包括DeepSeek在内的主流大模型本地化部署

每经AI快讯,信安世纪(688201)2月28日在互动平台表示,公司已经完成包括DeepSeek在内的主流大模型本地化部署,正在进行相关产品的对接接入工作,今年暂无推出DeepSeek一体机计划。...

官宣!海信电视正式接入DeepSeek

官宣!海信电视正式接入DeepSeek

2月11日,海信电视宣布正式接入DeepSeek,并支持满血R1和V3版本自由切换,成为行业首个搭载深度思考智能体的电视品牌。目前,海信电视正在进行用户终端的升级发布,预计3-5天内,所有搭载智能体的...

360推出DS大模型安全解决方案 守护DeepSeek发展

360推出DS大模型安全解决方案 守护DeepSeek发展

360集团基于对大模型安全风险的深入研究,推出DS大模型安全解决方案,旨在覆盖大模型训练、推理、运营等全过程,促进国产大模型企业向安全、向善、可信、可控的方向发展。该方案针对系统安全、数据安全、内容安...

DeepSeek已经给儿童看病了 业内:“D医生”不为建议担责

DeepSeek已经给儿童看病了 业内:“D医生”不为建议担责

DeepSeek热潮下,有人拿它算命,有人用它看病。近日互联网上出现大量用DeepSeek求医问药的帖子,有观点称DeepSeek有三甲医院专家水平,也有不少人对AI看病开方表现出审慎态度。甚至这位“...