当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

4个月前 (03-25)DeepSeek技术交流328

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

玉禾田:将Deepseek 671B模型接入大管家平台

玉禾田:将Deepseek 671B模型接入大管家平台

金融界4月1日消息,有投资者在互动平台向玉禾田提问:董秘你好请问贵公司是否部署Deepseek,如果有具体运用在哪方面?公司回答表示:公司已将Deepseek 671B满血模型接入大管家平台,并已在构...

平凉市成功接入DeepSeek大模型,“萍萍助手”上线运行

平凉市成功接入DeepSeek大模型,“萍萍助手”上线运行

3月6日,平凉市成功接入DeepSeek大模型,在市政府网站、甘肃政务服务网平凉子站、12345热线平台上线“萍萍助手”智能问答功能,赋能数字政府建设,实现智能问答场景应用创新。“萍萍助手”“萍萍助手...

中华保险接入Deepseek大模型 实现技术新突破

中华保险接入Deepseek大模型 实现技术新突破

近日,中华保险旗下中华财险宣布已完成基于国产大模型DeepSeek的本地化部署,标志着其在保险科技领域的进一步突破。此次部署不仅是技术上的升级,更是中华保险旗下中华财险在数字化转型中的重要一步。未来,...

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File)...

慧辰股份接入deepseek大模型“慧AI智能应用平台”和“融合算力服务管理平台”

慧辰股份接入deepseek大模型“慧AI智能应用平台”和“融合算力服务管理平台”

每经快讯,慧辰股份在互动平台表示,公司目前已经接入DeepSeek大模型,将与公司AI及算力产品深度融合,赋能公司已经发布的“慧AI智能应用平台”和“融合算力服务管理平台”。慧辰股份股吧慧辰股份接入d...

DeepSeek最高日赚346万元?官方称理论收益并非实际

DeepSeek最高日赚346万元?官方称理论收益并非实际

3月1日,DeepSeek在开源周最后一天抛出的"暴利"数据引发热议——V3/R1推理系统理论日利润高达346万元人民币(47.5万美元)。在这组看似惊人的数字背后,是一场关于AI...