当前位置:首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

3个月前 (08-12)Deepseek最新资讯304

  快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。

  从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

  在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨停,股价创历史新高,市值突破3550亿元。

  按照之前的说法,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

  有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

  此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

  据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

  据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。原文出处:基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布,感谢原作者,侵权必删!

标签: deepseek

“基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布” 的相关文章

「看」能否取代「读」,为何DeepSeek-OCR 爆火的重点不在性能?

「看」能否取代「读」,为何DeepSeek-OCR 爆火的重点不在性能?

  DeepSeek-OCR 热度的重点是什么?为什么视觉 token 更擅长处理长上下文?视觉 token 可以如何规避 NTP 机制的「近视」缺陷?为什么视觉 token 不会有「误差...

DeepSeek预测:曼城VS埃弗顿!哈兰德9球屠刀出鞘,蓝月主场碾压太妃糖

DeepSeek预测:曼城VS埃弗顿!哈兰德9球屠刀出鞘,蓝月主场碾压太妃糖

  2025赛季英超第8轮即将上演一场焦点对决,曼城坐镇伊蒂哈德球场迎战埃弗顿。目前曼城以13分排名第5,距离欧冠区仅1分之差;埃弗顿则以11分位列第8,同样对欧战区虎视眈眈。这场比赛的胜...

寒武纪适配DeepSeek、智谱模型!科创人工智能ETF大涨3.28%

寒武纪适配DeepSeek、智谱模型!科创人工智能ETF大涨3.28%

  科创人工智能ETF(589520)场内频现溢价区间,收盘资金率0.21%,显示买盘资金更为强势!伴随成交放量,   成份股方面,亚信安全领涨超10%,乐鑫科技、海天瑞...

消息称DeepSeek计划年底前发布AI智能体 抢占下一代人机交互入口

消息称DeepSeek计划年底前发布AI智能体 抢占下一代人机交互入口

  【TechWeb】9月4日消息,外媒援引知情人士消息称,中国人工智能公司DeepSeek计划在2025年底前正式发布AI智能体(AI Agent),以抢占下一代人机交互入口,意在与 O...

技术突围撬动“双十定律”? AI制药如何重写新药研发中国“Deepseek 时刻

技术突围撬动“双十定律”? AI制药如何重写新药研发中国“Deepseek 时刻

  9 月16日,北京中关村(大兴)细胞基因治疗产业园,剂泰科技发布全球首个 AI 纳米递送平台 NanoForge;仅约一个月前,晶泰科技(与 DoveTree 签下 59.9 亿美元订...

DeepSeek预测:那不勒斯VS热那亚!孔蒂军团主场碾压,德布劳内领衔屠杀剧本

DeepSeek预测:那不勒斯VS热那亚!孔蒂军团主场碾压,德布劳内领衔屠杀剧本

  当积分榜第二的那不勒斯(12分)遇上垫底的热那亚(2分),这场意甲第6轮的对决堪称天堂与地狱的对话。安东尼奥·孔蒂的球队刚刚在欧冠2-1力克葡萄牙体育,而帕特里克·维埃拉的队伍则遭遇三...