当前位置:首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

8个月前 (08-12)Deepseek最新资讯476

  快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。

  从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

  在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨停,股价创历史新高,市值突破3550亿元。

  按照之前的说法,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

  有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

  此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

  据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

  据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。原文出处:基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布,感谢原作者,侵权必删!

标签: deepseek

“基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布” 的相关文章

DeepSeek预测:热刺VS切尔西!伦敦德比火药味十足,范德芬或成关键先生助热

DeepSeek预测:热刺VS切尔西!伦敦德比火药味十足,范德芬或成关键先生助热

  2025-26赛季英超第10轮即将上演一场伦敦德比,目前排名第3的热刺将在托特纳姆热刺球场迎战排名第9的切尔西。这场比赛对双方争夺欧战席位至关重要,热刺目前积17分,仅落后榜首阿森纳5...

DeepSeek线上模型版本升级至V3.1

DeepSeek线上模型版本升级至V3.1

  8月19日,澎湃新闻记者获悉deepseek,DeepSeek线上模型版本已升级至 V3.1,上下文长度拓展至 128k,用户可前往官方网页、APP、小程序测试,API 接口调用方式保...

DeepSeek预测:帕尔马vs尤文图斯!伊尔迪兹8球领衔,斑马军团客场碾压?

DeepSeek预测:帕尔马vs尤文图斯!伊尔迪兹8球领衔,斑马军团客场碾压?

  帕尔马目前以5胜8平9负积23分排名第15,仅领先降级区6分。这支老牌劲旅本赛季进攻端表现挣扎,14个进球(联赛第19)和4次助攻(联赛垫底)的数据堪称灾难。防守端稍好,26个失球排名...

3月11日DeepSeek预测:太阳vs雄鹿,布克对决字母哥,太阳客场险胜

3月11日DeepSeek预测:太阳vs雄鹿,布克对决字母哥,太阳客场险胜

  NBA常规赛即将迎来一场东西部对决,密尔沃基雄鹿将在主场迎战菲尼克斯太阳。作为联盟传统豪强,雄鹿目前以27胜36负排名东部第11,而太阳则以37胜27负位列西部第7。这场比赛对双方都至...

梁文锋署名论文,DeepSeek最强开源Agent模型炸场

梁文锋署名论文,DeepSeek最强开源Agent模型炸场

  ;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。   长思考增强版DeepSeek-V3.2-Speciale结...

昇腾:为医疗AI注入向上的力量

昇腾:为医疗AI注入向上的力量

  2025年初,通用大模型DeepSeek的爆火,迅速带火了全国千行万业人工智能应用。算力需求结构也从训练转向推理、微调。这对于国产算力而言,无异于天赐良机。医疗行业尤为典型,从2025...