当前位置:首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布

11个月前 (08-12)Deepseek最新资讯481

  快科技8月12日消息,ChatGPT-5已经发布,那么国产大模型DeepSeek大版本更新也就不远了。

  从网友向DeepSeek提出的问题看,该模型给出的答案是,DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

  在这样的背景下,国产算力链多家公司股价出现了大涨,比如寒武纪直接今天20cm涨停,股价创历史新高,市值突破3550亿元。

  按照之前的说法,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合了更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

  有分析师预计,DeepSeek-R2的定价可能显著低于OpenAI同类产品,预示着其可能颠覆现有AI服务的定价模式。

  此外,还有相关消息显示,DeepSeek-R2预计比GPT-4成本下降97%;并且是在昇腾卡上做的训练,主打一个全方位全产业链的自主可控。

  据相关人士透露的情况,DeepSeek-R2的总参数量可能会达到1.2万亿,比DeepSeek-R1的6710亿参数增加大约一倍。

  据华为实验室统计,这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的,还有待观察,但看起来确实更强大、更自主了。原文出处:基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布,感谢原作者,侵权必删!

标签: deepseek

“基于华为昇腾训练 性能不输英伟达!自家模型爆料:DeepSeek-R2本月要发布” 的相关文章

DeepSeek V4计划10月到来:实现100万文本理解,国产AI芯片训练

DeepSeek V4计划10月到来:实现100万文本理解,国产AI芯片训练

  这几年各大厂商都在研发最新的AI模型,对于国内厂商来说,毫无疑问DeepSeek最受大家的欢迎deepseek,在今年年初凭借DeepSeek R1引爆全网,不过毕竟AI模型日新月异,...

头号登吹等你来!adidas哈登「UNO FEST」线下狂欢,20张门票随机送!

头号登吹等你来!adidas哈登「UNO FEST」线下狂欢,20张门票随机送!

  詹姆斯·哈登2025中国行即将正式拉开序幕!8月2日,哈登本人将空降广州,开启adidas 「UNO FEST」大型球迷派对。这不止是一场见面会,更是一次属于信徒的朝圣。...

12月28日DeepSeek预测:骑士vs火箭,杜兰特率队捍卫主场,火箭胜率超六

12月28日DeepSeek预测:骑士vs火箭,杜兰特率队捍卫主场,火箭胜率超六

  NBA常规赛即将迎来一场东西部中游球队的焦点对决,休斯顿火箭坐镇主场迎战克利夫兰骑士。目前火箭以18胜10负排名西部第六,骑士则以17胜15负位列东部第七。本场比赛的结果将直接影响两队...

1月10日DeepSeek预测:老鹰vs掘金,约基奇缺阵,掘金主场险胜

1月10日DeepSeek预测:老鹰vs掘金,约基奇缺阵,掘金主场险胜

  北京时间1月10日上午10点,NBA常规赛将迎来一场东西部对决,西部第三的丹佛掘金(25胜12负)坐镇高原主场迎战东部第九的亚特兰大老鹰(18胜21负)。尽管掘金近期遭遇核心约基奇伤停...

吴敬琏,谈DeepSeek

吴敬琏,谈DeepSeek

  11月13日消息,在今天举行的第十六届财新峰会上,国务院发展研究中心高级研究员,财新传媒公信力委员会主席吴敬琏发表视频致辞。他表示,现在有一种意见认为政策部门最有全局观,更能够预见未来...

DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍

DeepSeek联合清北发布DualPath推理框架:吞吐量提升近2倍

  2月27日消息,依旧没等到DeepSeek V4,今天DeepSeek与北京大学、清华大学在ArXiv联合发布了一篇关于全新智能体推理框架DualPath的论文。据了解,该框架旨在解决...