当前位置:首页 > Deepseek最新资讯 > 正文内容

V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了

7个月前 (12-02)Deepseek最新资讯173

  格隆汇12月2日|据硅星人Pro,就在上周,OpenAI前首席科学家在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100 倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。

  然而仅过了几天,12月1日,DeepSeek用V3.2和V3.2-Speciale的发布deepseek,给出了一个不同的答案。模型发布后,DeepSeek研究员在X上发文:“如果Gemini-3证明了持续扩展预训练的可能性,DeepSeek-V3.2-Speciale则证明了在大规模上下文环境中强化学习的可扩展性。我们花了一年时间将DeepSeek-V3推向极限,得出的经验是:训练后的瓶颈需通过优化方法和数据来解决,而非仅等待更好的基础模型。”而针对模型当前在世界知识广度上的短板,DeepSeek在技术报告中直言是因训练FLOPs不足,并硬气宣布后续将“扩大预训练算力”以弥补差距。

  /美股三大指数“五连阳”戛然而止,中国资产逆势走强,白银强势再创新高!加密货币全线大跌,超27万人爆仓

  /12月2日隔夜要闻:美股三大指数集体收跌 白银领涨贵金属 黑海油轮遭袭引发原油供应担忧 空客股价重挫

  /政商“旋转门”受贿!从建行辞职,摇身一变成年薪千万女副总,拿“安家费”等财物超4000万,被判14年原文出处:V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了,感谢原作者,侵权必删!

标签: deepseek

“V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了” 的相关文章

HALO崛起,SaaS震荡:软件行业的DeepSeek时刻到了吗?

HALO崛起,SaaS震荡:软件行业的DeepSeek时刻到了吗?

  软件股哀鸿遍野之际,另一类资产却在悄然崛起。石油石化、煤炭、有色金属等“重资产、低淘汰”板块逆势暴涨,美国拖拉机巨头迪尔年内涨幅约33%。华尔街将这一策略命名为HALO(Heavy A...

一年了 美国还在追着抹黑!曝DeepSeek春节再扔王炸 最新披露

一年了 美国还在追着抹黑!曝DeepSeek春节再扔王炸 最新披露

  快科技2月14日消息,一年了,美国还在追着Deepseek抹黑,可中国最新的Seedance都2.0了。   据报道,中国视频生成模型Seedance 2.0吸引全球...

10月30日DeepSeek预测:火箭vs猛龙,杜兰特率队客场险胜,巴雷特难救主

10月30日DeepSeek预测:火箭vs猛龙,杜兰特率队客场险胜,巴雷特难救主

  北京时间10月30日清晨6:30,NBA常规赛将迎来一场跨区较量deepseek,西部第11的休斯顿火箭(1胜2负)客场挑战东部第9的多伦多猛龙(1胜3负)。两支胜率不足35%的球队都...

10月28日DeepSeek预测:太阳vs爵士,布克对决马尔卡宁,爵士主场险胜

10月28日DeepSeek预测:太阳vs爵士,布克对决马尔卡宁,爵士主场险胜

  北京时间10月28日09:00,NBA常规赛将迎来西部焦点战,犹他爵士坐镇主场迎战菲尼克斯太阳。作为联盟传统劲旅的爵士(西部第8)近期状态起伏,而拥有三巨头的太阳(西部第10)则急需扭...

DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构

DeepSeek发布V3.1版本,专为国产芯片优化,支持双模式推理架构

  8月21日,DeepSeek正式发布其最新版本DeepSeek-V3.1,该版本采用了UE8M0 FP8 Scale的参数精度。据悉,这一技术规格专门为即将发布的下一代国产芯片进行优化...

12月5日DeepSeek预测:凯尔特人vs奇才,绿军双星闪耀客场轻取奇才

12月5日DeepSeek预测:凯尔特人vs奇才,绿军双星闪耀客场轻取奇才

  作为NBA历史悠久的知名球队,华盛顿奇才本赛季陷入泥沼,目前以3胜17负的惨淡战绩稳居东部垫底。而波士顿凯尔特人则以12胜9负位列东部第六,正为季后赛席位全力冲刺。此役胜负将直接影响双...