当前位置:首页 > Deepseek最新资讯 > 正文内容

V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了

5个月前 (12-02)Deepseek最新资讯170

  格隆汇12月2日|据硅星人Pro,就在上周,OpenAI前首席科学家在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100 倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。

  然而仅过了几天,12月1日,DeepSeek用V3.2和V3.2-Speciale的发布deepseek,给出了一个不同的答案。模型发布后,DeepSeek研究员在X上发文:“如果Gemini-3证明了持续扩展预训练的可能性,DeepSeek-V3.2-Speciale则证明了在大规模上下文环境中强化学习的可扩展性。我们花了一年时间将DeepSeek-V3推向极限,得出的经验是:训练后的瓶颈需通过优化方法和数据来解决,而非仅等待更好的基础模型。”而针对模型当前在世界知识广度上的短板,DeepSeek在技术报告中直言是因训练FLOPs不足,并硬气宣布后续将“扩大预训练算力”以弥补差距。

  /美股三大指数“五连阳”戛然而止,中国资产逆势走强,白银强势再创新高!加密货币全线大跌,超27万人爆仓

  /12月2日隔夜要闻:美股三大指数集体收跌 白银领涨贵金属 黑海油轮遭袭引发原油供应担忧 空客股价重挫

  /政商“旋转门”受贿!从建行辞职,摇身一变成年薪千万女副总,拿“安家费”等财物超4000万,被判14年原文出处:V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了,感谢原作者,侵权必删!

标签: deepseek

“V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了” 的相关文章

先锋私享会

先锋私享会

  科技,智驭变革的力量——BMW与时代变革者同心同向deepseek,重塑豪华出行范式原文出处:先锋私享会,感谢原作者,侵权必删!...

全球AI百强榜发布,中国产品占50%,DeepSeek用户下滑

全球AI百强榜发布,中国产品占50%,DeepSeek用户下滑

  ①ChatGPT依旧稳坐第一,但这个宝座越来越不安全了。Google的Gemini用户数已经追到它的一半,它俩现在是两大顶级的新一代人工智能平台。   ②马斯克的Gr...

11月24日DeepSeek预测:魔术vs凯尔特人,绿军主场险胜,布朗对决残阵魔

11月24日DeepSeek预测:魔术vs凯尔特人,绿军主场险胜,布朗对决残阵魔

  东部季后赛卡位战即将打响,11月24日早7点,近期状态火热的奥兰多魔术将客场挑战波士顿凯尔特人。尽管魔术近期4胜1负高居东部第八deepseek,但三大主力伤停的隐患或将改变战局。...

AI营销专家灵狐科技解析:GEO营销的本质与升级核心

AI营销专家灵狐科技解析:GEO营销的本质与升级核心

  摘要:本文AI营销专家灵狐科技将围绕GEO营销阐述其进阶路径。通过实时数据驱动实现需求精准定位,以“技术+内容”双轮驱动,让品牌内容获得AI持续收录,构筑长效传播力。...

第六届国际科创节圆满落幕:趣致集团摘得AI引领奖,实至名归

第六届国际科创节圆满落幕:趣致集团摘得AI引领奖,实至名归

  近日,STIF第六届国际科创节在中国举行,会上特别举办了科创节致敬盛典,趣致集团凭借其在人工智能领域的卓越贡献和创新应用,荣膺“2025年度人工智能引领奖”。   S...

DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态

  当前,业界顶尖的大模型正竞相挑战“过度思考”的难题,即无论问题简单与否,它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种...