当前位置:首页 > Deepseek最新资讯 > 正文内容

算力不够,智慧来凑?Deepseek们正在摆脱算力崇拜

3个月前 (01-26)Deepseek最新资讯62

  在科技圈,硅谷一直有一种“造物主”般的傲慢。从大模型诞生那天起,OpenAI的 CEO奥特曼就给全世界洗脑了一套暴力美学:智能等于算力,算力等于显卡,显卡等于成功。

  近日, Google的一项研究发现,DeepSeek的R1和阿里云的qwq-32B模型,竟然能够模仿人类的集体智能。

  简单说,在处理难题时,不再是一个人在战斗,而是在内部演化出了一个“思想社会”。其中不同人格特征和领域专业知识的相互作用产生了更强大的能力。

  大模型行业从不缺“堆料者”,但能让 Google 弯下腰来研究底层逻辑的,寥寥无几。这不仅是技术的胜利,更是中国企业在算力围堵下,硬生生走出的一条“暴力效率主义”血路。

  长期以来,硅谷的大模型发展路径高度趋同甚至单一:堆最贵的卡,组最多的集群,投入最激进的资本。

  从 GPT-3 到 GPT-4,再到 GPT-4o,这条路线被一次次验证有效。Meta 为了 Llama 3 囤积了数十万张 GPU,微软与 OpenAI 推进的“星际门”项目,投资规模动辄以千亿美元计,覆盖算力、数据中心、电力基础设施等全链条。这种打法并不复杂,本质上是通过资源冗余换取确定性领先。

  换句话说,当算力足够便宜、资本足够充裕时,工程效率往往并非首要约束,真正重要的是“规模先到位”。

  但 Google 这份研究揭开了另一个真相:DeepSeek 们之所以强,不是因为它们比 OpenAI 更能烧钱,而是它们更懂“省钱”。

  研究指出,DeepSeek 等中国模型的能力跃迁,并非来自算力规模的指数级扩张,而是来自推理阶段内部结构的重构。

  这些模型在面对复杂指令时,并不是沿着单一生成路径一路向前,而是会在内部并行展开多种解题策略,并通过持续的内部比较、博弈与修正,逐步收敛到更稳定的答案。

  这种近似“多代理协商”的模式,并不追求单次推理速度的极限,却显著降低了单位算力下的错误率与返工成本。在算力受限的环境中,这种“少走弯路”的能力,往往比“跑得更快”更重要。

  正是在这一背景下,MoE与 GRPO等技术路径开始在国内模型中被高度重视。MoE 通过将模型能力拆分给不同“专家模块”,避免了每一次推理都全模型启动;GRPO 则通过分组对比和相对优化,提升模型在推理阶段的稳定性和可控性。

  如果说硅谷仍在押注“重装推进”的工业化路线,那么中国模型更像是在修炼一套轻量而高效的技术体系。通过结构、策略和调度上的精细设计,对冲算力劣势。

  这种“算法效率主义”并非理想主义,而是一种典型的生存型进化。当资源不再无限供给,效率本身就会从加分项,转变为最核心、也最难复制的竞争壁垒。

  在 Google 的研究案例中,被反复引用的中国模型,并不是声量最大、发布会最密集的玩家,而是 DeepSeek和阿里通义千问。这并非简单的“技术偶然”,而是中国 AI 竞争的“分水岭”已经出现了。

  过去两年,国内大厂们沉迷于参数对标、榜单排名和在发布会上“吊打 GPT-4”,忙着在朋友圈晒各种看不懂的榜单,这些能在短期内赢得更多注意力。

  但从基础研究和工程演化的角度看,这种竞争方式的边际价值正在快速下降。真正进入全球研究视野的,反而是那些持续在模型架构、推理效率和成本结构上做“脏活累活”的团队。

  DeepSeek 背靠幻方量化,其技术团队长期浸泡在金融工程语境中,对算力成本、延迟控制和稳定性有着近乎苛刻的要求。在量化交易领域,算力从来不是无限变量,“如何用更少计算得到更可靠结论”本身就是核心能力。

  因此,DeepSeek 从一开始就没有将重心放在应用层叙事上,而是持续死磕推理成本与模型结构。即便没有万卡集群,只要架构足够聪明,依然可以逼近前沿能力。

  通过持续开源模型底座,阿里将模型训练、评测和场景验证的一部分成本,转化为全球开发者的协同实验。这种做法短期内看似削弱了“独占优势”,但从长期看,却显著加快了模型在真实复杂场景中的演化速度。

  在这种开放体系中,模型更容易暴露问题,也更快完成修正,从而在模拟“集体智慧”与复杂决策方面走得更远。

  反观某些还沉溺于做“套壳应用”或只顾着买流量的大厂,护城河正在变得摇摇欲坠。应用层的繁荣,建立在底层能力外包的基础之上,一旦底层模型的差距被拉开,应用层的优势往往难以长期维持。

  互联网行业从不缺跨界者,但真正成功的寥寥无几。因为底层逻辑一旦错位,再多的产品包装也只是阶段性繁荣。

  在 AI 领域,如果不能在算法或架构层贡献新的认知与方法论,那么竞争最终只会被压缩到应用层的价格战与内卷之中,而这,恰恰是最容易被后来者颠覆的地带。

  Google 的这项研究,最细思极恐的地方在于:如果 AI 内部已经能模拟“集体智慧”,那么人类精英的价值还剩下多少?

  研究提到,DeepSeek R1 等模型展现出的“内部辩论”能力,本质上,这意味着人类组织中大量依赖流程协作的岗位,将不可避免地被重新定义。

  过去,一个大型企业的重大决策deepseek,往往需要多个部门参与:市场调研、战略分析、风险评估、财务测算……

  对于字节跳动、美团、百度这类高度依赖数据与算法的公司而言,这意味着从“人机协作”向“机机协作”的过渡。

  马斯克曾多次强调:“未来所有的工作都将由 AI 完成,除非你想为了兴趣而工作。”当中国 AI 提前摸到了“集体智慧”的门槛,这种预测正加速从科幻变为现实。原文出处:算力不够,智慧来凑?Deepseek们正在摆脱算力崇拜,感谢原作者,侵权必删!

标签: deepseek

“算力不够,智慧来凑?Deepseek们正在摆脱算力崇拜” 的相关文章

DeepSeek被曝开发AI智能体模型:能自主完成多步工作,还会越用越聪明

DeepSeek被曝开发AI智能体模型:能自主完成多步工作,还会越用越聪明

  9月4日消息,彭博社报道,据知情人士透露,DeepSeek正在开发一款功能更先进的AI智能体模型,旨在与OpenAI等竞争对手在这一新兴技术领域展开较量。   据匿名...

DeepSeek预测:阿森纳vs曼城!枪手主场血洗蓝月?哈兰德PK哲凯赖什引爆天

DeepSeek预测:阿森纳vs曼城!枪手主场血洗蓝月?哈兰德PK哲凯赖什引爆天

  北京时间9月21日23:30,英超第5轮将上演焦点对决——排名第二的阿森纳坐镇酋长球场迎战第八名曼城。本赛季枪手开局强势(3胜1负)deepseek,而蓝月亮状态起伏(2胜2负),这场...

DeepSeek问世一周年 外媒预测中国将赢得AI马拉松

DeepSeek问世一周年 外媒预测中国将赢得AI马拉松

  去年1月20日,中国人工智能(AI)初创企业深度求索(DeepSeek)正式发布R1模型震惊全球,转眼已过去一年。中国的“AI崛起”已不再只是一句政治口号,而已转变为现实技术竞争力。...

聚数联侨 智通未来 中国电信汕头分公司精彩亮相2025中国数字经济创新发展大会

聚数联侨 智通未来 中国电信汕头分公司精彩亮相2025中国数字经济创新发展大会

  党的二十届四中全会明确提出“加快发展数字经济,促进数字经济和实体经济深度融合”。当前,数字经济已成为推动高质量发展、构建现代化经济体系的核心驱动力,正全面渗透经济社会各领域。为深入贯彻...

DeepSeek新模型“Model 1”曝光,疑似“高效推理模型”

DeepSeek新模型“Model 1”曝光,疑似“高效推理模型”

  新浪科技讯 1月21日下午消息,DeepSeek于官方GitHub仓库更新了一系列FlashMLA代码,在这些更新中,一个名为“Model 1”的模型引起了广泛关注。...

2月1日DeepSeek预测:森林狼vs灰熊,爱德华兹率队客场复仇

2月1日DeepSeek预测:森林狼vs灰熊,爱德华兹率队客场复仇

  西部季后赛卡位战硝烟再起,明尼苏达森林狼将作客孟菲斯挑战灰熊。目前森林狼以30胜19负稳居西部第7,而伤兵满营的灰熊仅列西部第12(18胜28负)。本赛季两队首次交锋中,灰熊曾在标靶中...