当前位置：首页 > Deepseek最新资讯 > 正文内容

算力不够，智慧来凑？Deepseek们正在摆脱算力崇拜

5个月前 (01-26)Deepseek最新资讯64

　　在科技圈，硅谷一直有一种“造物主”般的傲慢。从大模型诞生那天起，OpenAI的 CEO奥特曼就给全世界洗脑了一套暴力美学：智能等于算力，算力等于显卡，显卡等于成功。

　　近日， Google的一项研究发现，DeepSeek的R1和阿里云的qwq-32B模型，竟然能够模仿人类的集体智能。

　　简单说，在处理难题时，不再是一个人在战斗，而是在内部演化出了一个“思想社会”。其中不同人格特征和领域专业知识的相互作用产生了更强大的能力。

　　大模型行业从不缺“堆料者”，但能让 Google 弯下腰来研究底层逻辑的，寥寥无几。这不仅是技术的胜利，更是中国企业在算力围堵下，硬生生走出的一条“暴力效率主义”血路。

　　长期以来，硅谷的大模型发展路径高度趋同甚至单一：堆最贵的卡，组最多的集群，投入最激进的资本。

　　从 GPT-3 到 GPT-4，再到 GPT-4o，这条路线被一次次验证有效。Meta 为了 Llama 3 囤积了数十万张 GPU，微软与 OpenAI 推进的“星际门”项目，投资规模动辄以千亿美元计，覆盖算力、数据中心、电力基础设施等全链条。这种打法并不复杂，本质上是通过资源冗余换取确定性领先。

　　换句话说，当算力足够便宜、资本足够充裕时，工程效率往往并非首要约束，真正重要的是“规模先到位”。

　　但 Google 这份研究揭开了另一个真相：DeepSeek 们之所以强，不是因为它们比 OpenAI 更能烧钱，而是它们更懂“省钱”。

　　研究指出，DeepSeek 等中国模型的能力跃迁，并非来自算力规模的指数级扩张，而是来自推理阶段内部结构的重构。

　　这些模型在面对复杂指令时，并不是沿着单一生成路径一路向前，而是会在内部并行展开多种解题策略，并通过持续的内部比较、博弈与修正，逐步收敛到更稳定的答案。

　　这种近似“多代理协商”的模式，并不追求单次推理速度的极限，却显著降低了单位算力下的错误率与返工成本。在算力受限的环境中，这种“少走弯路”的能力，往往比“跑得更快”更重要。

　　正是在这一背景下，MoE与 GRPO等技术路径开始在国内模型中被高度重视。MoE 通过将模型能力拆分给不同“专家模块”，避免了每一次推理都全模型启动；GRPO 则通过分组对比和相对优化，提升模型在推理阶段的稳定性和可控性。

　　如果说硅谷仍在押注“重装推进”的工业化路线，那么中国模型更像是在修炼一套轻量而高效的技术体系。通过结构、策略和调度上的精细设计，对冲算力劣势。

　　这种“算法效率主义”并非理想主义，而是一种典型的生存型进化。当资源不再无限供给，效率本身就会从加分项，转变为最核心、也最难复制的竞争壁垒。

　　在 Google 的研究案例中，被反复引用的中国模型，并不是声量最大、发布会最密集的玩家，而是 DeepSeek和阿里通义千问。这并非简单的“技术偶然”，而是中国 AI 竞争的“分水岭”已经出现了。

　　过去两年，国内大厂们沉迷于参数对标、榜单排名和在发布会上“吊打 GPT-4”，忙着在朋友圈晒各种看不懂的榜单，这些能在短期内赢得更多注意力。

　　但从基础研究和工程演化的角度看，这种竞争方式的边际价值正在快速下降。真正进入全球研究视野的，反而是那些持续在模型架构、推理效率和成本结构上做“脏活累活”的团队。

　　DeepSeek 背靠幻方量化，其技术团队长期浸泡在金融工程语境中，对算力成本、延迟控制和稳定性有着近乎苛刻的要求。在量化交易领域，算力从来不是无限变量，“如何用更少计算得到更可靠结论”本身就是核心能力。

　　因此，DeepSeek 从一开始就没有将重心放在应用层叙事上，而是持续死磕推理成本与模型结构。即便没有万卡集群，只要架构足够聪明，依然可以逼近前沿能力。

　　通过持续开源模型底座，阿里将模型训练、评测和场景验证的一部分成本，转化为全球开发者的协同实验。这种做法短期内看似削弱了“独占优势”，但从长期看，却显著加快了模型在真实复杂场景中的演化速度。

　　在这种开放体系中，模型更容易暴露问题，也更快完成修正，从而在模拟“集体智慧”与复杂决策方面走得更远。

　　反观某些还沉溺于做“套壳应用”或只顾着买流量的大厂，护城河正在变得摇摇欲坠。应用层的繁荣，建立在底层能力外包的基础之上，一旦底层模型的差距被拉开，应用层的优势往往难以长期维持。

　　互联网行业从不缺跨界者，但真正成功的寥寥无几。因为底层逻辑一旦错位，再多的产品包装也只是阶段性繁荣。

　　在 AI 领域，如果不能在算法或架构层贡献新的认知与方法论，那么竞争最终只会被压缩到应用层的价格战与内卷之中，而这，恰恰是最容易被后来者颠覆的地带。

　　Google 的这项研究，最细思极恐的地方在于：如果 AI 内部已经能模拟“集体智慧”，那么人类精英的价值还剩下多少？

　　研究提到，DeepSeek R1 等模型展现出的“内部辩论”能力，本质上，这意味着人类组织中大量依赖流程协作的岗位，将不可避免地被重新定义。

　　过去，一个大型企业的重大决策deepseek，往往需要多个部门参与：市场调研、战略分析、风险评估、财务测算……

　　对于字节跳动、美团、百度这类高度依赖数据与算法的公司而言，这意味着从“人机协作”向“机机协作”的过渡。

　　马斯克曾多次强调：“未来所有的工作都将由 AI 完成，除非你想为了兴趣而工作。”当中国 AI 提前摸到了“集体智慧”的门槛，这种预测正加速从科幻变为现实。原文出处：算力不够，智慧来凑？Deepseek们正在摆脱算力崇拜，感谢原作者，侵权必删！

标签: deepseek

返回列表

上一篇：1月26日DeepSeek预测：掘金vs灰熊，约基奇缺阵，掘金客场险胜

下一篇：2025中国科技50强榜单发布，华为、DeepSeek、宁德时代位列前三

“算力不够，智慧来凑？Deepseek们正在摆脱算力崇拜” 的相关文章

算力不够，智慧来凑？Deepseek们正在摆脱算力崇拜

“算力不够，智慧来凑？Deepseek们正在摆脱算力崇拜” 的相关文章

90后清华博士屈拓任漳州市国资委副主任，曾讲授DeepSeek政务课程

deepseek公布大语言模型部署方法专利

2月8日DeepSeek预测：爵士vs魔术，班凯罗率队捍卫主场

有感于某个吹塞斯科，把沃特金斯贬低成二流中锋的帖子

调查爆火仅半年，DeepSeek在银行业已“泯然众模型”？三大障碍成为拦路虎

12月6日DeepSeek预测：掘金vs老鹰，约基奇率队延续碾压，穆雷或再爆发

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.

算力不够，智慧来凑？Deepseek们正在摆脱算力崇拜

“算力不够，智慧来凑？Deepseek们正在摆脱算力崇拜” 的相关文章

90后清华博士屈拓任漳州市国资委副主任，曾讲授DeepSeek政务课程

deepseek公布大语言模型部署方法专利

2月8日DeepSeek预测：爵士vs魔术，班凯罗率队捍卫主场

有感于某个吹塞斯科，把沃特金斯贬低成二流中锋的帖子

调查 爆火仅半年，DeepSeek在银行业已“泯然众模型”？三大障碍成为拦路虎

12月6日DeepSeek预测：掘金vs老鹰，约基奇率队延续碾压，穆雷或再爆发

Powered By Z-BlogPHP. Theme by TOYEAN.

调查爆火仅半年，DeepSeek在银行业已“泯然众模型”？三大障碍成为拦路虎