当前位置：首页 > Deepseek最新资讯 > 正文内容

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

8个月前 (11-09)Deepseek最新资讯207

　　【新智元导读】2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写，二者以数百万美元成本、开源权重，凭MoE与MuonClip等优化，在SWE-Bench与BrowseComp等基准追平或超越GPT-5，并以更低API价格与本地部署撬动市场预期，促使行业从砸钱堆料转向以架构创新与稳定训练为核心的高效路线。

　　OpenAI作为这一思路的旗手，不仅将模型训练秘而不宣，更与合作伙伴绘制了高达1.4万亿美元的基础设施蓝图。

　　在这种思维下，OpenAI旗舰模型的研发成本节节攀升：据报道，训练GPT-4就花费了约1亿美元。

　　更令人瞠目的是，DeepSeek宣称训练这款模型只花了约560万美元，连旧金山一套像样的房子都买不起。

　　这个成本数字相比业内普遍认为的「烧钱」级别相差悬殊，仅为Meta开发Llama模型成本的约十分之一。

　　华尔街对此反应剧烈，微软和谷歌股价应声下挫，而AI芯片巨头英伟达的市值甚至蒸发了约17%，相当于约6000亿美元。

　　资本市场用脚投票，开始重新审视AI赛道的投入产出模型：烧钱打造封闭模型的路线，或许并非高枕无忧的康庄大道。

　　DeepSeek年初点燃的星星之火尚未平息，中国另一家初创公司月之暗面在年末投下了一枚震撼弹。

　　本周，月之暗面发布了最新的开源巨模型Kimi K2 Thinking（以下简称K2 Thinking），以开源身份在多个关键基准上追平甚至超越了OpenAI的旗舰GPT-5。

　　要知道，GPT-5可是闭源巨头最先进的成果之一，而K2 Thinking仅用几百万美元训练，却在高难度推理和编码测试上正面较量并拔得头筹。

　　K2 Thinking的问世标志着开源免费模型在高端推理和编码能力上与封闭系统平起平坐，这一点在过去几乎难以想象。

　　而实现这一壮举，月之暗面投入的算力成本据传约为460万美元，比起OpenAI宏图中的万亿投入，几乎可忽略不计。

　　一边是几百万美元造就的开放奇迹，另一边是幻想烧钱万亿的巨无霸帝国，鲜明对比令人不禁怀疑：AI行业过去坚持的大投入逻辑，难道真的站不住脚了？

　　传统的GPT-5这类闭源模型采用的是「通用大脑」式架构，每个参数对每个输入都会发动运算，因而模型越大推理开销越惊人。

　　每次仅有8个专家（外加1个通用专家）被激活参与计算，相当于只动用320亿参数来解决特定问题。

　　换言之，K2-Thinking拥有一个「万智百宝箱」，每个token只调用其中不到3.5%的智力，却能享受近似万亿参数的知识储备。

　　更关键的是，月之暗面研发了名为「MuonClip」的自定义优化器，在训练过程中自动稳压梯度，成功杜绝了超大模型常见的梯度爆炸和损失发散问题。

　　Kimi-K2在长达15.5万亿token的训练中实现了「零训练崩溃」，无需人为中途干预重启，这意味着即使资金设备相对有限的团队也能可靠地训练超大模型。

　　这与OpenAI等闭源模式形成鲜明对比，它们的模型被封藏于云端，只能通过昂贵API租用它们的大脑。

　　以K2 Thinking为例，其官方提供的API价格是每百万输入token收费4元（命中缓存时更低至1元）、输出token16元。

　　换算下来，同样百万token的处理，K2 Thinking的费用仅为GPT-5的十分之一不到。

　　对开发者和企业而言，这无疑极具诱惑力，更何况K2完全可以本地部署，不愿付API费的话，大可以自建服务。

　　正因如此，我们已看到市场正在迅速响应：越来越多AI工具和平台开始集成K2 Thinking模型，许多开发者在社区分享如何用K2 Thinking微调自定义应用。

　　DeepSeek-R1发布后，其MIT开源权重更是被无数开源社区下载、魔改，用于各种插件和研究项目。

　　甚至政府机构和大型企业也开始重新考虑，与其斥资购买封闭模型的算力配额，不如采用开源模型作为基础，掌控自主可控的AI能力——尤其当这些开源模型已经足够好且成本低廉。

　　这种用脚投票的风向转变，不仅出现在技术圈，更在资本圈引发连锁反应：OpenAI此前天价的数据中心投资承诺，正面对质疑和压力。

　　OpenAI高管甚至在公共场合暗示需要政府贷款支持，事后又忙不迭出来「灭火」澄清不寻求政府背书，以平息外界对其烧钱计划的担忧deepseek。

　　当巨头为融资「续命」四处游说时，开源对手们正用实际成绩证明，也许根本不需要那么多钱，也能把事情办成。

　　DeepSeek和Kimi K2 Thinking带来的并非单纯的「追赶」，而更像是一场对旧路线的证伪。

　　过去，封闭巨头们的护城河建立在一种假设之上：只有不断投入数量级增长的资金和算力，才能保持模型性能的领先。

　　这一假设曾让OpenAI们在资本市场上如日中天，甚至形成了某种估值泡沫，AI公司和底层芯片厂商的价值被无限推高，因为所有人相信烧钱会带来奇迹。

　　事实证明，「性能领先的最后20%」或许并非大多数用户真正需要的，尤其如果为此要付出十倍乃至百倍的价格。

　　OpenAI等公司无疑依然握有行业顶尖的研究人才和技术积累，但他们再难宣称自己的路线是「唯一正确且必不可少」的。

　　行业叙事正在转向：与其痴迷于砸钱堆出更大模型，不如在架构创新和工程稳定性上下功夫，以换取成本效率和开放生态。原文出处：小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」，感谢原作者，侵权必删！

标签: deepseek

返回列表

上一篇：DeepSeek研究员：AI将在10到20年内取代绝大多数人类工作

下一篇：11月10日DeepSeek预测：凯尔特人vs魔术，布朗对决班凯罗，魔术主场险胜

“小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」” 的相关文章

对话联合国首席信息技术官：DeepSeek是“伟大的进化”

　　#全球财经连线#【对话联合国首席信息技术官：DeepSeek是“伟大的进化”】“DeepSeek（比其他大模型）便宜很多，但仍然很强大，它彻底改变了大模型在计算能力方面的构想，这是一次...

海尔智慧楼宇技术研发投入每年递增30%

　　技术研发正成为企业塑造核心竞争力的关键支柱。9月15日，在海尔智慧楼宇对外发布信息中显示，在产品研发投入上，每年增长率达到30%以上，这个数字还在持续上涨中。　　据...

究竟会花落谁家？DeepSeek最新大模型瞄准了下一代国产AI芯片

　　它采用了全新的混合推理架构，让模型能在一个统一框架内支持「思考」与「非思考」两种模式。V3.1 通过训练后优化，在工具使用与编程、搜索等智能体任务上表现均获得了较大提升。...

2月13日DeepSeek预测：开拓者vs爵士，马尔卡宁率队主场止颓

　　作为NBA传统劲旅的爵士队（18胜37负）目前排名西部第13，主场迎战暂列第10的开拓者（26胜29负）。此役对双方季后赛席位争夺至关重要——若开拓者取胜将巩固附加赛资格，而爵士则需要...

DeepSeek昨天开源的新模型，有点邪门。

　　DeepSeek 又整出新东西来了，只用到原本十分之一 token，就能存下几乎一样的文字信息，这压缩比，香农看了都要流泪，冯·诺伊曼看了都要沉默。　　昨天，Dee...

DeepSeek预测：赫罗纳vs西班牙人！保级队逆袭or欧战队碾压？米拉单刀救主

　　坐镇蒙蒂利维球场的赫罗纳正经历噩梦赛季：6轮仅积2分垫底，场均丢球2.1个的豆腐渣防线（联赛最差），最近5个主场狂丢11球且颗粒无收。乌克兰前锋瓦纳特虽以1球领跑队内射手榜，但全队射正...