当前位置:首页 > Deepseek最新资讯 > 正文内容

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

4个月前 (02-24)Deepseek最新资讯72

  2.4万个虚假账号,与Claude进行了约1600万次交互,用来抽取模型能力训练自家模型。Anthropic称,这种行为并非正常使用,而是系统化、工业级的能力提取。他们形容为“hydra cluster”,即一个网络同时管理大量账号,请求结构高度重复,集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力。

  所谓“蒸馏”(distillation),是AI领域常见的训练方法。简单来说,就是利用一个性能更强的“教师模型”生成输出数据,再用这些数据训练一个“学生模型”,从而在参数规模更小、成本更低的情况下复现部分能力。

  目前在AI训练上,蒸馏被广泛用于模型压缩、轻量化部署以及能力迁移等,这本身并非新技术,也并不带有天然的违规属性。

  此次争议的焦点在于方式与规模。Anthropic称,这三家公司通过共享支付方式、代理服务和批量化请求结构,系统性抽取Claude在推理能力deepseek、思维链输出、Agent工具使用以及编程能力等方面的表现。

  具体而言,DeepSeek被指进行超过15万次交互,侧重推理能力与思维链数据;Moonshot AI约340万次交互,聚焦Agent能力与工具调用;MiniMax数量最大,约1300万次交互,集中在Agent编排与工具使用,并被指在新版本发布后迅速切换抽取目标。

  Anthropic表示,他们通过行为识别与异常检测模型发现这一模式,并强调这种行为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施。

  此次事件一出,Elon Musk 在X上隔空抨击Anthropic大规模盗用训练数据,发帖直言, Anthropic 本身也曾因训练数据问题饱受争议,并讽刺称:“你偷来的东西被偷了?”

  据悉,此前,2023年Elon Musk就曾对Anthropic蒸馏其它大模型公司的数据进行嘲讽。

  需要指出的是,Anthropic此前确实曾卷入过关于训练数据来源的版权诉讼,并支付了巨额赔偿,目前相关争议仍处于法律与舆论层面的博弈中。

  并且就在事件发生不久后,Elon Musk又转载一AI科技业内人士的帖子称,Anthropic公司没有得到任何人的同情。他们利用公共数据构建的封闭模式攫取价值,并招致我们目前所见的监管俘获。他们既想继续利用现有数据,又想通过特殊规则来保护自身利润。并直言到,当技术具有如此颠覆性时,这种模式无疑是有害且具有腐蚀性的。

  围绕本次指控,行业内部也出现不同声音。一部分观点认为,本次争议的重点并不在蒸馏技术本身,而在具体实施方式。如果确实存在大量虚假账号、批量化请求、结构化提取模型核心能力的行为,且绕过服务条款或地区限制,那么问题已超出技术范畴,可能涉及商业合规与不正当竞争。

  也有创作者和评论者表达更为情绪化的观点,声称他们并不在乎其它公司对 Claude 进行“蒸馏”的做法。并且有评论认为,大模型本身建立在互联网公开数据之上,训练数据来源长期处于版权争议之中。在这种背景下,再以“能力被蒸馏”为由指责竞争对手,难免被解读为“贼喊抓贼”。如果AI公司可以在未经明确授权的情况下使用互联网内容训练模型,那么当模型能力被“蒸馏”迁移时,批评者的立场显得并不牢固。

  从商业常识角度看,若存在绕过平台规则、大规模抽取核心能力的行为,确实容易引发争议;但从技术实践看,模型输出是否具备明确、可独占的产权属性,目前尚缺乏清晰的法律标准。

  这场黑色幽默之下,问题的关键也指向:蒸馏本身是行业常规技术,用强模型输出训练弱模型,本质上并不罕见。但当规模扩大到数千万次调用、并以虚假账号批量操作时,它究竟是正常竞争,还是违规抽取?

  事实上,包括 OpenAI 在内的多家头部企业,也曾在不同场景中采用蒸馏技术进行模型优化。区别在于,内部蒸馏与基于竞品输出训练模型之间,是否存在明确边界,目前仍缺乏统一标准。

  当模型能力可以通过输出被“迁移”时,问题的核心早已不在技术本身,而在规则如何界定:什么属于合理使用,什么构成系统性能力抽取?巨头之间互相蒸馏的边界,仍然有待进一步厘清。原文出处:Anthropic声称被Deepseek蒸馏!马斯克为啥怼?,感谢原作者,侵权必删!

标签: deepseek

“Anthropic声称被Deepseek蒸馏!马斯克为啥怼?” 的相关文章

10月15日DeepSeek预测:勇士vs开拓者,库里率队延续连胜,夏普难挡火力

10月15日DeepSeek预测:勇士vs开拓者,库里率队延续连胜,夏普难挡火力

  北京时间10月15日上午10点,NBA季前赛将迎来西部焦点战,上赛季西部第七的勇士(48胜34负)客场挑战排名第12的开拓者(36胜46负)。尽管是季前赛,但两队6天前交锋打出129-...

Deepseek发布新模型并再度降价,游戏传媒ETF(517770)盘中飘红,一

Deepseek发布新模型并再度降价,游戏传媒ETF(517770)盘中飘红,一

  消息面上,9月29日,DeepSeek发布DeepSeek-V3.2-Exp模型,同时API大幅度降价。目前该模型的API价格为每百万tokens输入0.2元(缓存命中),2元(缓存未...

DeepSeek预测:帕尔马VS AC米兰!红黑军团客场碾压?莱奥+普利西奇双星

DeepSeek预测:帕尔马VS AC米兰!红黑军团客场碾压?莱奥+普利西奇双星

  意甲第11轮即将迎来一场看似悬殊的对决——排名第16的帕尔马主场迎战第3的AC米兰。主队目前仅领先降级区1分(积分7),而客队则与榜首仅差1分(积分21)。帕尔马本赛季场均仅0.5个进...

11月29日DeepSeek预测:太阳vs雷霆,亚历山大率队延续连胜,杜兰特布克

11月29日DeepSeek预测:太阳vs雷霆,亚历山大率队延续连胜,杜兰特布克

  西部第六的菲尼克斯太阳将客场挑战联盟第一的俄克拉荷马雷霆,这场强弱分明的对决因杜兰特与亚历山大的MVP级对话而充满看点。以下是本场关键分析:   太阳(12胜7负)近...

凝聚统战“向心力” 绘就发展“同心圆”——金华联通2025年统战工作纪实

凝聚统战“向心力” 绘就发展“同心圆”——金华联通2025年统战工作纪实

  2025年,中国联通浙江金华市分公司党委(下称金华联通)将统战工作作为推动企业高质量发展的“强大法宝”,通过强化思想引领、搭建建言平台、锻造人才梯队等一系列务实举措,成功将公司党内外智...

DeepSeek问世一周年,大模型改变了商业银行吗?营销降本效果显著,更多作用仍

DeepSeek问世一周年,大模型改变了商业银行吗?营销降本效果显著,更多作用仍

  去年1月份前后DeepSeek横空出世,拉开了国内银行业拥抱大模型浪潮的序幕。如今一年时间过去,大模型对银行究竟带来了哪些改变?近半个月来,财联社记者与银行业内进行了深度交流与采访。...