当前位置:首页 > Deepseek最新资讯 > 正文内容

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

4个月前 (02-24)Deepseek最新资讯73

  2.4万个虚假账号,与Claude进行了约1600万次交互,用来抽取模型能力训练自家模型。Anthropic称,这种行为并非正常使用,而是系统化、工业级的能力提取。他们形容为“hydra cluster”,即一个网络同时管理大量账号,请求结构高度重复,集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力。

  所谓“蒸馏”(distillation),是AI领域常见的训练方法。简单来说,就是利用一个性能更强的“教师模型”生成输出数据,再用这些数据训练一个“学生模型”,从而在参数规模更小、成本更低的情况下复现部分能力。

  目前在AI训练上,蒸馏被广泛用于模型压缩、轻量化部署以及能力迁移等,这本身并非新技术,也并不带有天然的违规属性。

  此次争议的焦点在于方式与规模。Anthropic称,这三家公司通过共享支付方式、代理服务和批量化请求结构,系统性抽取Claude在推理能力deepseek、思维链输出、Agent工具使用以及编程能力等方面的表现。

  具体而言,DeepSeek被指进行超过15万次交互,侧重推理能力与思维链数据;Moonshot AI约340万次交互,聚焦Agent能力与工具调用;MiniMax数量最大,约1300万次交互,集中在Agent编排与工具使用,并被指在新版本发布后迅速切换抽取目标。

  Anthropic表示,他们通过行为识别与异常检测模型发现这一模式,并强调这种行为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施。

  此次事件一出,Elon Musk 在X上隔空抨击Anthropic大规模盗用训练数据,发帖直言, Anthropic 本身也曾因训练数据问题饱受争议,并讽刺称:“你偷来的东西被偷了?”

  据悉,此前,2023年Elon Musk就曾对Anthropic蒸馏其它大模型公司的数据进行嘲讽。

  需要指出的是,Anthropic此前确实曾卷入过关于训练数据来源的版权诉讼,并支付了巨额赔偿,目前相关争议仍处于法律与舆论层面的博弈中。

  并且就在事件发生不久后,Elon Musk又转载一AI科技业内人士的帖子称,Anthropic公司没有得到任何人的同情。他们利用公共数据构建的封闭模式攫取价值,并招致我们目前所见的监管俘获。他们既想继续利用现有数据,又想通过特殊规则来保护自身利润。并直言到,当技术具有如此颠覆性时,这种模式无疑是有害且具有腐蚀性的。

  围绕本次指控,行业内部也出现不同声音。一部分观点认为,本次争议的重点并不在蒸馏技术本身,而在具体实施方式。如果确实存在大量虚假账号、批量化请求、结构化提取模型核心能力的行为,且绕过服务条款或地区限制,那么问题已超出技术范畴,可能涉及商业合规与不正当竞争。

  也有创作者和评论者表达更为情绪化的观点,声称他们并不在乎其它公司对 Claude 进行“蒸馏”的做法。并且有评论认为,大模型本身建立在互联网公开数据之上,训练数据来源长期处于版权争议之中。在这种背景下,再以“能力被蒸馏”为由指责竞争对手,难免被解读为“贼喊抓贼”。如果AI公司可以在未经明确授权的情况下使用互联网内容训练模型,那么当模型能力被“蒸馏”迁移时,批评者的立场显得并不牢固。

  从商业常识角度看,若存在绕过平台规则、大规模抽取核心能力的行为,确实容易引发争议;但从技术实践看,模型输出是否具备明确、可独占的产权属性,目前尚缺乏清晰的法律标准。

  这场黑色幽默之下,问题的关键也指向:蒸馏本身是行业常规技术,用强模型输出训练弱模型,本质上并不罕见。但当规模扩大到数千万次调用、并以虚假账号批量操作时,它究竟是正常竞争,还是违规抽取?

  事实上,包括 OpenAI 在内的多家头部企业,也曾在不同场景中采用蒸馏技术进行模型优化。区别在于,内部蒸馏与基于竞品输出训练模型之间,是否存在明确边界,目前仍缺乏统一标准。

  当模型能力可以通过输出被“迁移”时,问题的核心早已不在技术本身,而在规则如何界定:什么属于合理使用,什么构成系统性能力抽取?巨头之间互相蒸馏的边界,仍然有待进一步厘清。原文出处:Anthropic声称被Deepseek蒸馏!马斯克为啥怼?,感谢原作者,侵权必删!

标签: deepseek

“Anthropic声称被Deepseek蒸馏!马斯克为啥怼?” 的相关文章

中国联通亮相2025服贸会:“AI+”数智领航,共筑 全球数字新生态

中国联通亮相2025服贸会:“AI+”数智领航,共筑 全球数字新生态

  9月10日,2025年中国国际服务贸易交易会在北京首钢园盛大启幕。中国联通聚焦人工智能、算网融合、数实融合等前沿技术领域,集中展示包括双万兆网络、云计算服务、元景大模型及多项人工智能创...

领AI之势,践管理之道:金蝶携手北大国发院开启企业AI管理新征程

领AI之势,践管理之道:金蝶携手北大国发院开启企业AI管理新征程

  1月30日至31日,正值万象更新、时不我待的新年开局时刻,北京大学国家发展研究院(以下简称“北大国发院”)承泽园报告厅内高朋满座。金蝶集团董事会主席兼CEO徐少春受邀回访北大,并在北大...

DeepSeek-V3.1正式发布!云计算ETF汇添富(159273)冲高回落!

DeepSeek-V3.1正式发布!云计算ETF汇添富(159273)冲高回落!

  今日(8.21),大盘全天冲高回落,热门题材全线下挫。同类规模领先的云计算ETF汇添富(159273)小幅收跌0.36%,全天成交额超6500万元,较昨日放量。资金面上,云计算ETF汇...

中工互联主编《DeepSeek驱动工业智能》重磅发布,上市一周荣登京东图书双榜第

中工互联主编《DeepSeek驱动工业智能》重磅发布,上市一周荣登京东图书双榜第

  2025年7月30日晚,由中工互联科技集团、机械工业出版社、宁波和利时信息安全研究院有限公司联合主办的“工业大模型赋能新型工业化暨《DeepSeek驱动工业智能》新书发布会”在北京隆重...

DeepSeek-R2要来了?速领450元代金券,模型测评快人一步!

DeepSeek-R2要来了?速领450元代金券,模型测评快人一步!

  近日,关于DeepSeek-R2计划于8月15日至30日之间发布的消息,在市场上引起了广泛关注。对此,也有接近DeepSeek人士表示该消息不实,DeepSeek-R2在8月内并无发布...

2025年AI大战被谱写成歌,回顾DeepSeek到谷歌王炸

2025年AI大战被谱写成歌,回顾DeepSeek到谷歌王炸

  甜菜!有人把去年的 AI 大战写成了一首歌整个 2025 年,AI 模型厂都在你夺我争,大佬之间还不断相互抢人。 不仅如此,从年头的 DeepSeek 炸弹 R1 发布,到火遍全网的...