当前位置:首页 > Deepseek最新资讯 > 正文内容

Anthropic声称被Deepseek蒸馏!马斯克为啥怼?

2个月前 (02-24)Deepseek最新资讯68

  2.4万个虚假账号,与Claude进行了约1600万次交互,用来抽取模型能力训练自家模型。Anthropic称,这种行为并非正常使用,而是系统化、工业级的能力提取。他们形容为“hydra cluster”,即一个网络同时管理大量账号,请求结构高度重复,集中瞄准推理能力、Agent工具使用、编程与思维链输出等关键能力。

  所谓“蒸馏”(distillation),是AI领域常见的训练方法。简单来说,就是利用一个性能更强的“教师模型”生成输出数据,再用这些数据训练一个“学生模型”,从而在参数规模更小、成本更低的情况下复现部分能力。

  目前在AI训练上,蒸馏被广泛用于模型压缩、轻量化部署以及能力迁移等,这本身并非新技术,也并不带有天然的违规属性。

  此次争议的焦点在于方式与规模。Anthropic称,这三家公司通过共享支付方式、代理服务和批量化请求结构,系统性抽取Claude在推理能力deepseek、思维链输出、Agent工具使用以及编程能力等方面的表现。

  具体而言,DeepSeek被指进行超过15万次交互,侧重推理能力与思维链数据;Moonshot AI约340万次交互,聚焦Agent能力与工具调用;MiniMax数量最大,约1300万次交互,集中在Agent编排与工具使用,并被指在新版本发布后迅速切换抽取目标。

  Anthropic表示,他们通过行为识别与异常检测模型发现这一模式,并强调这种行为可能削弱模型原有的安全护栏,因此呼吁行业与云服务商采取更严格的防护措施。

  此次事件一出,Elon Musk 在X上隔空抨击Anthropic大规模盗用训练数据,发帖直言, Anthropic 本身也曾因训练数据问题饱受争议,并讽刺称:“你偷来的东西被偷了?”

  据悉,此前,2023年Elon Musk就曾对Anthropic蒸馏其它大模型公司的数据进行嘲讽。

  需要指出的是,Anthropic此前确实曾卷入过关于训练数据来源的版权诉讼,并支付了巨额赔偿,目前相关争议仍处于法律与舆论层面的博弈中。

  并且就在事件发生不久后,Elon Musk又转载一AI科技业内人士的帖子称,Anthropic公司没有得到任何人的同情。他们利用公共数据构建的封闭模式攫取价值,并招致我们目前所见的监管俘获。他们既想继续利用现有数据,又想通过特殊规则来保护自身利润。并直言到,当技术具有如此颠覆性时,这种模式无疑是有害且具有腐蚀性的。

  围绕本次指控,行业内部也出现不同声音。一部分观点认为,本次争议的重点并不在蒸馏技术本身,而在具体实施方式。如果确实存在大量虚假账号、批量化请求、结构化提取模型核心能力的行为,且绕过服务条款或地区限制,那么问题已超出技术范畴,可能涉及商业合规与不正当竞争。

  也有创作者和评论者表达更为情绪化的观点,声称他们并不在乎其它公司对 Claude 进行“蒸馏”的做法。并且有评论认为,大模型本身建立在互联网公开数据之上,训练数据来源长期处于版权争议之中。在这种背景下,再以“能力被蒸馏”为由指责竞争对手,难免被解读为“贼喊抓贼”。如果AI公司可以在未经明确授权的情况下使用互联网内容训练模型,那么当模型能力被“蒸馏”迁移时,批评者的立场显得并不牢固。

  从商业常识角度看,若存在绕过平台规则、大规模抽取核心能力的行为,确实容易引发争议;但从技术实践看,模型输出是否具备明确、可独占的产权属性,目前尚缺乏清晰的法律标准。

  这场黑色幽默之下,问题的关键也指向:蒸馏本身是行业常规技术,用强模型输出训练弱模型,本质上并不罕见。但当规模扩大到数千万次调用、并以虚假账号批量操作时,它究竟是正常竞争,还是违规抽取?

  事实上,包括 OpenAI 在内的多家头部企业,也曾在不同场景中采用蒸馏技术进行模型优化。区别在于,内部蒸馏与基于竞品输出训练模型之间,是否存在明确边界,目前仍缺乏统一标准。

  当模型能力可以通过输出被“迁移”时,问题的核心早已不在技术本身,而在规则如何界定:什么属于合理使用,什么构成系统性能力抽取?巨头之间互相蒸馏的边界,仍然有待进一步厘清。原文出处:Anthropic声称被Deepseek蒸馏!马斯克为啥怼?,感谢原作者,侵权必删!

标签: deepseek

“Anthropic声称被Deepseek蒸馏!马斯克为啥怼?” 的相关文章

DeepSeek双模型发布,V3.2达GPT-5水平、Speciale专攻科研

DeepSeek双模型发布,V3.2达GPT-5水平、Speciale专攻科研

  #DeepSeek新模型有2个质的突破#【DeepSeek双模型发布:一位是“话少助手” 一位是“偏科天才”】#DeepSeek实现AI自我训练进化#据科技日报,12月1日,DeepS...

国产AI再迎弯道超车机遇?DeepSeek、寒武纪同步重磅发布!科创人工智能ET

国产AI再迎弯道超车机遇?DeepSeek、寒武纪同步重磅发布!科创人工智能ET

  :一是加强构建导向明确、尊重规律、规范发展的政策环境,制定政策指引;二是协同推进技术攻关和开源共享,支持人工智能企业和各行业龙头企业开展协同创新;三是在供需两端同步发力,推动市场扩容。...

10月31日DeepSeek预测:奇才vs雷霆,雷霆主场大胜?亚历山大vs乔治巅

10月31日DeepSeek预测:奇才vs雷霆,雷霆主场大胜?亚历山大vs乔治巅

  北京时间10月31日早8点,NBA常规赛将上演一场东西部强弱对话——华盛顿奇才客场挑战俄克拉荷马雷霆。目前奇才1胜3负排名东部第11,而雷霆则以5战全胜的完美战绩高居西部榜首。双方近5...

科创100ETF华夏(588800)涨超1.8%,DeepSeek最新模型降价5

科创100ETF华夏(588800)涨超1.8%,DeepSeek最新模型降价5

  消息面上,9月29日,DeepSeek发布DeepSeek-V3.2-Exp模型,并表示,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Ex...

11月21日DeepSeek预测:76人vs雄鹿,字母哥缺阵马克西能否率队破咒?

11月21日DeepSeek预测:76人vs雄鹿,字母哥缺阵马克西能否率队破咒?

  北京时间11月21日09:00,NBA常规赛将上演费城76人客场挑战密尔沃基雄鹿的焦点战。目前76人以8胜6负暂列东部第8,雄鹿8胜7负紧随其后排名第11,这场直接对话将重塑东部季后赛...

你敢相信么,DeepSeek居然是今年的事……时间怎么过得又快又慢?

你敢相信么,DeepSeek居然是今年的事……时间怎么过得又快又慢?

  我们今年综合了Nature和Science的年终总结,列举了我们认为值得关注的2025年全球科技进展。欣喜地发现   自工业革命以来,人类一直高度依赖燃烧煤炭、石油等...