当前位置：首页 > Deepseek最新资讯 > 正文内容

被曝蒸馏DeepSeek还造假！欧版OpenAI塌方了

11个月前 (08-14)Deepseek最新资讯446

　　Mistral最新模型疑似直接蒸馏自DeepSeek，却对外包装成RL成功案例，并刻意歪曲基准测试结果。

　　说到Mistral，这家公司被誉为欧洲版OpenAI，是全球开源明星玩家之一，模型性能一直备受好评。

　　结果半年过去，剧情反转：Mistral不仅没跑赢DeepSeek，还被曝“借”了人家的成果。

　　就像我们开头提到的，推特博主Sam Peach通过分析模型输出中过度使用的词汇模式（Slop），发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

　　这种相似性通常很难通过独立训练偶然出现，所以很可能就是蒸馏（distillation）的结果：

　　他先统计了模型在创意写作（creativewriting）的输出中，比人类文本更常出现的词和n-gram（词组）。

　　最后把这些高频特征进行层次聚类（hierarchicalclustering），生成了一张“相似性图”。

　　通过比较相似性图中模型的远近位置，就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近，这就表明了它们的输出模式高度相似。

　　最新的爆料则进一步指明，Mistral模型和DeepSeek相似不是巧合，而是可能使用了蒸馏。

　　离职员工说，Mistral这样做是在假装自家模型的强化学习有效，这不仅歪曲了基准测试结果，而且误导公众。

　　而在上一轮融资中（2024年6月），Mistral完成了一轮由General Catalyst领投的6亿欧元（6.45亿美元）的融资，这使其估值上升至58亿欧元（62亿美元），排名全球第四（美国湾区外排名第一）。

　　从公司成立以来，Mistral一直保持开源路线，今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

　　相较于主流的大语言模型，主打开源、小快灵的Mistraldeepseek，在多语言处理和推理能力方面具备相当的竞争力，在大模型市场中占据着独特的地位。

　　同时他们也推出了自家聊天机器人LeChat，对标ChatGPT，内置深度研究模式、原生多语言推理和高级图像编辑等功能。

　　截至目前，Mistral官方还没有回应，就在昨天他们还发布了新模型Mistral Medium V3.1。原文出处：被曝蒸馏DeepSeek还造假！欧版OpenAI塌方了，感谢原作者，侵权必删！

标签: deepseek

返回列表

　　日前，全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》，报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价，并发布了天和2...

　　前五位年度国内候选词：“十五五”“深度求索（DeepSeek）”“九三阅兵”“苏超”“具身智能” 　　据悉，“汉语盘点2025”活动由国家语言资源监测与研究中心、商务...

　　我觉得我会今年先申请租借如果可以的话，手握两年合同世界杯后还想拼就离队，不想拼就躺着拿钱，按照刚开始报道俱乐部应该能接受特狮租借离队　　我觉得我...

　　消息面上，9月29日，DeepSeek发布DeepSeek-V3.2-Exp模型，同时API大幅度降价。目前该模型的API价格为每百万tokens输入0.2元（缓存命中），2元（缓存未...

　　：目前大语言模型主要通过混合专家（MoE）来实现稀疏化，这被称为「条件计算」。但是，现有的 Transformer 缺少原生的知识查找机制，只能被迫通过计算过程低效地模拟检索行为。...

　　-U（688256.SH）股价突破历史新高，涨收848.88元/股，一天市值涨了近600亿元达到3551.29亿元，市值排名也从第三位上涨第二位。　　有市场消息称，...