当前位置：首页 > Deepseek最新资讯 > 正文内容

核心模型被曝蒸馏DeepSeek？前女友一纸控诉，曝出欧版OpenAI塌房真相！

11个月前 (08-16)Deepseek最新资讯490

　　【新智元导读】曾被誉为「欧洲OpenAI」的Mistral AI，陷入「抄袭」丑闻！在分手小作文中，前员工爆料核心技术是蒸馏DeepSeek，却误导外界称为自主RL成果。

　　几天前就有人在X上爆料：Mistral的新模型是直接蒸馏自DeepSeek，而且基准测试结果还被歪曲了。

　　这个被视为欧洲版OpenAI「全村希望」的公司，地位就如同中国的DeepSeek一般，如今居然塌房了？

　　你早知道Mistral做事不讲道德：把DeepSeek蒸馏后当成自己的模型，使用OpenAI的数据，对外却误导称是RL在发挥作用，但它实际上只是DS3的产物，还歪曲基准测试结果。

　　你不仅明知这些，还积极参与其中。当我指出这些问题时，你没有承担任何责任，反而选择无视我、对我冷处理。

　　也就是说，这位Mistral离职的女员工，不仅在小作文中曝光了自己和前男友、Mistral同事的感情纠葛，还爆出Mistral套壳DeepSeek的丑闻。

　　在「小作文」里，这位Mistral前员工痛诉自己如何接连遭遇上司排挤、伴侣出轨、求职无望，还要靠抗抑郁药物试图让情感生活重回正轨。

　　其实早在今年6月，就有一位火眼金睛的AI行内人发现，Mistral Small 3.2写的东西，它怎么这么像DeepSeek呢！

　　为了比较Mistral-small-3.2和DeepSeek-v3之间的相似性，这位博主在模型的创意写作输出中，提取了跟人类基线相比最过度呈现的单词和n-gram词组。

　　肉眼可见，Mistral-small-3.2和DeepSeek-v3在谱系图中的位置非常接近，从而表明它们的特征是极其相似的。

　　比如DeepSeek-R1非常擅长在对话中保持角色的一致性，而Gemini Pro 2.5也是如此，简直惊人的相似。

　　而且蒸馏大模型也不简单，DeepSeek蒸馏自己的R1模型就不太成功。Paech本人也表示，其实蒸馏也不算什么大错，现在很多模型都是这么干的。

　　大模型会把自己的「经验」（比如语言模式、写作风格）以一种简单的方式传给小模型。小模型通过大量练习，逐渐学会了类似的表现，但用更少的计算资源。

　　说到头来，Mistral的问题不在于蒸馏DeepSeek，而在于把模型的进步归功于自家的RL方法，甚至蓄意改变基准测试。

　　在今年2月，才成立一年多的Mistral AI已经估值62亿美金，成为法国的骄傲，欧洲的骄傲。

　　2023年，这三位来自谷歌DeepMind、Meta的前员工希望打造一家遵循欧洲模式的AI公司——开源、高效、注重隐私。

　　在当时，当OpenAI斥资超1亿美金训练GPT-4时deepseek，Mistral仅用2200万美元就打造出了最具竞争力的AI模型。

　　甚至马克龙还信誓旦旦表示，法国未来几年将投资1090亿欧元用于建设AI，尽最大努力为包括Mistral在内的公司创造空间。

　　在成立仅仅七个月的时间里，Mistral就在两个主要「权重级别」上发布了SOTA开源大语言模型（mistral-7b 和 mixtral）。原文出处：核心模型被曝蒸馏DeepSeek？前女友一纸控诉，曝出欧版OpenAI塌房真相！，感谢原作者，侵权必删！

标签: deepseek

返回列表

　　8月12日，《财富》（中文版）发布“中国40位40岁以下的商界精英”榜单，榜单包括两部分，中国40位40岁以下的商界精英榜单与中国40岁以下最具潜力的商界精英榜。来自佛山的“女二代”—...

　　相较于去年8月发布的DeepSeek V3.1所支持的128K上下文，新实装模型的上下文能力较两个月前更新的V3.2提升达八倍deepseek。　　网友实测显示，D...

　　伦敦12月8日，中国人工智能公司DeepSeek创始人梁文峰和“深潜者”中国地球科学家杜梦然入选《自然》杂志年度“自然10人”榜单，该榜单重点介绍2025年一些最重大科学事件的核心人物...

　　2月13日，DeepSeek官方助手在开发者交流群中表示，DeepSeek网页/APP正在测试新的长文本模型结构，支持1M上下文，而API服务不变，仍为V3.2，仅支持128K上下文。...

　　北京时间11月22日11:00，NBA常规赛将迎来西部卡位战关键对决——金州勇士坐镇大通中心迎战波特兰开拓者。目前勇士以9胜8负暂列西部第8，开拓者6胜9负紧随其后，这场季后赛门槛争夺...

　　DeepSeek更新日志显示，deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上...