当前位置:首页 > DeepSeek技术交流 > 正文内容

《自然》网站:中国AI模型“又一个DeepSeek时刻”

9个月前 (07-17)DeepSeek技术交流408

新华社伦敦7月16日电(记者郭爽)英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:

继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出的第二个强大的AI模型越来越感到兴奋。北京月之暗面科技有限公司于7月11日推出了Kimi K2。

Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。

目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

与DeepSeek系列模型类似,Kimi K2采用开源协议发布,允许研究人员免费下载并进行本地部署与二次开发。同时,该模型支持通过应用程序接口调用,其定价显著低于“克劳德4”等主流闭源模型。

美国艾伦人工智能研究所机器学习研究员纳坦·兰伯特说:“今年早些时候发布的DeepSeek-R1更像是AI发展轨迹中的前传,而非昙花一现。Kimi K2是全球最佳的全新开源模型。”

原标题:《《自然》网站:中国AI模型“又一个DeepSeek时刻”》


“《自然》网站:中国AI模型“又一个DeepSeek时刻”” 的相关文章

AI手机迎来“DeepSeek时刻”?

AI手机迎来“DeepSeek时刻”?

2025年将是AI商业化落地元年,智能手机行业的争夺战尤其激烈。苹果CEO库克曾表示,在已开放使用Apple Intelligence技术的国家内,iPhone 16系列销量更高。而iPhone 16...

Deepseek如何实现精准医疗的

Deepseek如何实现精准医疗的

DeepSeek实现精准医疗的方式主要通过以下几个关键步骤和技术手段:一、深度学习与大数据分析算法创新:DeepSeek在算法上进行了突破,引入了混合专家(MoE)架构等先进技术,提高了模型的运算效率...

DeepSeek-V3模型悄然更新,编程数学能力更强了

DeepSeek-V3模型悄然更新,编程数学能力更强了

交汇点讯 3月24日晚间,deepseek 悄然发布一款新的大语言模型——deepseek-v3-0324。这款 641gb 大小的模型在开源平台hugging face上亮相,几乎未作任何宣传。本次...

黄仁勋称DeepSeek带来AI模型新革命

黄仁勋称DeepSeek带来AI模型新革命

 7月15日,英伟达CEO黄仁勋在北京接受采访时表示,DeepSeek是一种新型的AI大模型,因为它能够多次深入思考,并以很快的速度完成。可以说DeepSeek是AI模型的一次全新革命,它不仅限于记忆...

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

【新智元导读】DeepSeek最新论文深入剖析了V3/R1的开发历程,揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈,实现低成本、高效率的大规模AI训练与推理。不...

DeepSeek能否煮沸老板电器的"冷灶"?

DeepSeek能否煮沸老板电器的"冷灶"?

老板电器中年危机:营收微增利降,推AI食神模型突围。倘若你问一个小学生,AI为你带来了什么。小孩儿哥可能会说“写作业可方便了,爸爸再也不用打我了”。但你要问一个厨子,他大概率会说,再也不用担心给孩子辅...