当前位置:首页 > DeepSeek技术交流 > 正文内容

《自然》网站:中国AI模型“又一个DeepSeek时刻”

4个月前 (07-17)DeepSeek技术交流281

新华社伦敦7月16日电(记者郭爽)英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:

继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出的第二个强大的AI模型越来越感到兴奋。北京月之暗面科技有限公司于7月11日推出了Kimi K2。

Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。

目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

与DeepSeek系列模型类似,Kimi K2采用开源协议发布,允许研究人员免费下载并进行本地部署与二次开发。同时,该模型支持通过应用程序接口调用,其定价显著低于“克劳德4”等主流闭源模型。

美国艾伦人工智能研究所机器学习研究员纳坦·兰伯特说:“今年早些时候发布的DeepSeek-R1更像是AI发展轨迹中的前传,而非昙花一现。Kimi K2是全球最佳的全新开源模型。”

原标题:《《自然》网站:中国AI模型“又一个DeepSeek时刻”》


“《自然》网站:中国AI模型“又一个DeepSeek时刻”” 的相关文章

DeepSeek如何成为媒体人的“全能搭档”

DeepSeek如何成为媒体人的“全能搭档”

DeepSeek如何成为媒体人的“全能搭档”作者:李文睿随着VR、大数据、AI 这些新技术的快速迭代,新闻宣传领域正经历前所未有的变革。作为一名新媒体编辑,笔者在尝试梳理DeepSeek 等...

DeepSeek正在失去其市场份额?Token经济学将定义竞争格局

DeepSeek正在失去其市场份额?Token经济学将定义竞争格局

来源:SemianalysisZ Highlights:在人工智能的世界里,唯一重要的就是计算。与DeepSeek一样,Anthropic也受到计算能力的限制。Anthropic的产品开发专注于代码,...

DeepSeek再创奇迹!新华社权威背书!中国AI站上世界之巅!

DeepSeek再创奇迹!新华社权威背书!中国AI站上世界之巅!

中国AI这次搞出的动静,让世界不得不服! 仅仅在DeepSeek-R1横扫全球开源榜单半年后,中国团队再次掀翻牌桌——月之暗面(Moonshot)全新万亿模型Kimi K2横空出世,彻底引爆全球科技圈...

2025年高考倒计时 deepseek挑战作家张一一高考作文

2025年高考倒计时 deepseek挑战作家张一一高考作文

2025年高考进入最后的冲刺倒计时DeepSeek、Manus、ChatGPT等AI与作家张一一高考作文的“华山论剑”成看点2025年全国高考进入最后十多天的冲刺倒计时。今年高考DeepSeek、Ma...

潮评丨“DeepSeek首次用于地震国际救援”,带给我们三重启示

潮评丨“DeepSeek首次用于地震国际救援”,带给我们三重启示

潮新闻客户端 评论员 王彬图源:央视新闻今天,话题#DeepSeek7小时攻克缅甸救灾语言关#登上热搜榜,引发网友关注。咋回事呢?近日发生的缅甸7.9级地震,灾情牵动人心。在救援行动中,一项由中国团队...

DeepGEMM的特点包括哪些?

DeepGEMM的特点包括哪些?

‌DeepGEMM‌是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,由DeepSeek宣布开源。DeepGEMM支持普通和混合专家(MoE)分组的GEMM运算,采用CUDA编写,在安装过程...