当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek,激荡AI行业的“一股清流”

2个月前 (02-21)Deepseek最新资讯144

近期,外媒纷纷将聚光灯投向中国初创企业深度求索公司,其自主研发的人工智能(AI)大语言模型“深度求索”(DeepSeek)凭借“好用、开源、免费”三大特点,在全球范围内引发热烈反响。这一创新成果不仅在中国本土大放异彩,更是在大洋彼岸的美国乃至全球科技界激起了广泛讨论并受到高度评价,被视为挑战现有AI巨头垄断地位的“一股清流”。

多家外媒接连不断的报道,让DeepSeek这一出人意料的、高效而强大的AI模型席卷了科技行业,这种“改变游戏规则”的大型语言模型,有望快速重塑AI格局。

低成本兼具高性能

西班牙《国家报》、澳大利亚《对话》杂志、美国《纽约时报》等多家外媒均关注到,DeepSeek的技术具有强大创新力,是因为它能在降低计算成本的同时实现尖端性能。

AI公司通常使用装有1.6万枚或更多专用芯片的超级计算机来训练聊天机器人,但深度求索公司表示,他们只用了大约2000枚芯片。同时,他们仅花了不到600万美元就训练了新模型,成功在两方面把构建AI的价格“打了下来”。

首先,DeepSeek模型使用数据蒸馏技术生成高质量数据,提升了训练效率;其次,DeepSeek采用了一种称为“混合专家”的方法。当用户提出一个问题时,模型会决定是否激活其医疗专家、翻译、律师或物理学家。传统模型会同时激活所有专家,这会浪费能源和计算能力。而DeepSeek则将这些小型“专家”系统与一个“通才”系统相结合,实现了相同的功能。通才系统对每个主题都有相当的了解,可帮助协调专家之间的互动。

开源策略打破技术垄断

Deepseek的独特之处还在于,其采取了开源策略。这犹如在美国及少数几个长期主导AI技术领域的巨头中投了一枚震撼弹,打破了既有格局。

如今,这项技术已向全世界敞开大门。鉴于DeepSeek模型免费可得,其他公司或将不得不调整价格策略,以保持市场地位。当能够以零成本获得类似技术时,没有人愿意支付额外费用。

《对话》杂志报道称,与专有AI模型占主导地位的美国不同,中国AI新创企业拥抱开源生态系统,以更快地扩大创新规模,并融入全球AI合作。

得益于人才培养与政策支持

在近日的法国人工智能峰会上,多名国际科技界高管均认为,DeepSeek 的出现表明,在AI领域,中国企业的进步不容小觑。

《自然》杂志报道,2017年,中国政府宣布,计划到2030年将中国打造成为全球AI领域的领头羊。政府要求相关行业在2025年前实现AI领域的重大突破,“使相关技术和应用达到世界领先水平”。

据美国乔治城大学安全与新兴技术中心的一份报告,截至2022年,中国教育部已批准440所大学开设AI专业本科学位。美国智库MacroPolo数据显示,同年,在全球顶尖AI研究人员中,华人几乎占据了“半壁江山”,而美国人仅占18%。

澳大利亚悉尼科技大学科技政策研究员马丽娜·张专注于中国的创新研究。她表示,DeepSeek公司的成功得益于政府对AI教育和人才培养的投资,这些投资包括众多奖学金、研究经费以及学术界与产业界的合作。

创新重塑全球AI格局

美国趣味工程网AI专栏作家塞贾尔·夏尔马发表评论称,如此强大的模型出自中国,让美国感到“坐立不安”。英国广播公司则直接在标题中称,“中国的DeepSeek AI震撼行业,削弱美国霸权”。

美国总统特朗普当地时间1月27日在佛罗里达州迈阿密发表讲话时,称DeepSeek的出现“给美国科技产业敲响了警钟”。

美国《麻省理工技术评论》网站在报道中表示,考虑到中国AI企业面临美国对尖端芯片出口管制日益收紧的制约,DeepSeek的成功“更显非凡”。种种迹象表明,美国的制裁并未削弱中国的AI实力,反而似乎正驱使深度求索等初创企业以效率、资源整合和协作为优先方向进行创新。《国家报》报道也认为,美国制裁加速了中国AI创新。

美国消费者新闻与商业频道网站援引专家观点表示,美国自认为处于世界科技领袖的地位已不再被普遍接受。

中国人工智能发展的破局与担当

【国际科技论坛】

◎张佳欣

今年春节前后,中国人工智能公司深度求索推出了AI模型DeepSeek。自其诞生之日起,便势如破竹,连续多日稳居苹果App Store与谷歌Play Store全球下载榜首。其引发的巨大波澜绝非偶然,这背后是技术创新、开源策略以及全球视野共同作用的必然结果。

长久以来,世界各地对AI的构建似乎形成了一些固有观念,认为唯有那些拥有巨额投资和全球大规模应用前景的企业,才能涉足这个领域。但是,DeepSeek却以一种前所未有的姿态,打破了这些固有认知。

工欲善其事,必先利其器。在外部技术封锁与市场压力的双重夹击下,DeepSeek团队凭借卓越的技术实力与创新能力,成功使用2048块英伟达H800 GPU芯片,在短短两个月内训练出了拥有6710亿参数的开源大模型,且成本仅为558万美元。要知道,在美国限制科技公司芯片出口中国的大背景下,H800是英伟达专门为中国市场设计的“阉割版”。这一效率与性价比的奇迹,是中国科技企业自立自强、勇攀科技高峰的生动写照,也是对那些试图通过技术封锁遏制中国科技发展的有力回应。

谋定而后动,笃行而致远。事实上,中国政府早期对AI领域的战略布局为Deepseek等创新企业的崛起奠定了坚实基础。中国政府高度重视AI发展,2017年更是明确了我国新一代AI发展的战略目标,为企业提供了创新的沃土。如今,中国凭借强大的科研实力、丰富的应用场景和活跃的创新生态,吸引着全球目光。

开源通四海,技术达八荒。DeepSeek采取的开源策略,是其迅速走红全球的另一大关键。在美国的技术“围剿”、封闭源代码成为常态背景下,DeepSeek在封锁线上“凿开”了突破口,毅然选择开源,打破了AI领域的闭源模式,推动了开放生态的拓展。此举不仅吸引了大量开发者围绕DeepSeek构建应用生态,还提升了行业透明度和创新性,展现了中国AI科技企业的开放态度和责任担当。

DeepSeek的成功,是中国AI人才培养、技术创新、产业生态等方面全面崛起的缩影。这匹“黑马”以实力证明,中国科技企业有能力在全球舞台上与顶尖玩家同台竞技。AI行业正经历着去中心化的深刻变革,在谁有权开发和控制AI的问题上,“东方”与“西方”的传统界限正逐渐模糊。未来,科技的浪潮奔腾不息,而中国科技企业必将在其中书写浓墨重彩的一笔。

来源:科技日报


“DeepSeek,激荡AI行业的“一股清流”” 的相关文章

山东移动DeepSeek产品服务体系助力千行百业构建智慧中枢

山东移动DeepSeek产品服务体系助力千行百业构建智慧中枢

今年以来,国产AI大模型DeepSeek热度持续攀升,点燃了人工智能发展热潮。作为经济大省,山东深入实施“人工智能+”行动,以传统产业升级与新兴产业培育并重的双轮驱动战略,书写新旧动能转换的进阶之路。...

机构调研券商!DeepSeek部署成为热点问题

机构调研券商!DeepSeek部署成为热点问题

券商股近期异动频频。券商中国记者注意到,对于上市券商的关注,除了一些合并传闻的扰动,机构投资者对长江证券、长城证券等上市券商以及券商概念股——指南针等,也展开了新一轮调研,券商布局DeepSeek的进...

国家知识产权局:严打抢注“DeepSeek”等相关商标申请行为

国家知识产权局:严打抢注“DeepSeek”等相关商标申请行为

中新经纬4月24日电 国新办24日就2024年中国知识产权强国建设有关情况举行新闻发布会。国家知识产权局局长申长雨在会上表示,严厉打击抢注“DeepSeek”等相关商标申请行为,持续强化知识产权保护,...

福建泉州:部署DeepSeek大模型,助力智慧教学

福建泉州:部署DeepSeek大模型,助力智慧教学

 中国教育报-中国教育新闻网讯(记者 黄星)日前,福建省泉州市中小学校人工智能素养能力提升培训在泉州市晋光小学东海校区举行。  活动现场,泉州市晋光小学教师许榕鑫在语文课堂上运用AI生图技术,引导学生...

DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户

DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户

原创 陈骏达 智东西新版V3都来了,R2和V4还会远吗?作者 | 陈骏达编辑 | 漠影智东西3月25日报道,昨日晚间,DeepSeek在开源平台悄然上线了升级后的DeepSeek-V3模型。新模型的版...

DeepSeek-R1内心世界首次曝光!AI显微镜破解R1大脑神秘推理机制

DeepSeek-R1内心世界首次曝光!AI显微镜破解R1大脑神秘推理机制

【新智元导读】推理模型与普通大语言模型有何本质不同?它们为何会「胡言乱语」甚至「故意撒谎」?Goodfire最新发布的开源稀疏自编码器(SAEs),基于DeepSeek-R1模型,为我们提供了一把「A...