当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V4下周登场,美股再次颤抖!「跳过」英伟达,便宜50倍

2个月前 (03-01)Deepseek最新资讯51

  【新智元导读】DeepSeek V4下周登场:原生多模态,绕过英伟达,针对国产芯片深度优化。华尔街最怕的那条逻辑可能又要重演:算力霸权松动,美股先颤抖。

  更炸裂的是,V4并没有选择跟英伟达做优化适配,而是优先与国产芯片厂商合作,针对国产AI芯片进行了深度调优。

  DeepSeek选择国内重磅会议前夕发布V4,无疑发出了一个信号:中国AI,不只是在追赶,还在定义新的游戏规则。

  网友称,「V4 将对 OpenAI 和 Google 形成巨大压力。中国没有放缓,而是在加速。」

  过去的DeepSeek模型主要是「文字选手」——写代码一流,做推理一绝,但图像和视频能力一直是短板。

  而且,V4 Lite已经在至少一家推理服务商处进行内测,据称拥有高达100万token的上下文窗口,表现远超网页版和应用版模型。

  目前已经在外网疯传的一张对比图显示,DeepSeek V4 Lite(代号「Sealion-lite」)在不开启思考模式的情况下,生成的SVG图像质量已经明显超越了当前的DeepSeek V3.2思考模型。

  据路透社和《金融时报》报道,DeepSeek这次绕开了英伟达,没有向这家美国芯片巨头提供V4的早期接入权限。

  这打破了AI行业长期以来的惯例——过去,任何一个顶级大模型发布前,都会先跟英伟达做性能优化。

  据知情人士透露,DeepSeek将在V4发布时同步放出一份简短的技术说明,并在大约一个月后发布一份更全面的技术报告。

  去年R1发布时附带的那份详尽技术报告,曾让全球AI研究者受益匪浅deepseek,被视为推理模型领域最重要的开源贡献之一。

  没有发布会,没有媒体吹风会,没有CEO站在台上挥手致意——就是简简单单地把模型放了出来,附带一份技术报告。

  R1在多项基准测试上达到了与OpenAI最强模型o1相当甚至超越的水平,而DeepSeek声称其训练成本仅为约560万美元——这个数字不到GPT-4训练成本的十分之一。

  2025年1月27日——这是一个将被载入AI史册的日子,DeepSeek的手机App超越ChatGPT,成为苹果App Store下载量第一的免费应用。

  同一天,英伟达股价暴跌近17%,单日市值蒸发约5890亿美元,创下美国股市单家公司历史最大单日跌幅纪录。

  多位美国科技界人士将其比作「斯普特尼克时刻」——1957年苏联先于美国将卫星送入太空的那一刻,象征着中国AI实力的强势崛起。

  而华尔街投资人最恐惧的问题浮出水面:如果一家中国公司用十分之一的成本就能做出同等水平的模型,那美国科技巨头每年砸下的数百亿美元基础设施投资,还值得吗?

  2月24日,Anthropic在X上高调发帖,指控DeepSeek等3家对其Claude模型发动了「工业级蒸馏攻击」,声称这三家中国实验室创与Claude进行了超过1600万次对话,以此提取能力来训练自己的模型。

  就在Anthropic高调指责「蒸馏」的同一周,网友发现了一个令人瞠目的bug:当你用中文问Claude「你是什么模型」时,它竟然回复:「我是DeepSeek V3。」

  目的很明确——在V4发布前抢占叙事高地,预先埋下「他们只会作弊抄袭」的框架,无论V4表现多惊艳,公众的第一反应都会被引导到负面解读上。

  同时通过舆论手段稀释V4发布的媒体关注度,防止美国科技股再次出现去年R1发布时那样的两位数暴跌。

  如今V4不仅在模型能力上更进一步(多模态、百万上下文、原生国产芯片适配),更在战略层面发出了优先适配国产芯片的明确信号。

  如果V4发布后的基准测试再次验证了DeepSeek的效率优势——用更少的计算资源达到世界一流水平——那华尔街的投资者势必要再次面对那个令人不安的问题:AI基础设施的天量投资,真的有必要吗?

  2023年7月成立,2024年12月发布V3,2025年1月R1震撼全球,一整年持续迭代打磨。

  美国的出口管制试图用「卡脖子」的方式遏制中国AI的发展,但DeepSeek的存在本身就是对这种策略最有力的回应。

  当你无法获得最顶级的芯片时,被迫去思考更聪明的方法——更高效的训练策略、更精妙的架构设计、更极致的资源优化。原文出处:DeepSeek V4下周登场,美股再次颤抖!「跳过」英伟达,便宜50倍,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V4下周登场,美股再次颤抖!「跳过」英伟达,便宜50倍” 的相关文章

“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快

“天才少女”罗福莉首秀:小米MiMo大模型,比DeepSeek更便宜、推理速度快

  12月17日,在2025小米“人车家全生态合作伙伴大会”上,有“天才少女”之称的罗福莉,完成了加入小米之后的首次公开演讲,并详述了小米在大模型领域的最新进展。   公...

DeepSeek和Kimi首轮就被淘汰,这项大模型对抗赛说明了什么?

DeepSeek和Kimi首轮就被淘汰,这项大模型对抗赛说明了什么?

  谷歌发起的“首届大模型对抗赛”,在赛前就已经话题度拉满,但是随着8月5日比赛正式打响,参赛AI展现出的水平或许令人有些失望。相比于两款中国模型DeepSeek-R1和Kimi K2 I...

DeepSeek预测:那不勒斯vs亚特兰大!德布劳内领衔火力对决,主场3-1碾压

DeepSeek预测:那不勒斯vs亚特兰大!德布劳内领衔火力对决,主场3-1碾压

  意甲第12轮焦点战即将在马拉多纳球场打响,目前排名第4的那不勒斯(22分)迎战第13的亚特兰大(13分)。主队距离榜首仅2分差距,而客队已落后欧战区6分——这场3分对双方而言都如同沙漠...

海尔智慧楼宇技术研发投入每年递增30%

海尔智慧楼宇技术研发投入每年递增30%

  技术研发正成为企业塑造核心竞争力的关键支柱。9月15日,在海尔智慧楼宇对外发布信息中显示,在产品研发投入上,每年增长率达到30%以上,这个数字还在持续上涨中。   据...

刚刚,豆包连发多款大模型:让 DeepSeek更好用,音频版 Sora 惊艳全场

刚刚,豆包连发多款大模型:让 DeepSeek更好用,音频版 Sora 惊艳全场

  对企业来说,token 消耗量直接等于成本。当模型开启深度思考时,效果确实能提升一大截,可延迟高了,token 烧得更猛了,成本也就跟着水涨船高。   尤其是 AI...

知乎发布2025年度十问 DeepSeek、苏超、《哪吒2》等话题上榜

知乎发布2025年度十问 DeepSeek、苏超、《哪吒2》等话题上榜

  新浪科技讯 12月26日午间消息,知乎发布2025年度十问,榜单涵盖科技、经济、文化、社会生活等多个领域,呈现出2025年公众最为关注的现实议题。   据了解,在科技...