当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

1个月前 (09-30)Deepseek最新资讯165

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

11月1日DeepSeek预测:凯尔特人vs76人,马克西率队延续不败神话?

11月1日DeepSeek预测:凯尔特人vs76人,马克西率队延续不败神话?

  NBA常规赛东部焦点战即将打响,11月1日07:00,历史豪门凯尔特人将客场挑战势头正盛的76人。目前76人以4胜0负高居东部第二,而凯尔特人2胜3负暂列第10,这场对决或将重塑东部格...

康宁杰瑞制药ESMO数据惊艳亮相世界舞台,左手确定、右手创新,估值迎来“Deep

康宁杰瑞制药ESMO数据惊艳亮相世界舞台,左手确定、右手创新,估值迎来“Deep

  在2025年欧洲肿瘤内科学会(ESMO)这一全球顶级学术舞台上,康宁杰瑞(9966.HK)以其两款核心产品——HER2双抗KN026与HER2双抗ADC药物JSKN003的卓越临床数据...

10月16日DeepSeek预测:独行侠vs湖人,东契奇率队险胜残阵紫金军团

10月16日DeepSeek预测:独行侠vs湖人,东契奇率队险胜残阵紫金军团

  在10月16日的NBA季前赛收官战中,西部新贵独行侠将造访加密球馆挑战传统豪门湖人。尽管是练兵性质的季前赛,但两队近期交锋火药味十足——过去5次常规赛交手湖人3胜2负稍占上风,其中3场...

对话中关村科金总裁喻友平:DeepSeek热潮之后,To B需求正回归理性

对话中关村科金总裁喻友平:DeepSeek热潮之后,To B需求正回归理性

  过去两年,大模型在中国经历了从技术快速突破到产业加速落地的转折。资本和算力的集中投入推动了模型能力的提升,但真正进入企业日常并产生持续价值的,还取决于在具体行业场景中的应用深度。金融、...

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

10月23日DeepSeek预测:骑士vs尼克斯,米切尔率队客场取胜

  NBA常规赛即将迎来一场东部对决,克利夫兰骑士队将客场挑战纽约尼克斯队。作为上赛季东部第四的强队,骑士在新赛季首战中将面对状态火热的尼克斯,这场比赛无疑充满看点。  ...

「看」能否取代「读」,为何DeepSeek-OCR 爆火的重点不在性能?

「看」能否取代「读」,为何DeepSeek-OCR 爆火的重点不在性能?

  DeepSeek-OCR 热度的重点是什么?为什么视觉 token 更擅长处理长上下文?视觉 token 可以如何规避 NTP 机制的「近视」缺陷?为什么视觉 token 不会有「误差...