当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

9个月前 (09-30)Deepseek最新资讯410

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

突破性进展!国际首台,“悟空”研制成功

突破性进展!国际首台,“悟空”研制成功

  8月2日,浙江大学脑机智能全国重点实验室发布新一代神经拟态类脑计算机—Darwin Monkey(以下简称“悟空”)。“悟空”支持的脉冲神经元规模超过20亿,神经突触超过千亿,其神经元...

DeepSeek陈德里:这一轮的AI革命,我们还处在上半场 直击乌镇

DeepSeek陈德里:这一轮的AI革命,我们还处在上半场 直击乌镇

  新浪科技讯 11月7日下午消息,在2025年世界互联网大会乌镇峰主论坛上,“杭州六小龙”企业领导人首聚乌镇,并在中国工程院院士、阿里云创始人王坚主持下同台对话。   ...

10月18日DeepSeek预测:森林狼vs76人,爱德华兹率队客场取胜

10月18日DeepSeek预测:森林狼vs76人,爱德华兹率队客场取胜

  北京时间10月18日07:00,NBA季前赛将迎来一场焦点战,明尼苏达森林狼客场挑战费城76人。森林狼作为西部第6的劲旅,将面对东部排名第13的76人。尽管是季前赛,但两队近期状态迥异...

10月30日DeepSeek预测:湖人vs森林狼,东契奇缺阵,森林狼主场险胜?

10月30日DeepSeek预测:湖人vs森林狼,东契奇缺阵,森林狼主场险胜?

  北京时间10月30日,NBA常规赛将迎来西部中游对决,湖人客场挑战森林狼。两支球队目前战绩均为2胜2负,分列西部第7、8位,此役胜负将直接影响季后赛席位争夺格局。  ...

加速构建国产GPU生态 摩尔线程举办首届开发者大会

加速构建国产GPU生态 摩尔线程举办首届开发者大会

  中国日报12月24日电 (记者 马思)“生态体系是GPU行业的核心护城河与价值所在,我们持续加大研发投入,致力于攻克从硬件到软件的核心技术挑战,以开放创新不断深化与生态伙伴的协同,共同...

DeepSeek面临数据质量难题,大模型发展遇瓶颈

DeepSeek面临数据质量难题,大模型发展遇瓶颈

  #互联网公司# 算力被视为推动人工智能发展的强大发动机,而数据则是不可或缺的燃料。然而,数据的质量却成为了制约大模型发展的关键因素之一,DeepSeek 正面临着这样的数据难题。中文互...