当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

7个月前 (09-30)Deepseek最新资讯405

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

DeepSeek-R1训练方法发布!

DeepSeek-R1训练方法发布!

  DeepSeek-AI团队梁文锋及其同事17日在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。研究表明,大语言模型(LLM)的推理能...

1月21日DeepSeek预测:湖人vs掘金,约基奇缺阵,东契奇率队客场险胜

1月21日DeepSeek预测:湖人vs掘金,约基奇缺阵,东契奇率队客场险胜

  西部季后赛卡位战即将打响!北京时间1月21日11:00,湖人将客场挑战卫冕冠军掘金。目前湖人以25胜16负排名西部第6,掘金则以29胜14负高居西部第3。本场比赛最大看点在于约基奇、穆...

DeepSeek又回来了!国产大模型仍然能打!

DeepSeek又回来了!国产大模型仍然能打!

  发布之后,我曾一度觉得deepseek,国产大模型这下该着急了!因为,在算力不足的情况下,国产大模型似乎难以和国外大模型抗衡了!   据DeepSeek公众号介绍:官...

【光明论坛】从十大科技新闻看自立自强的底气

【光明论坛】从十大科技新闻看自立自强的底气

  元旦前夕,2025年国内十大科技新闻揭晓。一项项突破性成果勾勒出我国高水平科技自立自强的清晰轨迹:国产AI大模型引发全球瞩目、“人造太阳”刷新世界纪录、嫦娥六号揭开月背奥秘、福建舰开启...

力压Deepseek!豆包夺原生AI APP月活第一

力压Deepseek!豆包夺原生AI APP月活第一

  依托抖音、剪映等产品的流量入口,豆包实现用户高效转化,其拟人化交互设计与低门槛体验更贴合大众需求——从恋爱攻略到旅游规划deepseek,场景化服务覆盖生活全维度。...

杀疯了!豆包月活1.72亿登顶,力压DeepSeek拿下第一

杀疯了!豆包月活1.72亿登顶,力压DeepSeek拿下第一

  QuestMobile公布了2025年三季度AI应用行业报告。报告显示,字节跳动旗下豆包以1.72亿月活用户登顶榜首,力压Deepseek的1.44亿月活。   要知...