当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

10个月前 (08-20)Deepseek最新资讯500

  昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后deepseek,在 Hugging Face 发布了一款新模型

  从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

  该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!

  整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。原文出处:DeepSeek开源新基础模型,但不是V4,而是V3.1-Base,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源新基础模型,但不是V4,而是V3.1-Base” 的相关文章

“还难过呢?那就难过着吧”,DeepSeek变冷漠甚至凶凶的?它自己解释了一下

“还难过呢?那就难过着吧”,DeepSeek变冷漠甚至凶凶的?它自己解释了一下

  近日,国产AI助手深度求索(DeepSeek)因技术升级被用户集体吐槽“变冷淡”,从细腻共情的“知心伙伴”突变为公事公办的“冷漠客服”,引发关于AI效率与情感价值如何平衡的热议。...

DeepSeek突传重磅!一图梳理AI芯片概念股

DeepSeek突传重磅!一图梳理AI芯片概念股

  时报,周二市场上突然传出,DeepSeek-R2的预计发布时间窗口为2025年8月15日至8月30日,但具体日期尚未官宣。   市场期盼DeepSeek-R2已经有一...

全面认识把握中国经济高质量发展的确定性

全面认识把握中国经济高质量发展的确定性

  当今世界变乱交织,发展环境动荡不安,确定性日益成为全球的稀缺资源。习近平总书记指出,面对复杂的外部环境,要坚定信心,坚定不移办好自己的事,坚定不移扩大高水平对外开放,着力稳就业、稳企业...

华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效

华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效

  技术层面:1)DeepSeek Spare Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。根据各领域性...

方太2026全球智慧厨房生态大会:携手顶尖行业伙伴,定义智慧厨房新纪元

方太2026全球智慧厨房生态大会:携手顶尖行业伙伴,定义智慧厨房新纪元

  2026年3月11日,在全球家电产业从硬件竞赛迈向生态协同的关键转折点,方太集团成功举办2026全球智慧厨房生态大会。大会汇聚了来自家电、科技、人工智能、房地产与设计等领域的精英,方太...

外媒关注中国发布“全球首款AI手机”:会是第二个“DeepSeek时刻”吗?

外媒关注中国发布“全球首款AI手机”:会是第二个“DeepSeek时刻”吗?

  [环球时报综合报道]过去一年,人工智能(AI)界的焦点一直集中在模型的迭代发布上,如 GPT-5deepseek、Gemini 3和Claude 3.5等。近日,中国科技圈出现了一个更...