当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

9小时前Deepseek最新资讯37

  昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后deepseek,在 Hugging Face 发布了一款新模型

  从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

  该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!

  整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。原文出处:DeepSeek开源新基础模型,但不是V4,而是V3.1-Base,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek开源新基础模型,但不是V4,而是V3.1-Base” 的相关文章

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网

  :V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。   这次最明显的变化是,DeepSeek在官方APP...

DeepSeek母公司幻方量化曝亿元佣金套取案 招商证券多人卷入调查

DeepSeek母公司幻方量化曝亿元佣金套取案 招商证券多人卷入调查

  量化投资圈传闻已久的“幻方量化员工涉券商返佣被查”事件近日细节浮出水面。DeepSeek母公司幻方量化市场总监李橙与招商证券深南东路营业部原总经理孟鹏飞被曝在2018年至2023年间合...

DeepSeek公司要上市了?知情人士回应

DeepSeek公司要上市了?知情人士回应

  《辟谣财知道》注意到,近期一则关于DeepSeek(深度求索)公司上市的消息出现在诸多权威的新闻网站。   版本一是DeepSeek准备科创板上市,于7月18日发布。...

“DeepSeek问世半年影响仍在,改写了业界思维方式”

“DeepSeek问世半年影响仍在,改写了业界思维方式”

  【文/观察者网 柳白】半年多前,中国人工智能应用DeepSeek横空出世,在全球科技界掀起轩然大波。   英国广播公司(BBC)8月10日发文写道,DeepSeek震...

DeepSeekR2或8月发布,此前DeepSeek服务突遭全面宕机,被曝因为R

DeepSeekR2或8月发布,此前DeepSeek服务突遭全面宕机,被曝因为R

  市场期盼‌DeepSeek-R2已经有一段时间,而在ChatGPT-5发布之后,市场对此的预期更盛。今天,市场上突然传出,‌DeepSeek-R2的预计发布时间窗口为2025年8月15...

高温空调选购指南,TCL空调小蓝翼C7新风空调解锁“清凉安睡”秘籍

高温空调选购指南,TCL空调小蓝翼C7新风空调解锁“清凉安睡”秘籍

  今年夏天,罕见的高温天气席卷全国,江浙沪、安徽、江西等地40℃高温频现。酷热难耐之下,空调成为每个家庭不可或缺的避暑“神器”,这就导致空调市场需求暴涨,不少地方甚至出现了一机难求的局面...