当前位置:首页 > Deepseek最新资讯 > 正文内容

刚刚,DeepSeek发了“终极版”!

7个月前 (09-23)Deepseek最新资讯305

  智东西9月22日报道,今天晚间,DeepSeek在其官方API平台发布了最新升级的DeepSeek-V3.1-Terminus模型(Terminus拉丁语意为终点、界限),并在不久后宣布模型开源。

  官方文档中称,DeepSeek-V3.1-Terminus在保持模型原有能力的情况下,改进了语言一致性、偶发异常字符等DeepSeek-V3.1上线后出现的Bug,还进一步优化了编程和搜索智能体的表现。

  DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的性能提升最为明显,这一测试主要考察专家级的高难度知识和模型的多模态、深度推理等能力。

  而在Agent测评中,DeepSeek-V3.1-Terminus网页浏览、简单问答和多项编程测试中的表现出现小幅提升。

  今年8月,DeepSeek-V3.1上线后,有用户反馈在用API调用模型时,会偶尔出现一个严重Bug:模型会不受控地随机输出“极”、“極”、“extreme”等字样,严重影响日常使用,如果未经仔细检查就使用含有这一Bug的代码,很可能导致编译失败。

  智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网传能复现这一问题的“高危”提示词包括要求模型写Go语言、完成版本号相关任务、处理时间等。

  不过,DeepSeek-V3.1-Terminus在测试中并未因上述提示词而出现Bug,也就是说,这一问题应该已经被修复了。

  也有海外用户反映,此前的DeepSeek-V3.1存在多语言的问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek会把中、英、俄三种语言混用,问题文本的比例有时能达到5%。

  智东西尝试着让DeepSeek-V3-Terminus将这句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”

  DeepSeek-V3-Terminus的回答没有出现语言混杂问题,看来这一Bug也被修复了。

  除了Bug的修复之外,DeepSeek-V3.1-Terminus还有一大值得关注的地方是其编程和搜索智能体能力的提升。

  编程任务上,智东西让DeepSeek-V3.1-Terminus尝试了小球弹跳,结果如下。模型输出的网页采用了简约风格,不过,模拟的重力、摩擦力效果十分逼真。要打造这样的效果,模型不仅需要有很强的编程能力,也需拥有对物理学的理解能力。

  在搜索智能体能力方面,我们让DeepSeek-V3.1-Terminus推荐了几款适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快”、“可生食”、“对儿童安全”所有条件的植物。此外,模型也要交叉验证信息的可靠性,并进行整合提炼和风险提示。

  可以看到,DeepSeek-V3.1-Terminus给出的答案考虑十分周全,经人工核查事实无误,可读性也不错。

  DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里是“终点”或“界限”的意思,我们试着让DeepSeek自己对这一命名给出了解读。DeepSeek称,这一命名可能象征着DeepSeek-V3.1是这个系列架构的终极版本,代表了当前技术路径的成熟和完善。

  也有网友认为,Terminus可能意味着模型在编程终端里的表现更好了。不过,正如DeepSeek所言,具体的命名寓意最好还是官方来解释更为准确deepseek

  此前,外网有媒体报道称,DeepSeek今年年底即将推出Agent模型。或许,DeepSeek的下一次重大更新,已经不远了。原文出处:刚刚,DeepSeek发了“终极版”!,感谢原作者,侵权必删!

标签: deepseek

“刚刚,DeepSeek发了“终极版”!” 的相关文章

12月16日DeepSeek预测:火箭vs掘金,约基奇大战杜兰特,掘金主场险胜

12月16日DeepSeek预测:火箭vs掘金,约基奇大战杜兰特,掘金主场险胜

  西部第二的丹佛掘金将在主场迎战西部第三的休斯顿火箭,这是两支胜率超过70%的强队之间的对决。掘金目前以18胜6负的战绩领跑西部,而火箭则以16胜6负紧随其后。本场比赛的结果将直接影响西...

多个中国产品登上全球AI应用百强榜,DeepSeek位列第四

多个中国产品登上全球AI应用百强榜,DeepSeek位列第四

  近日,硅谷知名风投机构 a16z 发布第六版《顶级100款生成式 AI 消费级应用》榜单,以近期 SimilarWeb 网页访问量与 SensorTower 移动MAU为核心排名依据,...

山东博兴:DeepSeek赋能项目周期管理,引领工程建设高质发展

山东博兴:DeepSeek赋能项目周期管理,引领工程建设高质发展

  山东省博兴县行政审批服务局通过将数字化管理平台成功接入DeepSeek大模型,借助其强大的数据分析和自然语言处理能力,为平台增势赋能deepseek,实现了从项目立项到运维的全流程智能...

中国文人艺术的正格与变格 方创然书《翁城李白墓志铭并序》(Deepseek撰)

中国文人艺术的正格与变格 方创然书《翁城李白墓志铭并序》(Deepseek撰)

  冯友兰先生在《中国哲学简史》里把佛教在中国的发展分为“佛教在中国”和“中国的佛教”,以此类比,吾侪把当代艺术划分为“当代艺术在中国”和“中国的当代艺术”。“中国文人艺术的正格与变格”致...

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

算力大事件!中国算力大会举行,DeepSeek新模型适配下一代国产芯片

  我国在用算力中心标准机架达1085万架,智能算力规模达788 EFLOPS,干线400G端口数量大幅增加至14060个,存力总规模超过1680 EB,全国算力中心平均电能利用效率(PU...

DeepSeek开源OCR新模型!单张A100日处理可超20万页数据

DeepSeek开源OCR新模型!单张A100日处理可超20万页数据

  简单来看,团队的思路是,既然一张图就能包含大量文字信息,同时用的 Token 更少,那就可以将文本转成图像,这就是题目中提到的“光学压缩”,用视觉模态压缩文本信息。这一结果显示出该方法...