当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

1年前 (2025-03-27)DeepSeek技术交流613

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

DeepSeek崛起:人工智能如何重塑品牌营销的未来

DeepSeek崛起:人工智能如何重塑品牌营销的未来

随着数字化、智能化时代的深入发展,品牌营销不再仅仅依赖传统的广告投放或简单的营促销手段。如今,品牌必须采用更加精细化、个性化和互动化的策略,才能满足消费者日益多元化、快速变化的需求。与此同时,人工智能...

从“浅尝”到“深爱”,华为云Stack打通政企应用DeepSeek最后一公里

从“浅尝”到“深爱”,华为云Stack打通政企应用DeepSeek最后一公里

DeepSeek横空出世火爆全网,在个人用户端,DeepSeek App频登各大应用市场下载量榜首;企业用户端,不完全统计已有几百家企业机构用户宣布部署DeepSeek。“全民AI”的浪潮从DeepS...

运营商全面接入DeepSeek意味着什么?

运营商全面接入DeepSeek意味着什么?

《科创板日报》2月12日讯 近日,三大运营商宣布全面接入DeepSeek,给市场带来了一波不小的冲击。中国电信率先成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台;...

泉州出台工作方案!事关DeepSeek技术应用→

泉州出台工作方案!事关DeepSeek技术应用→

为深入贯彻党中央、国务院关于推动人工智能发展的战略部署,加快推动深度求索(DeepSeek,以下简称DS)技术在我市政务、产业等领域的应用,以人工智能、大数据技术赋能政务提质增效、产业转型升级,泉州出...

警惕不法分子借DeepSeek热度研发出的新型骗局

警惕不法分子借DeepSeek热度研发出的新型骗局

紧 急 预 警广大市民朋友:近期,DeepSeek的热度持续居高不下,这款全能型工具各领域分析处理能力都令人大开眼界。然而,DeepSeek的火爆也让不法分子利用用户渴望尝试DeepSeek却认知不足...

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

深度分析DeepSeek爆火背后,对整个AI产业带来的颠覆与冲击

本文参考报告:《2025中国DeepSeek对AI产业的影响》,首发于头豹科创网。DeepSeek在春节期间刷屏朋友圈,引发了AI产业关于低训练成本、开源与闭源模型选择、模型蒸馏及知识产权等话题的热烈...