当前位置:首页 > Deepseek最新资讯 > 正文内容

百度发布两款大模型,对标DeepSeek、聚焦多模态

8个月前 (03-16)Deepseek最新资讯541

3月16日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。

今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半。

百度曾是国内最早一批发布大模型的厂商之一,在过去两年时间里,大模型领域国内大模型赛道竞争异常激烈,DeepSeek-R1以颠覆性姿态“杀”了进来,其开源+低价策略引发的"鲇鱼效应",迫使全球大模型厂商重新校准竞争维度。第一财经记者了解到,李彦宏在今年内部讲话中透露,百度将于下半年发布文心大模型的5.0版本,并加大AI应用商业化实践。接下来,百度还将在6月30日正式将文心大模型开源。

今日上午记者体验了百度原生多模态大模型文心4.5,用户可上传包括文档、图片、音频、视频的文件,让AI进行解读。记者上传了一张《哪吒》电影视频截图,就此询问文心4.5,但AI没能给出正确答案,而是称这是来自迪士尼动画电影《公主与青蛙》中的场景。不过在逻辑测试中,AI能准确识别脑筋急转弯的陷阱并给出回答,针对数学物理题、益智问答基本能给出准确回答。

文心大模型X1为深度思考模型,运用到的关键技术包括递进式强化学习、基于思维链和行动链的端到端训练、多元统一的奖励系统等,百度称在性能上对标DeepSeek-R1,具备“长思维链”。记者体验看到,除了联网搜索外,增加了多模态能力和多工具调用,能理解和生成图片,调用工具生成代码、图表等。目前DeepSeek-R1支持上传的附件仅识别文字。

在文本创作上,过去文心4.0的观点较为“端水”,4.5擅长写“锐评”;在图片理解方面,当记者再次拿出《哪吒》电影截图考考X1时,AI给出的答案是《快乐池塘》。记者在进一步的对话中告诉X1答错了,这是电影《哪吒》 场景后,AI表示感谢指正,经过分析后表示提供的图片场景确实出自电影《哪吒》。事实上AI每次错误都在拓宽技术边界,它的视觉理解也将在"犯错-修正"的螺旋中不断改进。

随着人工智能技术从基础问答向复杂推理跃迁,除了百度外,近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”,试图让AI突破表层语义匹配,建立因果推理、价值判断及跨领域知识迁移能力。这种竞争不仅体现在模型性能上,各家更通过云计算捆绑、行业解决方案等生态卡位争夺B端市场。

(本文来自第一财经)


“百度发布两款大模型,对标DeepSeek、聚焦多模态” 的相关文章

百度教育接入DeepSeek-R1满血版模型,支持多模态推理

百度教育接入DeepSeek-R1满血版模型,支持多模态推理

36氪获悉,2月25日,百度教育旗下产品“拍照搜题”正式接入DeepSeek-R1满血版模型。用户可使用百度App拍照功能进入“拍照搜题”,不仅可以通过数据库提供标准答案,还能发挥DeepSeek R...

海天瑞声联合华为发布海天瑞声x昇腾DeepSeek数据飞轮智能体

海天瑞声联合华为发布海天瑞声x昇腾DeepSeek数据飞轮智能体

5月23日,鲲鹏昇腾开发者峰会2025(KADC 2025)在北京中关村国际创新中心举办。会上,海天瑞声CTO黄宇凯与华为昇腾计算业务副总裁王庆文共同发布海天瑞声X昇腾 DeepSeek 数据飞轮智能...

中国电信丽水分公司完成Deepseek本地化部署

中国电信丽水分公司完成Deepseek本地化部署

近日,丽水政务云成功部署DeepSeek-R1多版本模型,本次部署的DeepSeek-R1模型在政务外网内,具备14B、32B等多版本模型能力。丽水政府首个DeepSeek大模型应用落地上线,丽水分公...

侨银股份携手算力中心,借 Deepseek 3.0 共启城服智能新局

侨银股份携手算力中心,借 Deepseek 3.0 共启城服智能新局

在当今时代,人工智能正深度渗透到各个行业,成为重塑产业格局的关键力量。城市运营服务领域亦不例外,“人工智能 +” 的发展模式为传统城市运营带来了前所未有的机遇与变革。侨银股份积极顺应这一趋势,携手广州...

Deepseek“震动”亚布力:中国首次有机会制定全球AI标准?

Deepseek“震动”亚布力:中国首次有机会制定全球AI标准?

在刚刚过去的周末,“亚布力中国企业家论坛第25届年会”顺利举行。关于Deepseek,新浪财经对话众多企业家、投资人、经济学家以及业内人士。DeepSeek的出现,无疑是人工智能领域的一次重大突破。在...

DeepSeek算力需求暴降,为什么全球算力竞赛反而更疯狂了?

DeepSeek算力需求暴降,为什么全球算力竞赛反而更疯狂了?

春节期间,国产大模型DeepSeek-R1的横空出世,一度让人们看到了“降本增效”的曙光。DeepSeek-R1以更低的成本和算力需求,实现了世界一流的模型性能,打破了大模型领域“烧钱买芯片”的传统路...