当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

11个月前 (05-29)Deepseek最新资讯733

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

云南电信:携手DeepSeek赋能数字云南建设再升级

云南电信:携手DeepSeek赋能数字云南建设再升级

近日,云南多地政务、教育领域迎来智能化升级新突破。中国电信云南公司携手DeepSeek,通过AI大模型本地化部署,在教育教学、基层社会治理、政务服务等领域打造了一批具有示范效应的创新案例,为推动行业数...

神州信息:公司引入国产开源大模型DeepSeek

神州信息:公司引入国产开源大模型DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:公司是否有接入deepseek合作??神州信息(000555.SZ)4月21日在投资者互动平台表示,作为领先的金融科技企业,公司引入国产开源大模型DeepS...

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

时间是人生最宝贵的资源,浪费时间等同于慢性自杀。DeepSeek通过大数据分析,揭示了生活中最严重的7大时间杀手,帮助我们深刻反思,重新掌控生活节奏。第一,垃圾娱乐如游戏和短视频虽然短暂放松,但长期沉...

电信运营商接入DeepSeek影响几何?

电信运营商接入DeepSeek影响几何?

中新网北京2月28日电 (记者 刘育英)中国三家电信运营商已全面接入DeepSeek,给运营商充分利用自身算力,加快赋能千行百业数智化转型,改善自身业绩带来机遇。至2月初,中国电信旗下天翼云“息壤”已...

DeepSeek说:普通人如何应对美国关税冲击?

DeepSeek说:普通人如何应对美国关税冲击?

以下是应对美国关税战冲击的10条简明建议,结合多维度策略帮助普通人降低影响:1. 支持国货替代进口品减少对高价进口商品的依赖,优先选择国产电子产品、日用品和食品,降低消费成本的同时助力国内产业发展。2...

格尔软件:公司DeepSeek一体机仍处于市场培育阶段

格尔软件:公司DeepSeek一体机仍处于市场培育阶段

人民财讯3月4日电,格尔软件3月4日在互动平台表示,公司基于国产海光芯片的DeepSeek一体机,通过密码技术为本地部署的大模型赋予数字身份,解决本地大模型输出数据的可信问题与责任追溯困难的痛点,实现...