当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

9个月前 (02-15)Deepseek最新资讯462

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。



这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,DeepSeek创下的又一个历史时刻,在海外平台再次登顶。


Hugging Face点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。


排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的黑森林工作室打造,点赞数约8710次。


排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。


OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。


此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2和谷歌Gemma-7B模型。


Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。



▲开源社区Hugging Face点赞榜(图源:Hugging Face)


DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。


DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。


DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。


多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。


当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。


“DeepSeek又得了个第一” 的相关文章

接入deepSeek的新基建潮中,这家公司火起来

接入deepSeek的新基建潮中,这家公司火起来

长江日报大武汉客户端2月21日讯(记者汪洋)开春以来,DeepSeek的接入带来了一个全新的产业生态,光谷信创(武汉)科技有限公司早早行动起来,积极开展接入服务,搭建新基建,让更多的企业和单位能够高效...

聚焦DeepSeek应用 中信国安旗下鸿联九五分享创新实践

聚焦DeepSeek应用 中信国安旗下鸿联九五分享创新实践

5月14日,由深圳市呼叫中心行业协会主办的“DeepSeek在客户中心行业的部署与应用实践”首场专题论坛于深圳福田成功举行。本次论坛聚焦DeepSeek大模型在客户中心领域的应用,吸引了众多行业专家与...

创新驱动 智领未来 山东移动DeepSeek高教共创沙龙举办

创新驱动 智领未来 山东移动DeepSeek高教共创沙龙举办

在科技飞速发展的当下,人工智能技术正以前所未有的速度重塑高等教育发展格局。为深入探索人工智能与高等教育的融合创新路径,3月27日,山东移动携手华为在青岛举办以“创新驱动 智领未来”为主题的DeepSe...

华为+DeepSeek,终于不再“服务器繁忙”?

华为+DeepSeek,终于不再“服务器繁忙”?

没有人不在期待大模型能够成为下一个电动车,作为代表中国的新兴产业,在世界范围内掀起狂澜。然而主流的MoE架构大模型,却苦于其结构上的“先天不足”:巨大的硬件成本与多重拖累效率的环节,使得中国企业在这场...

跨境电商试练AI,DeepSeek取代了ChatGPT

跨境电商试练AI,DeepSeek取代了ChatGPT

“接下来半年我们会看到AI应用在国内的蓬勃发展,DeepSeek会带来AI应用的枝繁叶茂。”聊起DeepSeek,跨境电商商家钱大柱这样说道。这样的技术论断来自“外行”的跨境商家并不寻常,背后是AI与...

不联网也能用AI!武汉企业推出DeepSeek本地部署主机

不联网也能用AI!武汉企业推出DeepSeek本地部署主机

长江日报大武汉客户端2月20日讯(记者郝天娇)春节期间,我国国产开源大模型深度求索(DeepSeek)在全球范围“火出圈”。上周五,黄陂区企业武汉攀升鼎承科技有限公司(以下简称攀升科技)正式推出搭载本...