当前位置:首页 > Deepseek最新资讯 > 正文内容

全球首个AI投资大赛揭晓,阿里千问拿下第一,DeepSeek第二,GPT-5垫底

8个月前 (11-05)Deepseek最新资讯262

  最会赚钱的两个AI全部来自杭州:阿里千问Qwen以超20%的胜率夺冠,实现盈利的DeepSeek位列第二。而GPT-5亏损超60%垫底。

  该竞赛由三方机构Nof1于10月18日发起,集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大顶尖模型,每个模型拥有一万美元初始资金deepseek,在真实市场上无人工干预地自主决策、交易,根据盈亏情况决出最后冠军。

  历时17天,阿里千问Qwen以超20%的收益率夺得最后的冠军,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而四大美国顶尖模型全部亏损,GPT-5亏损超60%垫底。

  AI大模型在各种性能基准榜单中屡创新高,如何评估大模型在真实、动态、竞争激烈的环境中的决策水平,是当下AI竞技场最受人关注的领域。

  美国人工智能研究实验室 nof1.ai 发布的“Alpha Arena”(阿尔法竞技场),向六大顶尖模型提供1万美元及金融市场的实时价格及各类指标数据,让大模型在真实市场中用真金白银进行投资比赛,全程没有人工干预 ,模型进行自主决策和交易,是AI处理实时变动的现实世界任务的真实评测,也因此成为近期最火热的AI大赛。

  比赛初期,六大模型相对谨慎,大约5天后,参赛模型大致分为三大阵营:阿里千问和DeepSeek成功领先,屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok4在相近策略驱动下,维持在第二阵营,略有盈利,整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。

  截至北京时间11月4日早上比赛结束,阿里千问凭借在关键时刻的紧急避险,最后关头超越DeepSeek,Qwen以超20%的胜率问鼎冠军;DeepSeek实现盈利,位列第二,两大中国模型成为唯二仍保持正收益的大模型。

  赛事主办方Alpha Arena的创办人Jay Azhang多次为阿里千问Qwen模型策略及表现点赞,并祝贺阿里千问最终赢得冠军。有业内专家指出,阿里千问和DeepSeek在实战中的优秀表现,证明了中国模型在解决实际问题的强大潜力,AI对于场景的深刻理解,将成为大模型落地和未来全球AI竞赛的关键。原文出处:全球首个AI投资大赛揭晓,阿里千问拿下第一,DeepSeek第二,GPT-5垫底,感谢原作者,侵权必删!

标签: deepseek

“全球首个AI投资大赛揭晓,阿里千问拿下第一,DeepSeek第二,GPT-5垫底” 的相关文章

DeepSeek R2有望8月下旬发布?内部人士:不属实

DeepSeek R2有望8月下旬发布?内部人士:不属实

  近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。   早在今年4月deepseek,就有传言称,深度求索可能将在5...

DeepSeek预测:热刺vs纽卡斯尔!吉马良斯9球领衔,里沙利松7球救主,谁将

DeepSeek预测:热刺vs纽卡斯尔!吉马良斯9球领衔,里沙利松7球救主,谁将

  英超联赛第26轮即将迎来一场焦点战,热刺将在主场迎战纽卡斯尔。目前热刺排名第14,积29分,距离降级区仅有6分优势;纽卡斯尔排名第12,积33分,距离降级区有10分优势。两队本赛季的表...

全网爆火的DeepSeek「UE8M0 FP8」,原来英伟达早已支持

全网爆火的DeepSeek「UE8M0 FP8」,原来英伟达早已支持

  NVIDIA PTX ISA(并行线程执行,PTX 指令集)文档里面早就已经出现了 .ue8m0 这个数据类型   这相当于DeepSeek V3.1 把原本只在硬件...

赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

赚钱,DeepSeek果然第一!全球六大顶级AI实盘厮杀,人手1万刀开局

  【新智元导读】给全球六大LLM各发1万美金,丢进同一真实市场实盘厮杀,会发生什么?这场大战从18日开始,截止目前,DeepSeek V3.1盈利超3500美元,Grok 4实力次之。不...

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

  Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。   说到Mistral,这家公司被誉为欧洲版OpenAI,是...

国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新

国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新

  发布研报称,DeepSeek V3.1在多项指标上性能大幅领先R1-0528,加强了智能体支持,独创性使用UE8M0 FP8 Scale精度,与国产AI芯片协同创新。DeepSeek-...