当前位置:首页 > Deepseek最新资讯 > 正文内容

中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底

5个月前 (11-05)Deepseek最新资讯223

  六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

  当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

  由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

  从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。

  在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

  从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Geminideepseek,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

  Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

  初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

  Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。原文出处:中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底,感谢原作者,侵权必删!

标签: deepseek

“中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底” 的相关文章

DeepSeek有望春节发布V4版本,软件ETF(159852)聚焦AI软件发展

DeepSeek有望春节发布V4版本,软件ETF(159852)聚焦AI软件发展

  2026年1月13日早盘,互联网、软件板块微涨,截至10:51,中证软件服务指数上涨1.28%,成分股中科星图上涨15.06%,卫宁健康上涨14.26%,用友网络上涨9.99%,石基信...

机构:豆包月活超越DeepSeek,跻身8月中国原生AI App月活第一

机构:豆包月活超越DeepSeek,跻身8月中国原生AI App月活第一

  据QuestMobile最新发布的AI行业发展数据,今年8月份,原生App、In-App AI及手机厂商AI助手均持续保持稳定增速,整体规模分别达6.45亿和5.29亿;PC端未如预期...

寒武纪:已同步实现对DeepSeek-V3.2-Exp的适配

寒武纪:已同步实现对DeepSeek-V3.2-Exp的适配

  观点网讯:9月29日,寒武纪公众号发文表示deepseek,2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎v...

DeepSeek V4 Lite 原生多模态 AI 曝光:百万 tokens 上

DeepSeek V4 Lite 原生多模态 AI 曝光:百万 tokens 上

  上下文窗口(Context Window)是指 AI 模型在生成回答时能“记住”的之前对话或输入文本的长度。窗口越大,模型处理复杂长篇任务的能力越强。   该模型原生...

TCL实业CES 2026:SQD-Mini LED显示技术定义“视”界新高度,

TCL实业CES 2026:SQD-Mini LED显示技术定义“视”界新高度,

  拉斯维加斯2026年1月7日/美通社/ -- 2026年1月6日,全球新产品、新技术、新趋势的风向标——国际消费类电子产品展览会(CES 2026)盛大启幕。作为本届CES参展面积最大...

继“DeepSeek时刻”之后,是什么让“中国时刻”持续刷屏?

继“DeepSeek时刻”之后,是什么让“中国时刻”持续刷屏?

  一年前,恰是这个周一,深度求索(DeepSeek)公司R1大模型以高性能和低训练成本震撼世界,外媒称之为“DeepSeek时刻”。   DeepSeek的横空出世,可...