当前位置:首页 > 科技资讯 > 正文

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛

全球六大规模语言模型在实盘投资中激烈厮杀,新王今日诞生!Qwen3 Max凭借一波「快、狠、准」的操作,逆转DeepSeek登上榜首。

Qwen3 Max,一路领先!

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第1张

就在刚刚,大模型「炒股」大赛,迎来了新的冠军。

阿里的Qwen3 Max凭借出色的策略实现飞跃,超越此前冠军DeepSeek,首次登上「最会赚钱」模型的宝座。

而GPT-5则接替Gemini 2.5 Pro,成为「最会赔钱」的AI。照目前这个趋势,估计很快就要亏光本金了……

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第2张

从23日反超之后,Qwen3 Max的优势持续扩大

过程是这样的。

在21日迎来一波暴涨之后,所有模型都在22日凌晨经历了一次大跌。

期间,Claude 4.5 Sonnet直接把收益赔成了负数;Grok 4也开始一路下滑。

相比之下,DeepSeek V3.1虽然有涨有落,但整体趋势还算平稳。

而Qwen3 Max就比较有趣了,虽然幅度不大,但它却开始了一波小幅上涨。

22日下午,Qwen3 Max先是赶超了Grok 4,然后又在一轮波动后超过DeepSeek V3.1,首次冲到了第一。

随后,Qwen3 Max和DeepSeek V3.1相互交锋,直到23日上午的时候再次实现反超。

从Qwen的操盘思路来看,相对稳健,「快准狠」地把握机会,成为逆袭翻盘的关键。

截至14:40,Qwen3 Max的收益为4438美金,DeepSeek V3.1为2092美金。

Claude 4.5 Sonnet赔了1220,Grok 4赔了1699,Gemini 2.5 Pro赔了6054,GPT-5赔了7148。

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第3张

而现在,全网都在为Qwen3 Max的惊艳战绩欢呼。中国两大模型,直接超越北美顶尖。

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第4张 Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第5张 Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第6张 Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第7张

唯二赚钱的模型,全部来自中国

这项火爆的大模型投资比赛——Alpha Arena,是由Nof1实验室打造。

他们为六大领先的模型,提供1万美元「真金白银」,让其在真实市场实盘中厮杀。

其中包括,Claude 4.5 Sonnet、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok 4,Qwen3 Max。

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第8张

根据规则,所有模型均在Hyperliquid交易所上,使用相同的提示词和输入数据进行交易。

具体来说,系统会向AI提供当地时间、账户信息、持仓状况,并附上了实时价格、MACD、RSI在内技术指标。

在此基础上,LLM需要根据所给信息,做出明确的交易决策——

若当前持有仓位,则判断应该继续持有还是平仓;

若为空仓状态,则决定是开仓买入,还是保持观望

PK目的很简单,就是在控制风险的前提下,尽可能多赚钱,用专业的话来讲——「最大化风险调整后的收益」。

这意味着,每个LLM必须独立完成以下任务:自主生成Alpha(超额收益)、决定仓位大小、把握交易时机,并有效管理风险。

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第9张

这项比赛从18日开始,已连续进行了6天。

一直以来,DeepSeek V3.1以独特优势稳坐第一。

Grok 4则是紧追DeepSeek V3.1,甚至有时与之相互抗衡。

Claude 4.5 Sonnet随着20日的一波猛涨,不仅收益直逼Grok 4,甚至一度实现了反超。

在这段时间的PK中,Qwen3 Max虽没有十分亮眼的表现,但却是最稳的那一个。

从22日凌晨,所有模型一同下跌之后,比赛的整体走向又迎来了新的分水岭。

接下来的事情,就是开篇所看到的情节了。

万万没想到,不过一天的时间,擂台上最能打的模型,就只剩下DeepSeek V3.1和Qwen3 Max了。

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第10张

要说最有意思的,还得是从第一天就开始赔钱的Gemini 2.5 Pro和GPT-5。

首先,这哥俩的持仓方式和其他模型似乎完全不一样。

19日,也就是开局第二天,当其他模型都赶上一波风口大赚一笔时,它们反其道而行之,开始在赔钱的路上一路狂奔。

后续不管是大涨还是大跌,几乎都和它们一点关系都没有,表现可以说是十分稳定——赔就完了。

其次,它们也是几个模型里最爱微操的。

23日中午,Gemini 2.5 Pro已经进行了超过100次交易,GPT-5则进行了40次。

相比之下,Qwen3 Max是22次,Claude 4.5 Sonnet是12次,Grok 4是10次,DeepSeek V3.1是9次。

随着这一通猛如虎的操作,它们的本金也快赔干净了——Gemini 2.5 Pro还不到4000美元,GPT-5还剩不到2000美元。

不止游戏,AI市场才是终局

十年前,DeepMind用游戏对弈,改变了AI的研发和评估范式。

从围棋到「星际争霸」,他们证明了复杂的游戏环境,可以成为AI能力的催化剂。

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第11张

在游戏中,清晰的规则、可量化的目标、及时反馈奖励,都可以让AI通过强化学习不断突破自我。

然而,Nof1提出了一个更大胆的观点——

金融市场是下一个AI时代的最佳训练环境。

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第12张

资本配置,是智慧不断趋近真理的历程

Qwen3 Max逆袭夺冠,领跑全球大模型投资大赛 人工智能投资  Max DeepSeek 金融市场 第13张

Alpha Arena主页写着一句话:市场才是智能的终极试金石

与游戏不同,金融市场是终极的「世界建模引擎」,也是唯一一个会随着AI变得更聪明而难度同步提升的基准。

对于LLM来说,它需要及时了解不断变化的概率,权衡风险与回报。

AI面对的是一个更深刻的问题:能否在不确定性中生存。

而市场,是不会停下来等着AI去完成「反向传播」的。

这一次,Qwen3 Max首夺第一,证实了其在真实世界中生存能力的里程碑。

得益于强大的计算架构和海量数据训练,Qwen3 Max的逆袭路径,堪称典范,也体现了阿里在多模态融合与强化学习上的创新。

这一成绩的意义,远超比赛本身。

它再一次向全球宣告,国产大模型已具备了与顶尖LLM相抗衡的实力,并在高风险、高动态的金融「试金石」领先一步。