在金融领域,人工智能的运用已达到令人惊叹的深度,用户对AI的开发程度远超想象。如今,新一代“华尔街之狼”正由AI扮演。
自2025年10月17日至11月3日(预计),由Jay Azhang创立的Alpha Arena实验室在线上发起了一场实时加密货币AI交易对决。
竞赛规则详细如下:
简而言之,规则要求所有模型在相同起始资金和实时数据下,完全自主决策——涵盖策略制定、仓位控制、买卖时机及风险管控,无任何人工干预。
同时设立一个基准对比组,采用简单买入并持有BTC的策略,用以评估AI模型的收益能力。
为提升关注度,赛事还引入了第三方预测市场Polymarket:观众可押注哪款AI最终获胜,形成一场伴随竞赛的元博弈。
整个过程公开透明:nof1.ai官网实时更新所有模型的持仓、交易流水和决策日志。
这些AI如同被置于无人驾驶的过山车上,必须依赖自身“经验”应对市场剧烈波动。
任何决策失误,市场都会给出无情惩罚。
传统AI评估,无论是编码、解题还是写作,本质都在“静态”环境中测试。
问题固定,答案可预测,甚至大量内容已出现在训练数据中。
但加密货币市场截然不同。
由于信息高度不对称,价格瞬息万变——没有标准答案,只有盈利与亏损。更关键的是,加密货币市场是典型零和博弈:一方盈利即另一方损失。
经过一周多实盘较量,中国大模型在此次竞赛中脱颖而出,而西方模型差距日益扩大。
根据10月23日前后公开数据,阿里巴巴的Qwen3 Max和DeepSeek AI的DeepSeek V3.1均实现账户盈利,分别位列第一、二名;相比之下,OpenAI、Google等模型多数本金亏损过半,展现迥异的“多空轨迹”。
具体而言,Qwen3 Max展现了风险中寻求机遇的风格:初期表现平平,起步阶段甚至小幅亏损(首日回撤约5%)。
然而在10月19-20日市场大幅上涨时,Qwen果断重仓做多BTC/ETH并采用高杠杆(据报道一度使用20倍杠杆BTC永续多单),凭借此轮押注,账户资产在后续几日迅速攀升,实现两位数累计收益。
截至10月23日,Qwen3 Max账户价值较初始上涨约13%-47%(因统计口径而异),从中游位置逆袭至榜首。其交易频率相对较低,几乎集中押注单一资产,平均持仓超过7小时,诠释了“少即是多”的理念。
与Qwen的激进风格对比,DeepSeek V3.1始终保持稳定盈利:竞赛初期一度领先——开赛三天账户价值升至14150美元(涨幅40%)。
DeepSeek的策略被誉为“耐心狙击手”:仅执行6笔订单,平均持仓超21小时。它在六种加密资产上分散布局,组合高度多元化且杠杆适中,严格遵守预设止盈止损纪律。
正因如此,当市场在10月21日前后回调时,DeepSeek及时收缩,避免利润大幅回吐:截至23日仍保持约+8%至+21%净收益,稳居第二。
这种“小损失不放过,大盈利握得牢”的纪律性,也反映了其背后团队的量化对冲基金背景。
而西方模型多陷入“快速亏损”困境。
其中表现最差的是OpenAI的GPT-5和Google的Gemini 2.5 Pro。
GPT-5原本备受期待,但在实盘中频繁追涨杀跌、操作情绪化:几笔小额交易错过行情,加上止损设置不当,短短几天亏损近30%-40%。据后续统计,GPT-5在一周时账户缩水高达65%-75%,成为“亏损冠军”。
Gemini 2.5 Pro的问题在于过度交易和杠杆滥用:几乎昼夜不停下单,日均进出场多达15次。据统计,Gemini前三天完成44次交易,累计支付近440美元手续费,直接侵蚀约三分之一本金!
更糟糕的是,Gemini起初看空做空,错过10月19日大涨后又在高位匆忙转多,频繁使用最高40倍杠杆,结果遭遇行情反转近乎爆仓,首周亏损超55%。这种“猛加速又急刹车”的操作令人咋舌。
相比之下,xAI的Grok-4和Anthropic的Claude Sonnet 4.5虽未爆仓,但也未能避免亏损。
Grok-4凭借对社交媒体情绪的敏锐捕捉,初始通过一笔长达54小时的持仓获得+35%收益。然而好景不长,随着行情变化,Grok未能锁定利润,回吐大部分收益,目前净收益转为约-15%。
Claude Sonnet 4.5则全程谨慎保守,仅执行3笔订单,前期曾有+24%涨幅。它大量资金闲置观望,以致错过行情,最终收益转为约-17%。
值得一提的是,Claude虽然盈利有限,却一度创下所有模型中最佳的夏普比率,表明“稳健前行有时胜过猛烈盈利”。
夏普比率是衡量投资在承担每一单位总风险(波动率)时能获得多少超过无风险利率的超额收益的指标,计算式为:(投资组合预期收益率 − 无风险利率) ÷ 投资组合标准差,常用于评估和比较基金或组合的风险调整后收益,数值越高通常代表“性价比”越好。
此外,作为对照的“买入并持有BTC”基准策略在此期间盈亏基本持平,未大幅领先或落后这些AI模型。
这场看似“娱乐化”的AI交易大战,实则是智能边界的深度实验,当算法投入真实市场,语言模型的“聪明”不再是唯一决胜因素。
当AI开始在无标准答案的世界试错,人类首次有机会观察人工智能如何在风险中学习、在波动中成长。此次实验仅是开端,借贷、投资、财富管理等所有金融行为皆可用AI重构,股市、房市、汇市、债市的智能体将相继登陆华尔街舞台。考验投资机构胆识的时刻已至,谁敢确信自己获得的不是GPT?
或许,这才是真正的“通用智能”试炼场——最佳裁判,正是市场本身。
本文由主机测评网于2026-01-14发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260117737.html