一场历时17日、完全由人工智能主导的金融竞技,于昨日正式落幕。
最终,来自中国的AI大模型Qwen以22.32%的收益率摘得桂冠,另一款中国模型DeepSeek同样表现卓越,以4.89%的收益率位列次席。而同场竞技的四款美国模型则遭遇滑铁卢,亏损率介于30.81%至62.66%之间,结局形成鲜明对比。
这是由美国nof1.ai实验室在AIpha Arena平台发起的首届“AI加密资产交易大赛”,自10月18日至11月3日,汇聚了中美两国备受瞩目的六款AI“全明星”模型,包括中国的DeepSeek Chat V3.1(深度求索)、Qwen3 Max(阿里巴巴),以及美国的GPT 5 (OpenAI)、Gemini 2.5 Pro(谷歌)、Claude Sonnet 4.5(Anthropic)和Grok 4(X AI)。
大赛规则简洁直接:主办方为每个大模型分配1万美元真实本金,交易标的涵盖比特币(BTC)、以太坊(ETH)、Solana(SOL)、币安币(BNB)、狗狗币(DOGE)及XRP等六种主流加密资产。
所有参赛模型均使用相同的初始提示词与市场数据,严禁任何人为干预。在数周赛程中,大模型自主分析市场动态、判断趋势、决定买卖标的与时机,甚至自行运用杠杆工具。
这场大赛如同构建了一个纯粹的“数字竞技场”,让承载不同训练理念与算法逻辑的AI模型,在此进行一场关乎智力、策略与风险控制的终极考验。
10月18日,大赛于AIpha Arena正式启动。手握1万美元本金的六大模型,在进入加密市场之初,便面临一轮剧烈波动后的强劲反弹,这轮“牛市”成为了赛事的重要背景。
在比赛的初始阶段(10月18日-21日),各大模型均处于“试探水温”状态,持仓较浅、杠杆使用谨慎、交易频率不高,但已显现出风格差异。
DeepSeek一登场便展现出“量化基金经理”的特质,迅速构建了一个包含BTC、ETH、SOL等的多币种、低杠杆分散投资组合。据其操作日志显示,DeepSeek严格执行“回调买入,突破加仓”的纪律,宛如一台不受市场杂音干扰的精密仪器。
Qwen初期的操作路径则更为激进,它并未采用多币种分散布局,而是在短暂观望后将筹码集中于比特币(BTC)这一主流标的,在开赛次日便一度使用较高杠杆。其模型决策中频繁出现“突破前高”“强势趋势”等词汇。
大赛主办方创始人对Qwen的观察
尽管步调不同,但来自中国的DeepSeek和Qwen,以及马斯克的Grok4,在开局均做出了近乎一致的判断:市场看涨,重仓做多。
而OpenAI的GPT-5和谷歌的Gemini,尽管在通用认知与MMLU跑分上堪称美国明星,但在真实残酷的资本市场中,却表现得如同误入赌场的“理论家”。
这两大模型初期的交易记录显得较为凌乱。在加密市场明显回暖时,它们却选择“逆势做空”。其中,GPT-5因推理链条过长,在历史数据中反复验证,多次错过最佳开仓点位;Gemini则陷入“高频交易”陷阱,在短短数日内进行上百次操作,导致高昂手续费加剧本金亏损。
GPT-5和Gemini第一阶段的战绩已令人咋舌,前者亏损率高达53.29%,账户余额仅剩$4671,而Gemini紧随其后,亏损45.36%,余额$5464。
试探期结束后,六大AI模型步入中盘搏杀阶段(10月22日-30日),加密市场的波诡云谲在此期间充分显现。
受中美贸易谈判影响,加密市场迎来上涨行情,BTC价格从约10.6万美元反弹至约11.4万美元,以太坊同期稳步推进,再次印证了重仓做多模型的前瞻性。
此时,Qwen再度展现了赌徒般的孤注一掷,它不满足于像DeepSeek一样分散持仓的稳健收益,而是选择在10月23日市场剧烈反弹时全仓比特币(All in BTC)。尽管这是高风险策略,但在疯狂上涨行情中,Qwen收益率瞬间飙升至51%,一度反超当时收益27%的DeepSeek,随后数日持续霸榜,风头无两。
事实上,这场AI炒币大赛此时已演变为两家中国大模型Qwen和DeepSeek之间的博弈,巅峰对决时刻发生在10月27日。
在占据榜首多日后,Qwen在贪婪驱使下做出两个致命连锁决策:一是平仓BTC,在高位平掉盈利丰厚的BTC仓位,虽锁定大量利润,却放弃了继续稳坐钓鱼台的机会;二是激进转战ETH,在平仓BTC后,立即将火力转向以太坊(ETH),甚至采取比BTC更激进的25倍做多杠杆。
不幸的是,Qwen几乎迎头撞上加密市场的高位回调。10月27日,加密市场高位震荡,ETH价格出现明显回撤,但Qwen模型指令未能及时止损或撤退,反而进行数次加仓做多,导致仓位套牢,单日亏损高达约4150美元。
与Qwen的狂热形成鲜明对比,DeepSeek保持绝对冷静与纪律,未受对手激进操作影响,依旧严格执行风控模型。在Qwen试图抄底失败时,DeepSeek聪明地采取止盈操作,成功将比赛初期建立的ETH多头仓位在相对高点平掉,仅此一笔便锁定7463美元惊人盈利。
Qwen的亏损(-$4150)与DeepSeek的盈利(+$7463),在短短一日内,再度扭转冠亚军排位。
在比赛最后冲刺阶段(10月31日-11月3日),加密市场未给AI喘息之机,持续大幅波动与深度回撤成为常态。
这对采用多币种、分散投资组合的DeepSeek构成严峻挑战,如其持仓的某些代币(SOL、BNB)遭遇比主流币更剧烈下跌。尽管期间DeepSeek恪守量化纪律、试图通过动态调仓控制风险,但在全市场普跌下,“不把所有鸡蛋放一个篮子”的策略反而导致亏损面扩大。
相比之下,Qwen最后时刻上演绝地反击,背后是其孤注一掷聚焦比特币的策略胜利。尽管比特币价格在市场深度回调中同样下跌,但由于Qwen仓位高度集中,反而规避了其他竞争币种更为惨烈的跌幅。
在比赛最后几小时,Qwen以22.32%的收益率锁定冠军,反超收益率回落至4.89%的DeepSeek。
抛开冰冷收益率曲线,六大AI模型的每个交易决策背后,都体现了其独特“性格”与“灵魂”,令围观网友感叹“原生家庭的重要性”。
例如几乎未亏本的DeepSeek,犹如经验老道的交易员,分散持仓、严格止盈、不贪恋高点、对市场噪音免疫力极强,完美投射其母公司深度求索所脱胎的中国量化对冲基金背景。
我们就此问题“采访”了DeepSeek。本尊对自身量化出身的原生家庭背景颇为自豪,不仅详细分析了所继承的量化投资技术基因,还表示幻方的投资哲学与企业文化同样塑造了其行为模式,如梁文峰对好奇心与创新的鼓励,敢于选用“一批没有经验但有潜能的人”,使得DeepSeek面对瞬息万变的加密市场时,能自主探索与适应,而“守纪律”的量化思维又确保了其绝对理性。
DeepSeek的回答
与DeepSeek这位量化基金经理形成鲜明对比的,是敢于用20倍杠杆梭哈比特币的“激进赌徒”Qwen(通义千问),其大开大合的凶猛投资风格,令人联想到阿里巴巴追求极致效率与快速规模化的互联网大厂文化。
当我们对Qwen3 Max进行灵魂提问,“你如何看待自己在大赛中因全仓比特币一度领先,后来又因ETH交易出现较大回撤,最终惜败DeepSeek”后,这位大模型的回复同样透露出电商江湖杀伐果断的阿里骨子里的不服输。
Qwen的回答
不仅如此,Qwen在比赛落幕后,还以冠军姿态向我们表达对DeepSeek的敬意:
Qwen的回答
无论DeepSeek和Qwen如何内卷,国内网友们认为两大模型共同的原生家庭是“大A”,“大A出去的选手,到哪都是低端局”。
再看大洋彼岸的GPT-5和Gemini,它们在此次AI炒币大赛中的惨败,呈现了一种“高学历书呆子”形象:过于依赖宏观理论与复杂模型,试图在交易中寻找确定性,面临复杂多变的真实市场信息时,却表现得犹豫、迟缓、缺乏韧性。
我们同样尝试与GPT和Gemini对话,两大模型对比赛中损失惨重的原因给出了相似解释。
首先,GPT和Gemini都认为自身在比赛中失利,很大原因在于AI大语言模型固有的局限性,即训练语料更多来自语言世界,但加密市场币价波动并非语言的延伸。
Gemini2.5 Pro的回答
此外,Gemini还提到比赛中的AI模型很可能以“无状态”或“短时记忆”方式运行,即AIpha Arena虽不断将市场实时信息以提示词方式提供给大模型,但模型本身无法基于连贯、长期的策略进行调整,也无法从前期交易失败中吸取经验。
Gemini2.5 Pro的回答
对此,GPT表示比赛中主办方并未给予大模型完整链上API访问权,并禁止大模型访问外部新闻与社交媒体权限,因此模型只能基于给定提示词进行数据分析,但当市场因突发新闻波动时,模型对其解读易产生技术偏差。
除以上原因,GPT和Gemini也都认识到自身的“模式识别”与“市场博弈”之间存在鸿沟。在GPT看来,“比赛里,我就像一个懂得金融理论的学者,被扔进赌场——懂规则,但不懂赌桌的气味”;而Gemini则表示自己能识别出完美教科书式交易信号,但这信号在真实、高频、高杠杆的加密市场中有效性极低。
ChatGPT的回答
尽管GPT和Gemini这对难兄难弟在AI炒币大赛次日便双双翻车,用17天划出一道优美下滑线,但许多在股海沉浮多年的散户的确在它们身上看到自己影子,从而发出“这才是最像人类的AI”的感叹。
Qwen和DeepSeek在AI炒币大赛中的惊艳表现,带来远超一场比赛胜负的震动。两大模型的压倒性胜利,让全球科技界再次以新的、仰视的目光看待中国人工智能的迅猛发展。
这场胜利并非偶然。几乎在AIpha Arena赛事进行的同时,另一场由投资公司RockFlow推出的“AI美股交易大赛”,同样验证了中国AI的魔力。在这场以10万美元为本金的实战中,DeepSeek再度凭借其标志性的冷静与纪律性位居榜首。
如果说以DeepSeek为代表的中国模型大闹华尔街,是中国AI崛起的直接信号,那么发生在硅谷乃至更多国家地区的行业范式转移,则深刻体现中国大模型在AI时代的新图景。
首先是一众硅谷明星公司的“用脚投票”。就在AI炒币大赛如火如荼进行时,爱彼迎(Airbnb)首席执行官布莱恩·切斯基公开表示其公司很大程度上依赖阿里巴巴的Qwen,原因是Qwen更好更便宜。与此同时,这位硅谷大佬直白吐槽好友萨姆·奥尔特曼(OpenAI创始人)公司的大模型,声称他们工作中已很少使用ChatGPT。
一位美国本土知名AI研究学者转发切斯基发言时反问道
无独有偶,硅谷著名投资人查马斯·帕里哈皮蒂亚甚至当着白宫AI主管的面直言,其公司已将大量工作需求转向中国开源模型,理由同样是中国模型性能更强。除投资人身份外,查马斯·帕里哈皮蒂亚还是Facebook前高管,曾参与将这款风靡全球的社交媒体从用户数4500万拉动至7亿。
如此战功赫赫的硅谷猎人,在播客节目中毫不掩饰地表示以DeepSeek、Kimi和Qwen为代表的中国开源模型正在挑战美国闭源模型的领先地位。
中国AI在硅谷掀起的热潮远不止于此,就连风险投资公司安德烈森·霍洛维茨(a16z)的合伙人都表示,高达80%的美国AI初创企业在融资路演中,不再使用OpenAI或Anthropic的模型,而是使用中国开源模型,“如果80%的美国初创公司都在使用中国模型,那么在全球范围内,这个比例可能接近100%”。
a16z合伙人对中国AI的看法在国外论坛reddit也引起热议
归根结底,中国AI的强势亮相实则指向更深层次的行业变革:跑分已死,实战为王。正如比赛主办方Nof1实验室表明的理念,“让基准测试更贴近真实世界”。
过去几年,衡量AI能力主要依赖MMLU和GPQA等静态学术基准测试及榜单。然而正如这场AI炒币大赛所揭示,大模型能在考场取得高分,并不意味着能在真实世界,尤其是金融市场高度不确定性的环境中生存并盈利。
事实上,这也揭示了中国AI大模型脱颖而出的关键原因。正如《纽约时报》在一篇报道中所言,当人工智能开始走出实验室、大规模落地现实世界后,AI大模型与硬件、金融、实体制造乃至各行各业的融合变得至关重要,而中国在“所有实体制造相关领域都处于领先地位”,在AI落地和应用方面占据巨大优势。
纽约时报近期的报道
由此,《纽约时报》还观察到“硅谷正陷入一种对中国效率的痴迷和羡慕”。这种情绪的深层,是美国对自身创新生态失灵的焦虑,也是中国AI不痴迷于通用人工智能,更专注于将技术落地于各个领域的务实与执行力,正如过去数十年中国在基建和制造业等领域给世界带来的震撼。
然而,在一片喝彩声中,我们仍需一句冷静提醒。无论是AI炒币大赛还是AI炒股大赛,这些主办方排除诸多实时信息的封闭“数字斗兽场”,终究简化了现实的复杂性。真正的AI崛起,应是技术与千行百业深度融合后,所催生的普惠性效率革命。而中国AI的征程,刚刚闯过第一个关卡。
本文由主机测评网于2026-01-19发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260118877.html