谁能想到,在谷歌举办的Kaggle AI Chess比赛中,Grok 4竟然在半决赛中击败了实力强劲的Gemini 2.5 Pro,强势晋级总决赛!
在昨日赛事中,Gemini 2.5 Pro、o4-mini、Grok 4和o3均以4-0的战绩,分别击败了各自的对手,晋级半决赛。而今天的比赛更是让人大跌眼镜,Gemini 2.5 Pro竟然败给了Grok 4。
马斯克昨天还在点评比赛结果时表示,国际象棋对Grok来说只是“小菜一碟”,他们并没有在象棋优化上花太多功夫。如今Grok 4闯入总决赛,不知马斯克是否更加轻视这场比赛了。
我们回到这场半决赛。战况是Grok 4和o3分别战胜了Gemini 2.5 Pro和o4-mini,成功晋级决赛。虽然o3的胜利在意料之中,但Grok与Gemini之间的激烈对决却让人大跌眼镜——双方在常规赛打成2:2平,最终通过加赛才分出胜负。
明天是比赛的最后一天,将迎来AI国际象棋巅峰对决的冠军之战,由X对战OpenAI。
在初赛中,o4-mini和o3均以全胜战绩淘汰了DeepSeek-R1和Kimi k2。这两款同样出身OpenAI的模型在半决赛中正面交锋。比赛结果几乎在预料之中,o3以4比0横扫o4-mini,顺利晋级决赛。
在这场比赛中,o3展现了卓越的稳定性与复杂推理能力,而o4-mini则是一款轻量级模型,旨在在速度、成本与性能之间实现平衡。因此,o4-mini输给o3也符合预期。
谷歌举办这场比赛的目的在于分析AI模型的思考方式。整场对局中的第二盘可能对谷歌来说意义不大,但对普通棋手而言却相当值得关注。在这一盘中,o3仅用12步就完成了致胜攻击,手法颇有Puzzle Rush风格。
尽管AI在国际象棋上的表现一直不尽如人意,但o3在这盘棋中拿下了完美的100分准确率评分。
整场比赛的剩余部分大体延续了锦标赛至今的老套路:某个弱AI(这次是o4-mini)在某个时间点开始失去局势控制,连续出现致命失误,最终输掉对局。不过有一盘棋例外——它可能是本届比赛中看起来最自然流畅的一局。
其中,o3的两个中间招法(in-between moves)尤其令人印象深刻。这些精彩的对局不仅展示了AI的强大潜力,也为观众带来了极大的观赏乐趣。
Grok在国际象棋领域的统治力依然强势,但这次的胜利之路并不平坦。准确来说,马斯克轻描淡写的“国际象棋是副作用”的Grok差一点就翻车了,最终仅以和棋收场勉强取胜。
虽然最终比赛结果是Gemini 2.5 Pro以2-3不敌Grok 4,但在官方博客中,比分仍被标注为2.5 - 2.5平局。
比赛一直打到特殊的末日加赛(armageddon tiebreak)才决出胜负。最终,Grok执黑在一盘55步的和棋中晋级——尽管当时Grok明显处于胜势。
接下来的两盘棋又是决定性的比赛,延续了本届锦标赛的熟悉剧本:AI们先走几步开局定式,然后靠着机械式的创造力迅速开始出错。Grok赢下了第三盘,暂时领先比分,但随后Gemini反击成功,在第四盘将比分扳平。
比赛进入末日加赛,Grok执黑出战,拥有和棋即胜的优势(尽管本场比赛并没有时间限制)。这场加赛堪称精彩纷呈。Gemini在大部分时间里局势占优,甚至一度错过了一个“一招将死”的机会——这个将死模式与o3在第二盘战胜o4-mini时用的几乎一模一样。
正当观众紧张关注局势时,国际象棋特级大师Peter Heine Nielsen(现任Magnus Carlsen的教练)也借机向Grok提供了辅导建议。最终,Gemini在胜势的车兵残局中失误白送皇后,将胜利拱手让给Grok。
然而剧情并未就此结束:由于Grok在多一车对单兵的必胜局面下未能兑现优势,双方三次重复局面,对局戏剧性地以和棋收场。尽管结局出人意料,这场比赛仍被评选为今日最佳对局。
接下来X的Grok和OpenAI的o3将在明天的决赛中相遇。谷歌的Gemini 2.5 Pro和o4-mini将争夺季军和第四名。
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439067.html