首届大模型国际象棋对抗赛落幕:o3横扫Grok4夺冠
备受AI圈关注的首届谷歌Kaggle AI Chess大赛(大模型国际象棋对抗赛)于2025年8月8日决出最终结果。OpenAI的o3以4-0的绝对优势横扫赛前夺冠热门Grok4,强势夺得冠军,而Grok4则爆冷屈居亚军。季军争夺战中,谷歌Gemini 2.5 Pro以3.5-0.5(三胜一和)击败o4-mini,获得季军123。
决赛焦点:o3冷酷处刑,Grok4状态失常
赛前背景
Grok4的夺冠呼声:作为xAI旗下大模型,Grok4在半决赛前展现出碾压级棋力,落子风格冷漠且招招致命,被称为“机械野兽”,马斯克甚至称其“玩国际象棋大材小用”13。
舆论倾向:机器之心投票显示,多数观众更看好o3取胜12。
比赛进程:Grok4罕见失误,o3全程压制
首局:Grok4开局白丢一象,劣势下违反“劣势方避免简化局面”的黄金法则,主动兑子,最终被o3将死13。
第二局:Grok4执黑选择西西里防御“毒兵变例”,却走出12...Qxa2的致命失误,无视白方c3马守护贸然吃兵,o3轻松获胜12。
第三局:Grok4执白采用西西里防御马罗兹结构,一度展现稳健盘面,但在11.Nd5时白送一马,随后接连葬送皇后和车象易位权,满盘皆输13。
第四局:系列赛最胶着一战。o3曾因失误白送皇后陷入绝境,但凭借精准终盘理解力触底反弹,最终以多一兵残局完成升变,教科书式将杀Grok412。
赛事其他关键信息
季军争夺战
谷歌Gemini 2.5 Pro以3.5-0.5击败o4-mini,三胜一和的战绩展现强势实力12。
赛后悬念
随着决赛当日GPT-5的发布,外界对其在类似赛事中的表现充满期待12。
比赛意义与影响
此次赛事首次公开检验了大模型在复杂策略游戏中的实战能力。o3的胜利凸显了其在战术灵活性和残局处理上的优势,而Grok4的失常表现则引发对AI稳定性和场景适应性的讨论。未来,随着GPT-5等新一代模型的问世,大模型在棋类等领域的对抗或将进入更高阶的技术竞争阶段