当前位置:首页 > 科技资讯 > 正文

AI在国际天文奥赛中夺金,挑战人类智慧极限

国际奥赛再传捷报,AI在IOAA中大放异彩!GPT-5和Gemini 2.5 Pro以卓越表现,在国际天文与天体物理奥赛(IOAA)中力压群雄,理论和数据分析测试双双夺冠。

继IMO、IOI之后,AI再次在奥赛中摘得桂冠,展现了非凡的智能实力。

在国际天文与天体物理奥林匹克竞赛中,GPT-5和Gemini 2.5 Pro的表现令人瞩目,达到了金牌水准!

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第1张

在理论考试中,Gemini 2.5 Pro总体得分85.6%,GPT-5则以84.2%紧随其后;数据分析考试中,GPT-5以88.5%位居榜首,Gemini 2.5 Pro亦有75.7%的佳绩。

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第2张

在IOAA 2025上,AI的表现令人惊叹,其水平竟高达人类金牌得主的2.7倍!我们正见证着AI的飞速发展——今日的奥赛,明日的科学,AI正引领着各学科的前进方向。

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第3张

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第4张

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第5张

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第6张

AI再夺IOAA金牌,创造历史奇迹!

国际天文与天体物理奥林匹克竞赛(IOAA),由国际天文学联合会主办的全球性青少年天文赛事,是科学奥林匹克竞赛的重要组成部分,也是全球天文科学领域最具影响力的赛事之一。

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第7张

竞赛涵盖理论测试、实测数据分析、天文观测三大核心环节,并设置团队协作项目以促进国际交流。

这些竞赛试题极为严苛,通常只有全球最顶尖的学生才能解答。它们要求深厚的概念理解能力、冗长的公式推导,以及需耗时数小时才能完成的天体物理学难题。

如今,人工智能不仅能通过考试,更在全球顶尖人类参赛者中名列前茅。GPT-5平均得分85.6%,Gemini 2.5 Pro获得84.2%——两者均达到金牌标准。

我们已正式进入AI能与物理学和天文学领域最聪颖的年轻头脑抗衡的时代。

五大LLM激烈比拼,几乎全线摘金

最新研究由俄亥俄州立大学团队完成,重点考察了五大顶尖LLM在天文和物理学方面的实力。

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第8张

论文地址:https://arxiv.org/pdf/251...

研究团队选取了最近四届IOAA理论考试(2022-2025)进行考察。选择IOAA的原因有三:

  • 现有的基准如AstroMLab、AstroBench等仅通过选择、简答和判断题考察LLM的天文学知识;
  • IOAA题目全面涵盖宇宙学、球面三角学等广泛主题;
  • IOAA将理论物理、观测约束和真实天文数据结合,为评估LLM的科学问题解决能力提供独特视角。

AI在国际天文奥赛中夺金,挑战人类智慧极限 AI IOAA 大语言模型 天文学竞赛 第9张