当前位置:首页 > 科技资讯 > 正文

OpenAI争金疑云:自嗨还是真材实料?

OpenAI在夺金路上备受质疑,高调姿态引热议!据组委会透露,OpenAI不仅未与IMO官方携手,甚至无视赛事规矩,于闭幕派对尚在进行时便急不可耐地官宣。

OpenAI的IMO金牌之旅,又掀波澜。

日前,因内部审核流程之故而,谷歌DeepMind研究员在评论区,暗指OpenAI提前发布测试结果。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第1张

真相揭晓,事情远比想象中复杂。

据一位IMO内部人士透露,实际上OpenAI并未与组委会携手,其AI金牌的真实有效性存疑。

最关键的是,他们违反了IMO规定的「公布时间」规则。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第2张

为避免AI公司抢尽人类学生的风头,IMO评审团明确要求:闭幕式结束一周后再公布结果。

然而,OpenAI却在闭幕Party尚在进行时,便发布了这一结果。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第3张

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第4张

对此,谷歌DeepMind负责人Thang Luong表态,「的确,IMO组委会握有一份不对外公开的官方评分标准」。

若未遵循此标准进行评估,任何奖牌声明均视为无效。

扣分后应为银牌,而非金牌。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第5张

如此看来,OpenAI所宣称的IMO金牌,是否只是自嗨?

OpenAI真面目被揭开,抢尽学生风头

就在昨日,菲尔兹奖得主陶哲轩在连发三条评论中,暗指OpenAI。

他表示,「我不会对未预先公开测试方法的AI竞赛成绩报告发表评论。在缺乏受控测试环境的情况下,AI的数学能力难以精准评估」。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第6张

另外,据IMO组委会成员Joseph Myers透露,OpenAI并非IMO合作测试模型的AI公司之一。

而且,阳光海岸的91位协调员也无人参与结果评估。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第7张

P6题协调员表示,「IMO评审团和协调员一致认为,OpenAI此举显得失当且不合时宜」。

根据IMO规定,利用AI模型参赛的公司需在7月28日后公布结果。

一家专注于数学AI的初创公司Harmonic也侧面证实了这一规定的准确性。

最新回应引发热议

OpenAI研究科学家、德扑之父Noam Brown亲自回应,提供了两点证据:

首先,团队是在闭幕式「之后」公开的结果。闭幕式有直播记录,此点易于核实。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第8张

其次,他确认OpenAI并未与IMO协调,仅于发帖前告知了一位组织者。出于对学生们的尊重,他们要求OpenAI待闭幕式结束后再发布——「我们照做了」。

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第9张

OpenAI争金疑云:自嗨还是真材实料? OpenAI IMO金牌 争议 数学AI 第10张

从时间线来看,确实是OpenAI在IMO闭幕式结束七分钟后才发布了公告。

即便如此,网友们仍对OpenAI的炒作行为感到不满,且未给获奖学生留有余地。

UCLA数学教授见解:LLM短期内难替人类

针对LLM夺得IMO金牌一事,UCLA应用数学教授Ernest Ryu发表了自己的看法:

  • OpenAI在IMO P1-P5的解答上表现准确。
  • 第6题新颖且难度更高,需创造性思维。

免费服务器服务器教程性价比服务器