当前位置:首页 > 科技资讯 > 正文

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相

在预告刚刚发布之际,GPT-5的内测体验已抢先释出,展现了其前所未有的推理能力。

据网友实测,GPT-5在10道逻辑推理题中仅错一题,准确率超越人类,展现出惊人的智能水平。

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第1张

网友实测结果显示,GPT-5几乎一次答对,最多仅尝试两次,而其他大模型则逊色许多。

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第2张

此结果并非孤例,其他测试者也发现GPT-5在同样测试中表现优异,进一步验证了其卓越的智能。

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第3张

除了卓越的推理能力,获得内测资格的网友还表示,GPT-5在编程、数学及科学问题解决方面同样表现出色。

有关其取代博士的调侃,正是对其强大能力的生动体现。

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第4张

今晚OpenAI的发布会即将揭开GPT-5的神秘面纱,其性能值得期待。

关注焦点:推理与编程能力

目前,GPT-5的推理、编程及解决科学问题等方面的能力最受关注。

推理

编程

解决科学问题

数学

网友@invincibleHunter在Copilot上体验了GPT-5的推理能力。

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第5张

尽管模型未透露具体型号,但结合此前信息,推测应为GPT-5。

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第6张

测试问题多为逻辑题,如:

贝丝在第一分钟开始时将四个完整的冰块放入煎锅中……在第三分钟结束时,锅里会有多少个完整的冰块呢?

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第7张

模型通过思考模式进行推理,但有一题出错:

两个姐妹……应问哪一个问题才能找到宝藏?

A) 如果我问你姐姐哪条路通向宝藏……B) 你姐姐叫什么名字?……C) 寻找宝藏的路径是怎样的?……D)如果你要猜测的话……E) 这宝藏里有什么?F) 你姐姐的电话号码是多少?

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第8张

正确答案应为C,但GPT-5回答A。

尽管有异议认为题目源自公开数据集,但测试者认为GPT-5的回答长且准确,显示其真正思考。

此外,还测试了多模态能力,生成独角兽SVG:

GPT-5震撼发布:超越人类推理,多领域能力惊艳亮相 GPT-5 人工智能 推理能力 多模态 第9张