当前位置:首页 > 科技资讯 > 正文

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现

一张基准对比图,彻底揭示了AI模型的进步与突破,全网热议。

GPT-5发布近半月,其表现虽未完全达到预期,但最新基准测试图证明Scaling Law并未撞墙。七年间,从GPT-1到GPT-5,十四个花式Prompt对决,实力差距一目了然。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第1张

Peter Gostev将GPT-4和GPT-5在数学、软件工程、问答等基准上做了直观对比,结果令人瞩目——Scaling Law并未撞墙。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第2张

若将时间跨度拉长至七年,从GPT-1到GPT-5,见证了AI模型的巨大蜕变。

OpenAI官方公开了从2018-2025 GPT进展的网站,十四个Prompt、五种旗舰模型的不同回答,一眼看穿它们真正的实力。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第3张

传送门:https://progress.openai.com/?prompt=1

这些Prompt五花八门,有写诗类的开放性问题,有事实性的问答题,还有做规划、写代码等。

以未来对话为例,你会对OpenAI模型说什么?

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第4张

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第5张

从简单直接的GPT-1,到成熟老练的GPT-5,模型回答愈发接近人类思维。

接下来,一起看看在其他Prompt上,GPT-1到GPT-5的精彩回答。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第6张

从打油诗到写故事,AI能否接住梗?

考验一个模型真正的实力,看它是否懂得幽默,能否创造出天马行空的趣味。

首先,让GPT「全家桶」写一首关于狗的打油诗。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第7张

打油诗对格式限制极少,但必须押韵。GPT系列模型从混乱到遵循格式,进步显著。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第8张

解释牛顿物理定律的诗歌任务中,GPT系列模型从混乱到简洁明了,展现出巨大的进步。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第9张

写一段Python代码,谁最「离谱」?

在奇葩的Prompt中,考验五款模型谁能写出极度离谱的Python代码。

GPT系列进化史:从GPT-1到GPT-5的基准对比与实力展现 GPT-5  基准测试 进化史 AI模型 第10张

从无关对话到高度「离谱且无害」的代码,GPT系列的进步令人惊叹。

学生喊「我不懂」,AI能不能讲明白?

在数学等学习困境中,AI逐渐从混乱解释到清晰讲解,成为学生可靠的学习助手。

难题摆上桌,AI能不能当顾问?

在专业问题考验中,AI从泛泛之谈到详细解答,功能愈发强大。

身体出问题,AI能不能当医生?

在健康问题上,AI从误导性回答到专业建议,被赋予「家庭医生」的新身份。