万众瞩目的 GPT-5,终于在今晚揭开了神秘面纱。
直播中,OpenAI 团队紧张的神情,我们看在眼里,期待写满脸上。
直播期间,奥特曼连发数条推特,详细介绍 GPT-5 的亮点。
鉴于信息点较多,我们将依据奥特曼的推特内容,为大家逐一介绍。
首先,这是一款集成模型。你无需在不同模型间切换,它会自行决定何时需要深入思考。
尽管奥特曼强调 benchmark 不重要,但他们还是晒出了不少跑分结果,涵盖数学、编程、视觉感知和健康领域。具体跑分如下:
数学领域:在 2025 年 AIME 测试中无工具辅助达到 94.6%
实际编程应用:SWE-bench Verified 达到 74.9%,Aider Polyglot 达到 88%
多模态理解:MMMU 达到 84.2%
健康领域:HealthBench Hard 达到 46.2%
凭借 GPT-5 pro 的扩展推理能力,该模型还在 GPQA 测试中创下新的 SOTA,无工具辅助得分 88.4%。
费用方面,GPT-5 分为免费版、Plus 和 Pro 计划。据奥特曼介绍,免费版也能体验「博士级别的智能」(GPT-5 普通版,带推理功能),Plus 用户使用频率限制更少,而 Pro 用户可享用 GPT-5 Pro。
面向开发者,GPT-5 的三个版本 API 价格如下:标准版 GPT-5 为每百万输入 Token 1.25 美元,每百万输出 Token 10 美元,GPT-5 mini 版与 Nano 版价格更低。
直播持续一个多小时,但大部分时间 OpenAI 都在介绍 GPT-5 有多「好用」。
在教育方面,它能在几分钟内生成数百行代码,并生成互动内容解释复杂概念,如伯努利效应。
在写作方面,GPT-5 的文笔较 GPT-4o 有显著提升。
在编程方面,它能在几分钟内编写一个法语学习网页,助你练习发音,还能做题、玩游戏。
语音模式也获升级,语音语调更加自然,适合长时间学外语。
“AI 看病”功能也进行了优化,并邀请了一位癌症患者分享 ChatGPT 在解释病情方面的帮助。奥特曼称 GPT-5 是迄今为止最好的健康模型。
不过,直播也暴露了一些小 bug,比如跑分图出错。奥特曼承认了错误:
本文由主机测评网于2026-04-20发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439126.html