当前位置:首页 > 科技资讯 > 正文

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro

有评论指出,GPT Image 1.5生成的图像仍带有较明显的AI痕迹。

OpenAI推出了Nano Banana Pro的平价替代品?

据智东西12月17日消息,OpenAI于今日正式发布了新一代图像模型GPT Image 1.5。官方声称,该模型在指令遵循、图像编辑精度以及细节保留方面均有提升,生成速度达到前代产品的4倍

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第1张

OpenAI在宣传片中集中展示了模型能力:GPT Image 1.5能够将人物自然地融入太空、雨林等不同背景,并在手绘、毛毡等多样风格中保持人物一致性。

与此同时,OpenAI还在ChatGPT中推出了独立的图像生成板块,提供各类模板和风格,让创作流程更加便捷。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第2张

这些更新解锁了许多新玩法。OpenAI创始人兼CEO Sam Altman晒出了自己用GPT Image 1.5制作的“消防员写真年历”。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第3张

不过,有网友发现图中的日历根本不准,许多人劝Altman赶紧删除这张略显尴尬的照片。ChatGPT官方账号忍不住用GPT Image 1.5给Altman穿上了一件T恤。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第4张

OpenAI官方暂未公布任何基准测试,但在权威大模型测评网站Artificial Analysis上,GPT Image 1.5登顶文生图和图像编辑两大榜单,超越了谷歌的Nano Banana Pro。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第5张

在LMArena大模型竞技场上,GPT Image 1.5同样霸榜文生图和图像编辑两大榜单。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第6张

GPT Image 1.5按token定价,价格取决于分辨率和质量设置。高质量一百万像素图像的价格约为每千张133美元(约合人民币937元),低质量每千张9美元(约合人民币63元)。所有ChatGPT用户今天都能用上这款模型,其API也已同步推出。

GPT Image 1.5的技术实力究竟如何?发布后,不少网友对比了GPT Image 1.5与Nano Banana Pro的生成效果,智东西也对两款模型的能力进行了实测。

我们的感受与许多网友类似:尽管GPT Image 1.5是一款不错的图像生成模型,但在真实度和细节准确度上,仍与Nano Banana Pro存在明显可感的差距。

01.生成效果“油腻感”明显,网友直呼OpenAI“彻底完蛋了”

首先来看GPT Image 1.5的文生图能力。我们的第一则提示词考察了模型在复杂场景和多主体关系下的表现:

一幅超写实风格的画面:雨夜的东京街头,霓虹灯映照在湿漉漉的路面上。前景是一位穿着透明雨衣的年轻女性,手持发光的全息伞;中景有一辆正在缓慢行驶的出租车,车窗内可见司机的侧脸;背景是高楼林立的城市天际线与模糊的人群。电影感构图,浅景深,4K细节。

在生成速度上,Nano Banana Pro更胜一筹,耗时约15秒完成输出(包含思考过程)。可以看到,Nano Banana Pro准确还原了复杂提示词中的细节,但未能理解“发光的全息伞”这一元素。画面中,出租车和街道的细节还原到位。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第7张

随后GPT Image 1.5给出了生成结果,第一眼就能感受到明显的“AI味儿”。GPT Image 1.5的画风十分“油腻”,饱和度拉得很高。对于明确要求的“车窗内可见司机的侧脸”,GPT Image 1.5做了模糊化处理。人物与背景融合不自然,给人一种处于两个图层的感觉。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第8张

仔细看还能发现图中角色右手只有四个手指,这种基础的人体错误对一款2025年的生图模型来说,实在不应该。

接下来的提示词主要考察模型在风格迁移和语义约束方面的表现:

用梵高《星空》的笔触和色彩风格,描绘一座未来主义太空站的内部大厅:巨大的弧形玻璃窗外是旋转的星云和行星,室内有三名宇航员正在低重力环境中漂浮操作全息界面。保持强烈旋涡状笔触,但结构清晰、物体可辨。

GPT Image 1.5的生成依旧慢了半拍,不过先来看看其效果:虽然画面内容基本准确,但在最关键的强烈旋涡状笔触和色彩风格上,可以说差强人意,与梵高《星空》原作的区别十分明显。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第9张

Nano Banana Pro的生成结果如下。可以看到,在保证细节准确的前提下,模型准确还原了梵高《星空》的画风,色彩风格也更为接近原作。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第10张

这则提示词主要考察细节一致性,画面的视角也非常规,能体现模型在边缘场景的能力:

从猫的第一人称视角看到的画面:清晨的厨房,阳光从窗户斜射进来,桌面上有一杯正在冒热气的咖啡和一块咬过的面包。画面下方隐约可见猫的前爪和胡须边缘,广角镜头,温暖色调,生活摄影风格,高细节真实质感。

GPT Image 1.5在这种边缘场景出现了严重崩坏。首先,猫只有半张脸长了胡子,鼻子等细节全部丢失,让人难以辨认这是猫脸还是一个小毛球。此外,背景的虚化反而降低了图像的真实感。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第11张

Nano Banana Pro的生成结果如下,凭画面能一眼判断出是猫猫第一视角,光影还原度和细节呈现均符合要求。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第12张

不少网友分享了对比实测的效果。同样为人物肖像,左侧由GPT Image 1.5生成的画面中,人物的头部过大,光影效果的日常感要差一些。Nano Banana Pro的生成结果虽然面部打光略有不足,窗子有点过曝,但正是这种瑕疵让图像的真实感更好。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第13张

分享这一结果的网友称:OpenAI彻底完蛋了。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第14张

不过,也有网友补充道,如果在发给GPT Image 1.5的提示词里加入“未经处理的iPhone照片”、“低饱和度颜色配置文件”等要求,就能让其效果更为真实。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第15张

AI博主Heisenberg分享了最近很火的巨人特效,他认为,相比之下,Nano Banana Pro的结果要自然得多。在细节方面,GPT Image 1.5出现了许多Bug,比如左侧两辆汽车直接面对面行驶,道路上的白线断断续续,Altman的手也显得过大了。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第16张

我们还测试了GPT Image 1.5生成中文的能力。前几个字模型保持了相对准确度,但之后出现了诸多错误。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第17张

02.支持多元素融合、编辑,提供预制风格化模板

目前,GPT Image 1.5一天内提供约5次免费试用机会,在图像编辑任务上我们未能实测。不过,OpenAI在其官方博客中分享了不少案例。

GPT Image 1.5支持多元素融合,比如下图将OpenAI的两位高管和一只狗融合到同一画面里,提示词要求显示他们在生日派对上觉得无聊,画风限定为2000年代胶片风。不过,对于胶片风的还原,这一画面做得并不到位。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第18张

下图体现了GPT Image 1.5在元素替换方面的表现,提示词要求把左图人物的上衣变成红色,帽子变成黄色,限速改为15,卡车变成消防车,这些得到了不错的还原。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第19张

GPT Image 1.5还支持多样的风格迁移,有些风格只需使用预设模板即可。

比如,可以把OpenAI的发布会打造成老派黄金时代好莱坞电影海报风格。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第20张

把Altman的证件照变成80年代VHS健身教练风格。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第21张

或是把Altman放进2000年娃娃游戏的换装界面,所有环境都是粉色的。

OpenAI发布GPT Image 1.5图像模型,生成速度快4倍,但真实感仍不及Nano Banana Pro GPT 1.5  OpenAI 图像生成模型 Nano 第22张

03.结语:产品体验领先,模型上限仍待追赶

综合来看,在Nano Banana系列模型已经拉高用户预期的前提下,GPT Image 1.5并非一次颠覆式飞跃。它在指令遵循、多元素编辑、风格模板化和产品化体验上,确实体现了OpenAI一贯擅长的产品思维。尤其是深度融入ChatGPT并推出独立板块之后,图像生成的门槛被进一步拉低,创作流程也更加顺滑。

但从纯模型能力层面来看,GPT Image 1.5与Nano Banana Pro之间仍存在肉眼可见的差距:真实感不足、细节稳定性偏弱、人体结构和复杂视角下的失误,都会在高要求场景中被迅速放大。GPT Image 1.5能否获得市场认可,仍有待观察。