当前位置:首页 > 科技资讯 > 正文

ChatGPT Images 1.5震撼发布:细节与创意双升级,挑战谷歌Nano Banana Pro

ChatGPT Images 1.5震撼登场,细节与创意双升级,直面谷歌Nano Banana Pro的挑战。

就在谷歌刚宣布要发布Gemini 3.0 Flash之际,OpenAI反手祭出「王炸」,新一代旗舰图像模型ChatGPT Images 1.5正式面世。

ChatGPT Images 1.5震撼发布:细节与创意双升级,挑战谷歌Nano Banana Pro 1.5 谷歌Nano 图像生成 AI竞赛 第1张

这一次,OpenAI将生图能力直接拉满:

精准操控: 指令理解力大幅提升,真正做到「指哪改哪」。

细节狂魔: 画面细节保留完整,质感细腻。

极速生成: 速度较前代提升了整整4倍。

所有ChatGPT免费用户即可体验,开发者也可直接调用GPT Image 1.5 API。

ChatGPT Images 1.5震撼发布:细节与创意双升级,挑战谷歌Nano Banana Pro 1.5 谷歌Nano 图像生成 AI竞赛 第2张

ChatGPT Images 1.5震撼发布:细节与创意双升级,挑战谷歌Nano Banana Pro 1.5 谷歌Nano 图像生成 AI竞赛 第3张

在LMArena竞技场上,它似乎不可战胜:

文生图:以1264 Elo分登顶榜首,力压谷歌Nano Banana Pro(NBP)。

图像编辑:chatgpt-image-latest以3分优势险胜NBP夺冠,GPT Image 1.5紧随其后位列第4。

然而,反转来得太快。网友实测后发现,这似乎又是一个「高分低能」的典型。

在Yuchen Jin的对比中,GPT的生图能力基本达到谷歌NBP水平,但智商却惨遭碾压。

ChatGPT Images 1.5震撼发布:细节与创意双升级,挑战谷歌Nano Banana Pro 1.5 谷歌Nano 图像生成 AI竞赛 第4张

ChatGPT Images 1.5震撼发布:细节与创意双升级,挑战谷歌Nano Banana Pro 1.5 谷歌Nano 图像生成 AI竞赛 第5张

这一落差引发了社区的激烈吐槽。有人直言不讳:「谷歌Nano Banana Pro依然是王者。」更有人痛批:「这可能是OpenAI又一次令人尴尬、且毫无意义的发布。」

GPT Image 1.5登场,史诗级进化

根据官方博客介绍,现在让ChatGPT修图,明显比之前更听话了——哪怕是细枝末节,只改让改的地方,同时确保光线、构图和人物样貌等元素在输入、输出和后续编辑中保持一致。

ChatGPT Images 1.5震撼发布:细节与创意双升级,挑战谷歌Nano Banana Pro 1.5 谷歌Nano 图像生成 AI竞赛 第6张

这样一来,即可得到真正符合意图的结果。不论是有用的照片编辑、服装发型试穿试戴,还是保留原图精髓的风格滤镜和概念转换,ChatGPT皆可搞定。

指哪改哪,多轮P图

GPT Image 1.5擅长各种「手术」,包括添加、删减、组合、融合和置换。因此,在想要改变图片的同时,它还能不丢失图片原本的「味道」。

创造力爆表,拿捏细节

编辑是基础,GPT Image 1.5创造力在「大变身」时尤为耀眼。它可以通过改变和添加元素——比如文字和排版——让想法落地,同时保留重要细节。

更听人话,6x6网格完美还原

跟初版GPT Image相比,1.5版本听指挥的能力更强了。这使得更精准的编辑以及更复杂的原创构图成为可能,元素之间的关系也能按照预期保留下来。

文本清晰渲染,直出编程

在文字渲染上,新模型又进了一步,能处理更密集、字号更小的文本。

更多提升

在其他维度上,新模型也多有改进,让输出变得更直接可用。比如它能画好很多的人脸,而且看起来更自然。

百尺竿头,更进一步

虽然此版本代表了有意义的进步,但在未来的迭代中仍有很大的改进空间。比如日漫风展示海洋不同深度的生物剖面图,新版虽然细节更多,但风格明显不如旧版更符合「日漫风」。

API:便宜了20%

与GPT Image 1相比,GPT Image 1.5的图像输入和输出价格现在便宜了20%,因此你可以用同样的预算生成和迭代更多图像。