今年上半年,GPT-4o 掀起了一波热潮,让大众见识了 GPU 强大性能,也催生了生图、理解视觉的潮流。然而,下半年真正闪耀的明星却是 Nano Banana。
为了在这场竞赛中重新占据领先地位,OpenAI 推出了最新图像视觉模型 GPT-Image-1.5。这标志着 OpenAI 红色警报计划中的又一重要里程碑。
简要总结:
指令执行更精准
编辑更精确
细节保留更完整
处理速度提升 4 倍
GPT-Image-1.5 最大的亮点在于「精准编辑」。
以往 AI 改图如同与听不懂人话的托尼老师交流,你只想修剪刘海,它却让你剃了光头。如今,模型终于理解了指令。你改哪里,它就动哪里。
光线、构图、人物特征,在输入、输出和后续编辑的闭环中保持一致性。
来看看官方示例:将两个男性和一只狗合成到一张 2000 年代胶片风格的儿童生日派对照片中,再添加背景中的孩子,改变风格,为所有人换上 OpenAI 毛衣,最后只保留狗。
这套操作下来,画面逻辑依然清晰。这表明 GPT-Image-1.5 不再靠「蒙」,而是真正理解了画面结构。
相比初版图像模型,GPT-Image-1.5 更擅长执行复杂、细致的指令,并保持各元素之间的预设关系。
官方展示了 6x6 网格图案例,每一行都按指定内容布置得井井有条。
把线稿转成真实图片这种操作,现在也成了基本操作。
文本渲染能力也大幅提升,能更好处理密集、小字体内容。例如将一段 Markdown 格式的内容呈现为报纸文章布局。
虽然中文表现仍有待提升,但生成速度快了 4 倍,降低了试错成本。
OpenAI 在 ChatGPT 中专门开辟了一个图像创作入口。
网页和移动端侧边栏都能看到这个新入口,里面塞满了预设滤镜和热门提示词。上传一次肖像,以后张张都是你。
未来还将引入更多视觉元素,优化 ChatGPT 的整体体验。例如在进行搜索查询时,结果将更多包含图片和清晰来源。
本文由主机测评网于2026-05-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546425.html