当前位置:首页 > 科技资讯 > 正文

GPT-Image 1.5:精准编辑,重塑图像生成新纪元

今年上半年,GPT-4o 掀起了一波热潮,让大众见识了 GPU 强大性能,也催生了生图、理解视觉的潮流。然而,下半年真正闪耀的明星却是 Nano Banana。

为了在这场竞赛中重新占据领先地位,OpenAI 推出了最新图像视觉模型 GPT-Image-1.5。这标志着 OpenAI 红色警报计划中的又一重要里程碑。

简要总结:

指令执行更精准

编辑更精确

细节保留更完整

处理速度提升 4 倍

GPT-Image 1.5:精准编辑,重塑图像生成新纪元 1.5 精准编辑 图像生成 AI设计 第1张

告别「抽卡」玄学,编辑细节能力拉满

GPT-Image-1.5 最大的亮点在于「精准编辑」。

以往 AI 改图如同与听不懂人话的托尼老师交流,你只想修剪刘海,它却让你剃了光头。如今,模型终于理解了指令。你改哪里,它就动哪里。

光线、构图、人物特征,在输入、输出和后续编辑的闭环中保持一致性。

来看看官方示例:将两个男性和一只狗合成到一张 2000 年代胶片风格的儿童生日派对照片中,再添加背景中的孩子,改变风格,为所有人换上 OpenAI 毛衣,最后只保留狗。

GPT-Image 1.5:精准编辑,重塑图像生成新纪元 1.5 精准编辑 图像生成 AI设计 第2张

这套操作下来,画面逻辑依然清晰。这表明 GPT-Image-1.5 不再靠「蒙」,而是真正理解了画面结构。

终于不再画「鬼画符」,但中文表现……

相比初版图像模型,GPT-Image-1.5 更擅长执行复杂、细致的指令,并保持各元素之间的预设关系。

官方展示了 6x6 网格图案例,每一行都按指定内容布置得井井有条。

GPT-Image 1.5:精准编辑,重塑图像生成新纪元 1.5 精准编辑 图像生成 AI设计 第3张

把线稿转成真实图片这种操作,现在也成了基本操作。

GPT-Image 1.5:精准编辑,重塑图像生成新纪元 1.5 精准编辑 图像生成 AI设计 第4张

文本渲染能力也大幅提升,能更好处理密集、小字体内容。例如将一段 Markdown 格式的内容呈现为报纸文章布局。

GPT-Image 1.5:精准编辑,重塑图像生成新纪元 1.5 精准编辑 图像生成 AI设计 第5张

虽然中文表现仍有待提升,但生成速度快了 4 倍,降低了试错成本。

你的下一位设计师,何必是人?ChatGPT 申请出战

OpenAI 在 ChatGPT 中专门开辟了一个图像创作入口。

网页和移动端侧边栏都能看到这个新入口,里面塞满了预设滤镜和热门提示词。上传一次肖像,以后张张都是你。

未来还将引入更多视觉元素,优化 ChatGPT 的整体体验。例如在进行搜索查询时,结果将更多包含图片和清晰来源。

GPT-Image 1.5:精准编辑,重塑图像生成新纪元 1.5 精准编辑 图像生成 AI设计 第6张