在人工智能图像生成领域,OpenAI与谷歌这两大科技巨头的竞争再度升温,新一轮的攻防战已然打响。
本周三北京时间凌晨,OpenAI发布了新版ChatGPT图像功能。除了图像生成质量更高、速度更快之外,新版Images模型在图像编辑的精准度方面也实现了重大突破。此举不仅是对谷歌备受好评的Nano Banana系列模型的直接回应,同时也对传统图像编辑软件如Photoshop构成了挑战。
OpenAI表示,基于最新旗舰图像生成模型的“ChatGPT图像”功能,能够在保持图像细节完整性的同时实现精准编辑,更符合用户的预期效果。此外,这一功能的图像生成速度也提升了最多4倍。
当然,要展示图像生成模型的实力,最直观的方式还是通过实际图像。
此次升级的核心亮点在于,OpenAI指出新模型支持多种精确编辑操作,如添加、删除、合并、混合和转置,能够在实现修图效果的同时保留原图的独特特征。
例如,以下是由ChatGPT新图像模型生成的90年代末洛杉矶街头风格的摄影作品(演示版)。
→将画面中人物的衬衫改为红色,帽子变为黄色,限速标志调整为15,并将卡车替换为消防车;
→在左侧添加一群围观者,右侧人行道上栖息着一只鹰,远处的天空中有一艘飞艇缓缓驶过;
→将该图像的全幅印花图案制作成T恤,挂在晾衣绳上展示;
→将这件T恤穿在滑板少年身上。
作为AI图像生成的重要应用场景,ChatGPT图像在创意性图片改造方面也取得了进展。例如,可以将公司CEO奥尔特曼的个人照片转化为80年代美国健美操教练的形象,或者将其面部融合到世界名画《戴珍珠耳环的少女》中。
此外,ChatGPT还向谷歌的传统强项——生成包含丰富文字信息的示意图——发起了冲击。OpenAI表示,新模型在文字呈现方面更进一步,能够处理更加密集和小型化的文字。
需要指出的是,尽管ChatGPT在生成英文字体方面已经可以达到以假乱真的程度,但官方也承认,该模型在处理中文、阿拉伯语、希伯来语等文字时仍存在一定的局限性。
因此,至少在中文文字图像生成领域,Nano Banana依然遥遥领先于ChatGPT。
值得一提的是,新图像生成模型不仅功能更强大,而且使用成本也更低。与GPT Image 1相比,升级后的GPT Image 1.5在图像输入和输出方面的成本均降低了20%。
本文由主机测评网于2026-03-07发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260329304.html