当前位置:首页 > 科技资讯 > 正文

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型

OpenAI与谷歌在顶尖AI应用领域的竞争,再次进入了新的攻防阶段。

于北京时间周三凌晨,OpenAI正式推出了新一代ChatGPT图像功能。这次更新不仅显著提升了图像生成的质量和速度,还在图像编辑的精准性上实现了重要突破。可以说,OpenAI不仅对谷歌广受赞誉的Nano Banana系列模型发起了强势反击,还间接冲击了Photoshop等传统图像处理工具的市场。

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第1张

OpenAI表示,基于最新旗舰图像生成模型的“ChatGPT图像”功能,能够在保持细节完整的同时进行高精度编辑,更有效地呈现用户期望的效果。同时,生成速度提升高达4倍

显然,图像生成模型的实际表现,还需通过图像来直观展示。

作为此次升级的核心改进,OpenAI强调,新模型擅长多种精确编辑操作,如添加、删除、合并、混合和转置,在实现修图目标的同时,保留图片原有特色

例如,以下是ChatGPT新图像模型生成的90年代末洛杉矶街头摄影(演示版)。

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第2张

→将人物的衬衫改为红色帽子改为黄色,限速标志调整为15卡车替换为消防车

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第3张

→在左侧添加一群旁观者,右侧人行道上栖息着一只鹰,远处天空中有一艘飞船飞过;

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第4张

→带有该图像完整印花的T恤悬挂在晾衣绳上;

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第5张

→将那件T恤穿到滑板手身上。

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第6张

作为AI生成图像的关键应用,ChatGPT图像在创意改造现有图片方面也取得进展。例如,将公司CEO奥尔特曼的个人照片,转换为美国80年代的健美操教练形象,或将他的面部融入世界名画《戴珍珠耳环的少女》中。

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第7张

此外,ChatGPT还向谷歌的传统优势领域——生成富含文字信息的示意图,发起了挑战。OpenAI指出,该模型在文本呈现上更进一步,能够处理更密集、更小尺寸的文字

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第8张

需要指出的是,尽管ChatGPT在生成英文字体时已近乎逼真,但官方也承认,新模型在生成中文、阿拉伯语、希伯来语等方面仍存在不足

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第9张

因此,至少在中文文字图像生成方面,Nano Banana仍然完全领先于ChatGPT

OpenAI发布升级版ChatGPT图像功能,正面挑战谷歌Nano Banana模型 OpenAI  ChatGPT图像功能 谷歌Nano Banana 图像编辑精确性 第10张

值得一提的是,新图像生成模型不仅性能更强,成本也更低。与GPT Image 1相比,升级版GPT Image 1.5的图像输入和输出成本均下降了20%。