当前位置:首页 > 科技资讯 > 正文

Nano Banana:AI修图新时代的引领者

几周前,这款神秘而低调的“Nano Banana”模型在评测平台上悄然崭露头角,它没有任何官方公告或文档,却凭借惊人的图像质量和角色一致性,迅速吊打一众老牌模型,在AI社区内掀起轩然大波。

当时,有人猜测它是OpenAI的秘密实验品,也有人认为可能是独立研究团队的“黑马之作”。而到了8月底,谜底终于揭晓——Google亲自认领:Nano Banana正是其最新发布的文生图模型——Gemini 2.5 Flash Image。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第1张

作为Gemini 2.0 Flash的升级版,Nano Banana是一个更加贴近真实工作流的AI编辑器。它不仅能在多次编辑中保持角色和画面的高度一致,还让用户仅凭自然语言就能完成精细的局部修改和多图合成。

相比过去大部分模型“生成一张好图”的目标,Nano Banana更像是一个随时待命的设计助手,能够帮你不断迭代、调整、优化、创造。

大量网友测试后表示,这可能是Photoshop时代的终结。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第2张

那么,在文生图模型这个已经严重内卷的领域,Nano Banana凭什么能再次掀起狂潮?相比OpenAI、Flux等强劲对手,它有什么特别之处,真实效果到底如何?Google的多模态能力如今又发展到什么程度了呢?

01 “横空出世”的Nano Banana

在Nano Banana被Google正式认领之前,它匿名登场于全球最火、最权威的大模型测评平台LMArena。这是一个以社区投票为主导的AI模型竞技场,主要形式就是让两个模型匿名对战,用户“盲选”出自己更满意的结果,网站再根据社区用户的投票基于一系列算法对各家模型进行排名。

大约在8月中旬左右,大家开始注意到,LMArena的文生图和图片编辑榜单上突然出现了一个陌生而神秘的模型代号——Nano Banana,并且在之后几天内凭借超级稳定和惊艳的输出在排行榜上迅速蹿升,最后稳坐榜首。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第3张

一时间,Nano Banana的名字迅速传开,并引发了大量的关注与讨论。大家都在猜测,这个神秘的模型究竟是谁的手笔?

就在关于Nano Banana的讨论进入白热化的时候,8月25日前后,包括DeepMind CEO Demis Hassabis等在内的谷歌工程高管开始在社交平台上“暗戳戳”地发带有香蕉元素的帖子,让悬念逐渐落地。

而就在Gemini 2.5 Flash Image被正式官宣发布前,谷歌CEO Pichai更是连发了3根香蕉宣誓了对Nano Banana的“主权”。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第4张

上一次文生图模型如此热闹的场面,还要追溯到几个月前GPT-4o的吉卜力热潮。这次的Nano Banana究竟好在哪里?

我们采访了一些开发者,大家都表示,Nano Banana此次最大的一个突破就是它的“一致性”能力。

张宋扬

亚马逊AGI部门Applied Scientist:

我觉得最惊艳的就是它在角色的一致性上做得效果非常好,相比之前的模型,这应该是做得最好的一个。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第5张

Nathan Wang

硅谷101特邀研究员

Agent资深开发者:

我觉得Nano Banana让我觉得比较震撼的地方,就是它的一次生成成功并保持这种一致性,包括它的可编辑性是让我很惊讶的地方。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第6张

过去,很多模型在对图片进行反复修改时,最常见的问题就是“换了衣服,人也变了脸”。比如你想把照片里的外套换个颜色,结果系统顺手把五官也拉歪了。这种“不够像”的小偏差让人很难把AI当作可靠的创作工具。

而Nano Banana的改进之处在于它能在多轮编辑中牢牢锁住人物或物体的核心特征。不论是调整姿势、换服装,还是把狗狗放进新的背景里,主体都能够保持不变。

第二个大的突破在于多图融合。过去把两张完全不同的照片合成在一起时常见问题包括不同图像间的不协调、空间扭曲、细节丢失或变形等等。而Nano Banana能够在多图合成时自动处理风格和逻辑一致性,让画面看上去浑然一体。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第7张

第三个亮点是自然语言驱动的精准修改。以前想要改动一张照片往往要自己画蒙版或用专业工具反复擦拭。现在只需简单描述:“换一个背景”、“从照片中移除整个人物”、“改变人物的姿势”……Nano Banana就能在其他部分保持不变的前提下精准执行用户的要求将图片编辑的操作门槛几乎降到零。

从概念到实践:Gemini 团队与Imagen的强强联合

此外它还加入了多轮对话式编辑和风格混配功能。你可以先让它把房间刷成薄荷绿再补上书架换个地毯模型会一步步记住上下文不会把之前的成果推翻。甚至你还可以要求它把花瓣的纹理应用到鞋子上蝴蝶翅膀的图案变成一条裙子生成一种全新的创意风格。

Nano Banana:AI修图新时代的引领者 Banana AI修图 多模态 谷歌 第8张

从实力到反馈:普通用户和专业人士的真实体验

从战略到未来:谷歌的多模态生态大爆发