当前位置:首页 > 科技资讯 > 正文

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限

Nano Banana 2的首次亮相就震撼了所有人。

以下这张图完全是由AI生成,不仅包含了网页内容,甚至整个浏览器界面和桌面环境都栩栩如生,且没有参考任何原始图像。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第1张

这次Nano Banana 2以预览版形式出现在第三方网站Media.io上,但随后被移除,只有少数幸运的网友有机会参与测试。

预览版所展示的能力已经远远超过了前代,尤其在处理复杂提示方面表现突出,包括精确的文本渲染、超逼真的场景以及类似完整桌面界面的精细模拟。

然而,谷歌DeepMind并未透露关于正式发布的任何信息。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第2张

Nano Banana 2全面升级

根据测试页面说明,这次Nano Banana 2,也被称为GemPix2,主要在真实性、生成速度和自然交互控制方面进行了改进。

从目前的测试结果来看,Nano Banana 2能够生成极其复杂的UI,文字渲染也几乎看不出任何破绽,许多网友都以为这是一张真实的截图。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第3张

它对物理常识和遵循提示词的细节也表现得非常出色。

能够同时准确绘制出指向特定时间的时钟和一杯斟满的红酒。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第4张

甚至能伪造出逼真的监控录像画面,不过据推测在正式版发布时应该会削弱这方面能力。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第5张

此外,Nano Banana 2还具备了一定的世界知识与逻辑推理能力。

在解决数学问题的对比测试中,一代的解题思路虽然大致方向正确,但最终渲染出的公式基本难以理解。

二代虽然有一些小错误,但结果却令人印象深刻。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第6张

Nano Banana团队:图像生成质量已接近极限

Nano Banana最初于2025年8月中旬匿名出现在AI模型测评平台LMArena,凭借其出色的图像编辑能力迅速登顶排行榜,引发社区热议。

8月底,谷歌正式揭晓其身份为Gemini 2.5 Flash Image,Nano Banana的代号源于谷歌内部测试生成“香蕉大小的纳米机器人”时效果很好。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第7张

上线不到十天,用户编辑了超过两亿张图片,为Gemini应用带来了千万新用户,并一度帮助Gemini超越ChatGPT成为苹果免费应用榜首。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第8张

第一代Nano Banana的核心优势在于强大的图像编辑和理解能力。

包括自然语言编辑与角色一致性,用户可以用日常语言进行多轮、迭代式的图像编辑,同时解决了AI图像编辑中常见的“身份漂移”问题,保持角色特征在多次修改后高度一致。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第9张

与先前模型相比增加了多图像融合与风格迁移功能,支持将多张不同图片无缝融合成一张连贯的图像,或将一张图的风格应用到另一张图的物体上,为电商、广告等行业提高了创作效率。

Nano Banana 2惊艳亮相:AI生成逼真图像挑战极限 2 AI生成 图像质量 用户意图 第10张

以及低成本高速度,基于谷歌TPU v5架构优化,Nano Banana平均响应时间仅为秒,单张图片生成成本约美元,仅为DALL-E 3的十分之一。

此前Nano Banana核心团队透露,图像生成的质量已接近上限,未来的关键在于提升模型理解用户“意图”(intention)的能力。

谷歌自身也在加速将Nano Banana整合进其核心产品生态。除了在Gemini应用和AI Studio中提供服务外,谷歌已开始测试将其集成到Google Photos、搜索(Search)、智能镜头(Lens)和画圈搜索(Circle to Search)中,意图打造一个无缝的AI驱动视觉体验闭环。