当前位置：首页 > 科技资讯 > 正文

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃

主机测评网
科技资讯
2026-01-22
954

Nano Banana 第二代的问世立即在科技界引起了巨大轰动。

下图完全由人工智能生成，不仅涵盖了网页内的所有内容，甚至整个浏览器界面和桌面环境都是凭空生成的，无需任何参考图像。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第1张

此次Nano Banana 2以预览版形式在第三方平台Media.io上短暂出现，随后便被撤下，仅有少数反应迅速的网友得以参与测试。

预览版所展现的能力远超上一代，尤其在处理复杂指令方面表现卓越，包括精准的文本渲染、极度逼真的场景模拟以及类似完整桌面界面的精细还原。

但谷歌DeepMind方面并未就正式发布时间等细节做出任何说明。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第2张

Nano Banana 2全面升级

根据测试页面介绍，Nano Banana 2又名GemPix2，主要在真实性、生成速度和自然交互控制方面进行了显著改进。

从现有测试结果来看，Nano Banana 2能够生成极其复杂的用户界面，文字渲染几乎无懈可击，令许多网友误以为是真实截图。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第3张

在物理常识与遵循提示词细节方面也表现出色。

能够同时准确绘制出显示特定时间的时钟和一杯斟满的红酒。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第4张

甚至能生成逼真的监控录像画面，不过据推测正式版发布时可能会削弱这方面能力。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第5张

此外，Nano Banana 2还具备一定的世界知识与逻辑推理能力。

在解决数学问题的对比测试中，一代模型解题思路大致正确，但最终渲染出的公式难以理解；二代虽然存在一些小错误，但结果令人印象深刻。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第6张

Nano Banana团队：图像生成的质量已接近上限

Nano Banana最初于2025年8月中旬匿名出现在AI模型测评平台LMArena，凭借其出色的图像编辑能力迅速登顶排行榜，引发社区广泛讨论。

8月底，谷歌正式揭晓其身份为Gemini 2.5 Flash Image，Nano Banana的代号源于谷歌内部测试生成“香蕉大小的纳米机器人”时效果良好。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第7张

上线不到10天，用户编辑了超过2亿张图片，为Gemini应用带来了1000万新用户，并一度帮助Gemini超越ChatGPT成为苹果免费应用榜首。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第8张

第一代Nano Banana的核心优势在于强大的图像编辑和理解能力，

包括自然语言编辑与角色一致性，用户可用日常语言进行多轮、迭代式的图像编辑，同时解决了AI图像编辑中常见的“身份漂移”问题，保持角色特征在多次修改后高度一致。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第9张

与先前模型相比增加了多图像融合与风格迁移功能，支持将多张不同图片无缝融合成一张连贯的图像，或将一张图的风格应用到另一张图的物体上，为电商、广告等行业大幅提升了创作效率。

Nano Banana 2代惊艳亮相：AI图像生成技术实现重大飞跃 2 AI图像生成谷歌DeepMind 图像真实性第10张

以及低成本高速度，基于谷歌TPU v5架构优化，Nano Banana平均响应时间仅为1.3秒，单张图片生成成本约0.039美元，仅为DALL-E 3的十分之一。

此前Nano Banana核心团队透露，图像生成的质量已接近上限，未来的关键在于提升模型理解用户“意图”（intention）的能力。

谷歌自身也在加速将Nano Banana整合进其核心产品生态。除了在Gemini应用和AI Studio中提供服务外，谷歌已开始测试将其集成到Google Photos、搜索（Search）、智能镜头（Lens）和画圈搜索（Circle to Search）中，旨在打造一个无缝的AI驱动视觉体验闭环。