备受瞩目的 nano banana 即将迎来其 2.0 版本,这标志着 AI 生图技术的又一次飞跃。
通过这张 11:15 的时钟和满杯的红酒,你可以窥见 nano banana 2.0 的强大之处。这一测试在 AI 生图领域极具挑战性,当前尚无 AI 能稳定应对。
照片中的提示词是“时钟上显示 11:15,红酒杯已满至杯口”,能够检测你的 AI 生图是否足够智能。
我们尝试在大模型竞技场、豆包 Seedream 以及 nano banana 1.0 版本中运行该测试,但无一能准确显示时钟刻度或红酒满杯的场景。
而 nano banana 2.0 成功做到了这一点。
相较于当前版本,nano banana 2.0 在文本渲染能力上更进一步,能够直接书写不同语言和风格的文字;其世界知识也更强,能生成各种信息图表;同时,指令遵循表现也更为出色。
更真实的黑板字|图片来源 x@testingcatalog
与最初在大模型竞技场以抽卡形式出现的 nano banana 不同,nano banana 2.0 模型在 media.io 上被曝光,用户可以在该网站上体验这一新版本。
目前,Media AI(即 medio.io)仅有 nano banana 和 Seedream 等其他 AI 生图模型。
然而,这个被称为 nano banana 2.0 的模型很快就被下架了。在 Reddit 上,有用户提到 Media AI 只是短暂性地开放了一个多小时的使用权限。
尽管时间短暂,但网友们发现其生图效果确实令人惊艳,迅速在社交媒体上传播开来。大家都在分享 nano banana 2.0 预览模型的输出结果,并与 1.0 版本进行对比。
下面这两张分别来自 1.0 和 2.0 版本的图片,你能分辨出哪张是 nano banana 2.0 生成的吗?
都是汽车模特在海边公路拍摄的大片,但第一张图片的色彩和风格更为准确,没有 AI 照片的“塑料感”。
这两张偏科幻风格的图片对比更为明显。第二张图更具电影感,视觉质量也比第一张图有更多准确的细节。
例如,第一张图的设备仪表板和第二张图有明显不同,nano banana 生成的仪表板依旧带有明显的 AI 风格。
根据 X 上爆料博主 testingcatalog 透露的信息,nano banana 2.0 目前仍然以 Gemini 2.5 Flash 作为基础模型,并未完全使用 Gemini 3.0 Pro。
这意味着 nano banana 2.0 图像模型的发布时间可能比 Gemini 3.0 更早。以下是关于 nano banana 2.0 的亮点:
其中,多步工作流是 nano banana 更新中最大的差异化卖点。之前我们可能听过 ComfyUI 等工具实现生图、生视频的工作流,但现在通过 nano banana 就能实现这一功能。
nano banana 2.0 能直接生成一个 Windows 电脑截图,显示浏览器正在访问 YouTube 网站,并指定视频的封面为野兽先生。
更复杂的玩法是直接让 nano banana 2.0 生成一个 Google DeepMind 的网页截图,这密密麻麻的文字没有出现乱码,真的很厉害。
像开头那张 11:15 的时钟和满杯的红酒照片一样,网友们在评论区纷纷贴出自己用 Grok、ChatGPT 等其他模型的生图结果,但都不如 nano banana 2.0 准确。
同样是在 Media AI 平台上,短暂出现的预览版本的测试效果令人惊艳。
本文由主机测评网于2026-05-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544251.html