当前位置:首页 > 科技资讯 > 正文

炸裂!谷歌Nano Banana Pro震撼登场

震惊!太令人震惊了!

谷歌Nano Banana Pro一经发布,全网络立刻沸腾:

这模型里到底藏了什么黑科技?!

硅谷VC大佬Deedy率先分享了使用案例,看完只能说,网友们的惊叹声真的不算过分(doge)。

给它一份英伟达最新财报PDF,它瞬间生成了一张重点清晰、制作精美的图表:

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第1张

或者,直接丢给它未经加工的Graphviz图表代码,它直接生成了带logo的可视化效果图:

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第2张

更不用说各种论文流程图、核心概念解释图(连Transformer架构图都能直接生成):

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第3张

总之,短短几个小时,X社区已经掀起了一股Nano Banana Pro狂潮:

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第4张

呼~Nano Banana Pro真的这么强大吗?咱们这就实测见真章。

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第5张

实测Nano Banana Pro

先提醒大家,Nano Banana Pro是谷歌趁着Gemini 3 Pro好评如潮推出的最新、最强文生图模型。

它也叫Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力及谷歌搜索的知识库,能理解现实语义与物理逻辑。

其主要升级点包括:

  • 更高画质和分辨率,支持2K、4K高清分辨率及多种宽高比(如方形 1:1、超宽画幅2.76:1);
  • 文字渲染能力大幅提升,支持多语言直接渲染或翻译(如将图片中的英文翻译成中文、韩文等);
  • 支持最多14张图像融合生成;
  • 基于Gemini 3 Pro的多模态理解能力,支持生成复杂专业图表。

目前,普通用户可以在Gemini应用中免费体验——选择“创建图像”功能时就能使用,但免费用户有额度限制,超出后会回退到原始的Nano Banana模型。Google AI Plus、Pro和Ultra订阅用户则享有更高的配额。

实测第一弹,先来个开胃小菜——拆解一辆自行车:

提示词:Exploded view diagram of a bicycle frame and components, technical blueprint, aesthetic cyanotype print, annotated with measurements in millimeters, disassembled gears and chain, perspective view, clean lines, on a white background —ar 16:9 —style raw

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第6张

大概要求就是生成一辆自行车车架及组件的爆炸视图,带有已拆卸的齿轮和链条,以毫米为单位进行尺寸标注等。

而Nano Banana Pro经过深思熟虑后,迅速生成了以下图像:

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第7张

肉眼对比原图确实像模像样,不过为了更严谨,我们找来ChatGPT进行“客观点评”。

而ChatGPT也根据要求逐项打分,最终认定:完成度确实很高:

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第8张

再试试图像融合吧~为了节省时间,我们直接把难度拉满——让14只娃娃坐在一起看电视:

提示词:These dolls are seated on the same sofa while watching TV.

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第9张

而Nano Banana Pro直接生成了以下图像:

不说别的,整体氛围确实符合要求,玩偶们排排坐在沙发上看动画。而且落地灯照出的光影和玩偶在窗户里的背影这些细节都考虑到了,整体生成效果相当不错。

唯一的遗憾是娃娃数量不够14只,可能是有的玩偶不爱看电视吧(bushi~)

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第10张

当然,最大的问题可能还是出在提示词上,这里我们指代的过于宽泛了(“These dolls”),换成更清晰的“14个娃娃”可能效果会更好。

因为深入分析Nano Banana Pro的思考过程,我们发现它其实会重点考虑这些细节的指令遵循情况。

炸裂!谷歌Nano Banana Pro震撼登场 谷歌Nano Pro AI图像生成 多模态理解 实测 第11张