
谷歌首席执行官桑达尔·皮查伊在接受采访时阐述了他对人工智能发展的前瞻性思考,其核心在于AI正从单纯的人机对话演变为能够执行“真实任务”的智能体(agentic)体验。这一战略转向的重要标志是谷歌DeepMind发布的Nano Banana Pro(即Gemini 3 Pro Image),它不再仅仅是图像创作工具,而是能够接入搜索引擎、处理复杂数据、完成具体任务的AI工作站。皮查伊同时强调,当前的AI热潮并非泡沫,而是史无前例且合理的“基建投资”期,谷歌与整个行业正投入数万亿美元构建底层基础设施。然而,要实现AI真正“好用”的目标,谷歌必须攻克能源、版权和信任这三大关键挑战,并致力于将图像AI打造成连接其全线产品的入口,而非孤立的应用。
当图像AI开始具备“执行任务”的能力,行业的游戏规则将彻底改变。
Google CEO Sundar Pichai 在接受 BBC 采访时,反复提及一个关键词:任务。
未来12个月内,AI将能够处理更加复杂的任务。
它不再是陪你聊天,而是替你完成真实世界中的工作。
与此同时,2025 年 11 月 20 日,Google DeepMind 正式发布了 Nano Banana Pro(即 Gemini 3 Pro Image)。
这并非一次普通的模型升级,而是图像AI角色转型的关键节点:它不再像 Midjourney 那样仅提供灵感启发,也不像 Canva 那样局限于模板美学,而是一个能够接入搜索、处理数据、完成实际任务的AI工作站。
Pichai 追求的不是更惊艳的图像,而是更实用的工具。
“要让AI好用,钱应该投向哪里?”
在 BBC 的访谈中,Pichai 给出了明确答案:一场前所未有的基础设施建设投资。
记者的第一个问题就很直接:当前这轮AI热潮,是否存在泡沫?
Pichai 没有回避。他承认,部分投资可能过于激进,但整体上是理性的。市场已经看到了真实的客户需求,而当前的技术能力还无法完全满足这些需求。因此,这轮投资热潮是合理的。
这种场景并非首次出现。20多年前的互联网热潮也曾被质疑过度投资。但 Pichai 指出:
“回顾互联网的发展历程,显然存在大量过度投资。但互联网作为一项深刻的技术革命,其地位已毋庸置疑。”
AI 将像互联网一样,引发一场根本性的变革。而当前阶段,并非泡沫,而是提前下注的关键时期:
未来几年,我们将建成原本需要10到20年才能完成的基础设施。
他还透露了一组关键数据:
Google 今年在AI基础设施上的投入将超过900亿美元
全行业在AI相关基础建设上的累计投资已超过1万亿美元
这并非宣传话术,而是他向资本市场传递的核心信息:整个行业正在大规模建设AI基础设施,这是一场前所未有的建设期。
而这场建设期的最终目标,是让产品真正变得“好用”。
Nano Banana Pro 正是在这一背景下发布的:它是这1万亿美元投资周期中的一个重要落点。
但 Pichai 也没有盲目乐观。
当被问及“Google 是否比别的公司更安全,不怕泡沫破裂”时,他明确表示:所有公司都可能受影响,Google 也不例外。投资越多,该承担的风险也越大。
但他强调,Google 走的是全链条路径:我们不仅仅做模型,而是从底层物理设施到推动AI研究,再到实际应用,覆盖端到端的完整价值链。
从芯片、数据中心、研究,再到最终落地于搜索、YouTube、Android 中的真实产品,Google 试图掌控整个链条。
而这场耐力赛的终点,是让产品真正被用户用起来。
在采访中,Pichai 多次提到:任务。
这也正是 Nano Banana Pro 与以往图像模型的最大区别。
✅AI 的方向:从对话到行动
Pichai 说,AI 的重心正从交流转向帮你做事。
“你现在可以和AI来回对话,在很多话题上进行交流。但接下来的12个月,你会看到它们开始做更复杂的事情。”
他举了一个很生活化的例子:比如我想买个生日礼物送给家人,我可以让AI去完成这件事。
这种从对话到行动的转变,正是 Pichai 所说的 agentic 体验,即让AI成为能够完成任务的智能体。
而 Nano Banana Pro(Gemini 3 Pro Image)正在向这个方向发展,具体体现在官方公布的三大升级中:
第一,能看懂实时信息
它可以连接 Google 搜索,调取最新的数据:
你给出一个地点,它能生成天气图
你给出一堆财报数据截图,它能做出图表
你告诉它“做一张关于龟背竹的植物养护卡”,它就能拉取资料,自动设计出结构化图像
第二,能把内容直接变成图像
最关键的能力是:
生成文字正确、不乱码的图像(以前很多图像AI会出现文字错乱)
多语言支持,不只是英文,还能用中文、韩文、印地语、阿拉伯语直接输出
甚至可以把一段故事变成电影式的分镜图
比如用户只输入一句“讲圣诞老人变成说唱歌手的故事”,Nano Banana Pro 就能一步步生成巡演巴士、后台花絮、演出名单的图像内容。
它能理解你要做什么,然后自动展开。
第三,能微调、能控制,像摄影师一样创作
普通人可能没接触过色彩分级、景深控制、焦点调整,但 Nano Banana Pro 现在把这些功能做成了按钮级别的操作。
你可以:
改变图像的纵横比(比如 1:1 用于小红书,16:9 用于 PPT 封面)
修改画面焦点(让花朵清晰、背景虚化)
调整光线(把白天变成夜景,把光打在人物脸上)
一句话总结:Nano Banana Pro,正成为普通人也能用的图像工作站。
前面提到,Pichai 强调 Google 走的是端到端的全链条路径。
那么在图像领域,这个战略如何落地?答案是:把图像做成入口,而不是独立应用。
✅Nano Banana Pro 并非孤例
从发布信息看,Nano Banana Pro 同时被部署到了:
Google Search(AI Mode)→ 抓取实时信息、做图表
Google Ads → 生成带文案的广告图片
Workspace(Slides、Vids)→ 做演示、短视频内容
Gemini App → 消费者随手生成视觉内容
API 和 AI Studio → 开发者直接用来做应用
这种全线铺开的方式,透露出 Google 的真正意图:让图像成为连接各个产品的一个入口。
✅为什么是图像?
在采访中,Pichai 用了一个很具体的场景来说明 AI 应该如何辅助工作: “放射科医生面对的扫描越来越多,每次扫描的图像也越来越复杂。AI 工具可以帮助他们应对这种增长的需求。”
他不是在讲抽象的生产力提升,而是在说:
医生怎么在大量图像中快速找出重点?
企业怎么用图表讲清一堆财报?
普通人怎么在十几秒内看懂天气、比赛、食谱?
这些任务,都需要图像。但旧的图像生成工具,只能出图,不能用。
而 Nano Banana Pro 要解决的问题是:能不能让 AI 生成的图,自己说清用意,还能引导下一步行动?
✅ Nano Banana Pro 的真正价值
三个场景可以说明它在做什么:
你想表达一个复杂信息,它能帮你排好结构、渲染清晰、翻译成多语种
你想让 AI 帮你开始干活,它先给你一个能理解的画面
你不懂提示词、也不懂设计,它用界面引导你选灯光、焦点、场景角度
Pichai 在回答 AI 会不会取代工作时,说过这样一段话:
“历史上很多工具,都是把人从重复劳动中解放出来。洗碗机、电冰箱都不是为了让人没事干,而是为了让人有时间干别的事。”
Nano Banana Pro 也是如此:不是让你变成艺术家,而是帮你省下表达和沟通的时间。
而这种把图像变成“入口”而非作品的思路, 会成为 Google 之后布局 AI 产品的关键逻辑。
Nano Banana Pro 展示了图像 AI 如何从“好看”变好用。但 Pichai 也清楚,要真正做到好用,还得过三道关。
第一关:能源,AI 在加速,电从哪来?
主持人问得很尖锐:到这个十年末,数据中心的耗电量可能会比整个印度还高,比所有电动车加起来还多 50%。Google 还坚持 2030 年净零碳排的目标吗?
他的回答是:目标还在,只是速度确实受影响。行业增长比预期更快,但 Google 正在通过投入新能源来应对。
他说了三个细节,显示 Google 已经行动:
签下了全球最大的商业核聚变能源采购协议(与 Commonwealth Fusion Systems)
投资小型核反应堆、地热能源、太阳能电池
2026 年,Google 在英国的数据中心将实现 95% 无碳电力覆盖
在他看来,这不该是一个此消彼长的选择题,AI 和绿色能源,可以一起推进。
第二关:版权,训练模型的内容,要不要付费?
主持人接着问了一个更敏感的问题:
“有人说你们用图书、音乐、新闻来训练模型,然后又把这些内容卖回给世界。你愿意为这些内容付费吗?”
Pichai 没有说愿意或不愿意,他强调的是机制:我们让用户可以选择退出被训练,并且在生成内容时尊重版权。我们也在跟行业一起更新这个框架。
他举了 YouTube 的例子: “在视频时代,我们就给创作者提供了变现方式。现在到了 AI,我们也会延续同样的做法。”
换句话说,Google 要走的仍然是和内容生态共赢的路
第三关:信任,AI 说的,到底能不能信?
主持人也提到了披萨配胶水、议员被误指控的例子,Pichai 承认问题确实存在:Google 为提供准确信息投入了很多努力,但目前最先进的 AI 仍然可能出错。
他的应对策略是把 AI 模型和 Google 搜索结合使用,让 Gemini 连接搜索来提高准确性。
同时他强调:不能盲信 AI,但应该有方法去理解它、验证它、使用它。
而在 Nano Banana Pro 的发布中,Google 同步推出了应对措施:所有生成的图像都嵌入了 SynthID 数字水印,用户可以在 Gemini App 中上传图片,直接询问它是否由 Google AI 生成。
这三件事,Pichai 没有把它们当合规项或副议题来讲。
他认为,如果只靠 AI 技术本身,信息生态就会失衡。所以新闻业很重要,老师很重要,医生的建议也很重要。
Google 在这轮 AI 热潮里不只是追求快,而是在做一个慢功夫:把根扎在能源、内容、信任这三个基础上。
而这三道关,也会是 Google 之后所有 AI 产品必须跨越的门槛。
Pichai 在采访的最后,讲了一个故事。
他让 80 多岁的父亲第一次坐进无人驾驶车。我坐在后座,他在前面。他惊讶,也兴奋。这帮我重新看清,我们今天认为理所当然的许多进步,其实已经在改变生活。
Nano Banana Pro 也在做同样的事。
它不是为了生成更好看的图片,而是为了让每个人在面对复杂信息时,有一张图可以看懂,有一个起点可以动手。
可视化、可操作、可理解。
这是 AI 走向下一阶段之前,最重要的一步。
入口,不是技术有多强,而是人们会不会真正用起来。
参考资料:
https://www.youtube.com/watch?v=edTTeY1Zx-0&t=2198s
https://www.youtube.com/watch?v=BYx63PKKPvg&t=1s
https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=
https://x.com/venturetwins/status/1991522541475954988
https://www.theverge.com/news/824785/google-nano-banana-pro-try-free-examples-prices
来源:官方媒体/网络新闻
本文由主机测评网于2026-02-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260225755.html