当前位置：首页 > 科技资讯 > 正文

皮查伊谈AI未来：智能体将代你完成任务，Nano Banana Pro开启图像AI新纪元

主机测评网
科技资讯
2026-02-18
483

皮查伊谈AI未来：智能体将代你完成任务，Nano Banana Pro开启图像AI新纪元人工智能智能体 Google Nano Pro 第1张

谷歌首席执行官桑达尔·皮查伊在接受采访时阐述了他对人工智能发展的前瞻性思考，其核心在于AI正从单纯的人机对话演变为能够执行“真实任务”的智能体（agentic）体验。这一战略转向的重要标志是谷歌DeepMind发布的Nano Banana Pro（即Gemini 3 Pro Image），它不再仅仅是图像创作工具，而是能够接入搜索引擎、处理复杂数据、完成具体任务的AI工作站。皮查伊同时强调，当前的AI热潮并非泡沫，而是史无前例且合理的“基建投资”期，谷歌与整个行业正投入数万亿美元构建底层基础设施。然而，要实现AI真正“好用”的目标，谷歌必须攻克能源、版权和信任这三大关键挑战，并致力于将图像AI打造成连接其全线产品的入口，而非孤立的应用。

当图像AI开始具备“执行任务”的能力，行业的游戏规则将彻底改变。

Google CEO Sundar Pichai 在接受 BBC 采访时，反复提及一个关键词：任务。

未来12个月内，AI将能够处理更加复杂的任务。

它不再是陪你聊天，而是替你完成真实世界中的工作。

与此同时，2025 年 11 月 20 日，Google DeepMind 正式发布了 Nano Banana Pro（即 Gemini 3 Pro Image）。

这并非一次普通的模型升级，而是图像AI角色转型的关键节点：它不再像 Midjourney 那样仅提供灵感启发，也不像 Canva 那样局限于模板美学，而是一个能够接入搜索、处理数据、完成实际任务的AI工作站。

Pichai 追求的不是更惊艳的图像，而是更实用的工具。

第一节｜1万亿美元，一场基建耐力赛

“要让AI好用，钱应该投向哪里？”

在 BBC 的访谈中，Pichai 给出了明确答案：一场前所未有的基础设施建设投资。

记者的第一个问题就很直接：当前这轮AI热潮，是否存在泡沫？

Pichai 没有回避。他承认，部分投资可能过于激进，但整体上是理性的。市场已经看到了真实的客户需求，而当前的技术能力还无法完全满足这些需求。因此，这轮投资热潮是合理的。

这种场景并非首次出现。20多年前的互联网热潮也曾被质疑过度投资。但 Pichai 指出：

“回顾互联网的发展历程，显然存在大量过度投资。但互联网作为一项深刻的技术革命，其地位已毋庸置疑。”

AI 将像互联网一样，引发一场根本性的变革。而当前阶段，并非泡沫，而是提前下注的关键时期：

未来几年，我们将建成原本需要10到20年才能完成的基础设施。

他还透露了一组关键数据：

Google 今年在AI基础设施上的投入将超过900亿美元

全行业在AI相关基础建设上的累计投资已超过1万亿美元

这并非宣传话术，而是他向资本市场传递的核心信息：整个行业正在大规模建设AI基础设施，这是一场前所未有的建设期。

而这场建设期的最终目标，是让产品真正变得“好用”。

Nano Banana Pro 正是在这一背景下发布的：它是这1万亿美元投资周期中的一个重要落点。

但 Pichai 也没有盲目乐观。

当被问及“Google 是否比别的公司更安全，不怕泡沫破裂”时，他明确表示：所有公司都可能受影响，Google 也不例外。投资越多，该承担的风险也越大。

但他强调，Google 走的是全链条路径：我们不仅仅做模型，而是从底层物理设施到推动AI研究，再到实际应用，覆盖端到端的完整价值链。

从芯片、数据中心、研究，再到最终落地于搜索、YouTube、Android 中的真实产品，Google 试图掌控整个链条。

而这场耐力赛的终点，是让产品真正被用户用起来。

第二节｜Nano Banana Pro：不是画图，是干活

在采访中，Pichai 多次提到：任务。

这也正是 Nano Banana Pro 与以往图像模型的最大区别。

✅AI 的方向：从对话到行动

Pichai 说，AI 的重心正从交流转向帮你做事。

“你现在可以和AI来回对话，在很多话题上进行交流。但接下来的12个月，你会看到它们开始做更复杂的事情。”

他举了一个很生活化的例子：比如我想买个生日礼物送给家人，我可以让AI去完成这件事。

这种从对话到行动的转变，正是 Pichai 所说的 agentic 体验，即让AI成为能够完成任务的智能体。

而 Nano Banana Pro（Gemini 3 Pro Image）正在向这个方向发展，具体体现在官方公布的三大升级中：

第一，能看懂实时信息

它可以连接 Google 搜索，调取最新的数据：

你给出一个地点，它能生成天气图

你给出一堆财报数据截图，它能做出图表

你告诉它“做一张关于龟背竹的植物养护卡”，它就能拉取资料，自动设计出结构化图像

第二，能把内容直接变成图像

最关键的能力是：

生成文字正确、不乱码的图像（以前很多图像AI会出现文字错乱）

多语言支持，不只是英文，还能用中文、韩文、印地语、阿拉伯语直接输出

甚至可以把一段故事变成电影式的分镜图

比如用户只输入一句“讲圣诞老人变成说唱歌手的故事”，Nano Banana Pro 就能一步步生成巡演巴士、后台花絮、演出名单的图像内容。

它能理解你要做什么，然后自动展开。

第三，能微调、能控制，像摄影师一样创作

普通人可能没接触过色彩分级、景深控制、焦点调整，但 Nano Banana Pro 现在把这些功能做成了按钮级别的操作。

你可以：

改变图像的纵横比（比如 1:1 用于小红书，16:9 用于 PPT 封面）

修改画面焦点（让花朵清晰、背景虚化）

调整光线（把白天变成夜景，把光打在人物脸上）

一句话总结：Nano Banana Pro，正成为普通人也能用的图像工作站。

第三节｜图像 AI 的新角色：入口，而非工具

前面提到，Pichai 强调 Google 走的是端到端的全链条路径。

那么在图像领域，这个战略如何落地？答案是：把图像做成入口，而不是独立应用。

✅Nano Banana Pro 并非孤例

从发布信息看，Nano Banana Pro 同时被部署到了：

Google Search（AI Mode）→ 抓取实时信息、做图表

Google Ads → 生成带文案的广告图片

Workspace（Slides、Vids）→ 做演示、短视频内容

Gemini App → 消费者随手生成视觉内容

API 和 AI Studio → 开发者直接用来做应用

这种全线铺开的方式，透露出 Google 的真正意图：让图像成为连接各个产品的一个入口。

✅为什么是图像？

在采访中，Pichai 用了一个很具体的场景来说明 AI 应该如何辅助工作： “放射科医生面对的扫描越来越多，每次扫描的图像也越来越复杂。AI 工具可以帮助他们应对这种增长的需求。”

他不是在讲抽象的生产力提升，而是在说：

医生怎么在大量图像中快速找出重点？

企业怎么用图表讲清一堆财报？

普通人怎么在十几秒内看懂天气、比赛、食谱?

这些任务，都需要图像。但旧的图像生成工具，只能出图，不能用。

而 Nano Banana Pro 要解决的问题是：能不能让 AI 生成的图，自己说清用意，还能引导下一步行动？

✅ Nano Banana Pro 的真正价值

三个场景可以说明它在做什么：

你想表达一个复杂信息，它能帮你排好结构、渲染清晰、翻译成多语种

你想让 AI 帮你开始干活，它先给你一个能理解的画面

你不懂提示词、也不懂设计，它用界面引导你选灯光、焦点、场景角度

Pichai 在回答 AI 会不会取代工作时，说过这样一段话：

“历史上很多工具，都是把人从重复劳动中解放出来。洗碗机、电冰箱都不是为了让人没事干，而是为了让人有时间干别的事。”

Nano Banana Pro 也是如此：不是让你变成艺术家，而是帮你省下表达和沟通的时间。

而这种把图像变成“入口”而非作品的思路，会成为 Google 之后布局 AI 产品的关键逻辑。

第四节｜能源、版权、信任：三道必过的关

Nano Banana Pro 展示了图像 AI 如何从“好看”变好用。但 Pichai 也清楚，要真正做到好用，还得过三道关。

第一关：能源，AI 在加速，电从哪来？

主持人问得很尖锐：到这个十年末，数据中心的耗电量可能会比整个印度还高，比所有电动车加起来还多 50%。Google 还坚持 2030 年净零碳排的目标吗？

他的回答是：目标还在，只是速度确实受影响。行业增长比预期更快，但 Google 正在通过投入新能源来应对。

他说了三个细节，显示 Google 已经行动：

签下了全球最大的商业核聚变能源采购协议（与 Commonwealth Fusion Systems）

投资小型核反应堆、地热能源、太阳能电池

2026 年，Google 在英国的数据中心将实现 95% 无碳电力覆盖

在他看来，这不该是一个此消彼长的选择题，AI 和绿色能源，可以一起推进。

第二关：版权，训练模型的内容，要不要付费？

主持人接着问了一个更敏感的问题：

“有人说你们用图书、音乐、新闻来训练模型，然后又把这些内容卖回给世界。你愿意为这些内容付费吗？”

Pichai 没有说愿意或不愿意，他强调的是机制：我们让用户可以选择退出被训练，并且在生成内容时尊重版权。我们也在跟行业一起更新这个框架。

他举了 YouTube 的例子： “在视频时代，我们就给创作者提供了变现方式。现在到了 AI，我们也会延续同样的做法。”

换句话说，Google 要走的仍然是和内容生态共赢的路

第三关：信任，AI 说的，到底能不能信？

主持人也提到了披萨配胶水、议员被误指控的例子，Pichai 承认问题确实存在：Google 为提供准确信息投入了很多努力，但目前最先进的 AI 仍然可能出错。

他的应对策略是把 AI 模型和 Google 搜索结合使用，让 Gemini 连接搜索来提高准确性。

同时他强调：不能盲信 AI，但应该有方法去理解它、验证它、使用它。

而在 Nano Banana Pro 的发布中，Google 同步推出了应对措施：所有生成的图像都嵌入了 SynthID 数字水印，用户可以在 Gemini App 中上传图片，直接询问它是否由 Google AI 生成。

这三件事，Pichai 没有把它们当合规项或副议题来讲。

他认为，如果只靠 AI 技术本身，信息生态就会失衡。所以新闻业很重要，老师很重要，医生的建议也很重要。

Google 在这轮 AI 热潮里不只是追求快，而是在做一个慢功夫：把根扎在能源、内容、信任这三个基础上。

而这三道关，也会是 Google 之后所有 AI 产品必须跨越的门槛。

结语｜入口思维：技术之外的那一步

Pichai 在采访的最后，讲了一个故事。

他让 80 多岁的父亲第一次坐进无人驾驶车。我坐在后座，他在前面。他惊讶，也兴奋。这帮我重新看清，我们今天认为理所当然的许多进步，其实已经在改变生活。

Nano Banana Pro 也在做同样的事。

它不是为了生成更好看的图片，而是为了让每个人在面对复杂信息时，有一张图可以看懂，有一个起点可以动手。

可视化、可操作、可理解。

这是 AI 走向下一阶段之前，最重要的一步。

入口，不是技术有多强，而是人们会不会真正用起来。

参考资料：

https://www.youtube.com/watch?v=edTTeY1Zx-0&t=2198s

https://www.youtube.com/watch?v=BYx63PKKPvg&t=1s

https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

https://x.com/venturetwins/status/1991522541475954988

https://www.theverge.com/news/824785/google-nano-banana-pro-try-free-examples-prices

来源：官方媒体/网络新闻

服务器教程性价比vps 高防服务器

本文由主机测评网于2026-02-18发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260225755.html

皮查伊谈AI未来：智能体将代你完成任务，Nano Banana Pro开启图像AI新纪元

第一节｜1万亿美元，一场基建耐力赛

第二节｜Nano Banana Pro：不是画图，是干活

第三节｜图像 AI 的新角色：入口，而非工具

第四节｜能源、版权、信任：三道必过的关

结语｜入口思维：技术之外的那一步

远程连接Mac ClaudeCode登录失败：Invalid API key错误修复指南（一文详解/login命令与API密钥配置步骤）

Ubuntu软件源修改完全指南（从零开始配置镜像源，加速apt下载）

皮查伊谈AI未来：智能体将代你完成任务，Nano Banana Pro开启图像AI新纪元

第一节｜1万亿美元，一场基建耐力赛

第二节｜Nano Banana Pro：不是画图，是干活

第三节｜图像 AI 的新角色：入口，而非工具

第四节｜能源、版权、信任：三道必过的关

结语｜入口思维：技术之外的那一步

远程连接Mac ClaudeCode登录失败：Invalid API key错误修复指南（一文详解/login命令与API密钥配置步骤）

Ubuntu软件源修改完全指南 （从零开始配置镜像源，加速apt下载）

相关文章

Ubuntu软件源修改完全指南（从零开始配置镜像源，加速apt下载）