近日,一款名为Nano Banana的AI图像生成工具横空出世,迅速在人工智能领域掀起波澜,引发全球关注。
起初,它可能只是社交媒体上病毒式传播的手办创意图,但随后发展势头愈发疯狂。谷歌旗下的Nano Banana上线不到两周,已在全球生成超过2亿张图片,其中亚太地区用户热情最高。英伟达CEO黄仁勋更成为其忠实用户,在伦敦公开向记者宣称自己是Nano Banana的粉丝,进一步推高了其热度。
这股流行浪潮带来了显著红利,直接助推了Gemini App的用户增长。短时间内,Nano Banana为Gemini App吸引了超过1000万新用户。不久前,它更是帮助谷歌Gemini在苹果应用榜上超越了长期霸榜的ChatGPT,实现了历史性突破。
连锁反应持续深化。在海外,为应对Nano Banana的冲击,OpenAI以约11亿美元的全股票交易方式收购了产品实验平台Statsig。伴随此次收购,Statsig的创始人兼首席执行官Vijaye Raji将加入OpenAI,担任新设立的“应用部门首席技术官”。
在国内,字节跳动快速跟进,推出了seedream4.0,试图通过这一举措强化豆包和即梦的用户心智。另一边,垂类应用美图则遭遇危机,通用模型吞噬垂类应用的故事影响了资本市场对其未来的判断,股价出现巨量波动。
尽管外资投行依然为美图站台,但通用模型的势能仍像“达摩克利斯之剑”悬在公司头顶。一时间,AI世界的变化围绕这一超级应用泛起涟漪。类似的波动让人想起GPT-4o带来的吉卜力画风时刻,也再次引发通用模型是否会替代垂类AI应用的探讨。
前OpenAI研究员姚顺雨曾在播客中表示,创业公司对比大模型公司的最大机会在于能否设计出不同的交互方式,可能产生超越ChatGPT的交互,演变成超级应用。但从另一维度看,主流研究员认为,长期耕耘C端业务的垂类应用拥有对用户的精细化理解,而在B端,特定场景的know-how也能为垂类应用公司构筑护城河。无疑,Nano Banana像一场突如其来的变革,搅动着AI圈的神经,它到底是促增长的功能,还是抢地盘的入侵,值得深入拆解。
顺着姚顺雨的思路,Nano Banana确实在颠覆图片创作逻辑。以往,大模型生成图片时,提示词非常关键,用户需要学习结构化提示词才能获得好效果,甚至需要专业知识。后续修改,无论是通过Midjourney的“Vary”功能还是DALL-E的局部重绘,都感觉像离散操作。
现在,Nano Banana的快速响应和自然度让创作更像实时对话,而非反复抽卡。许多人第一次感到AI图像生成变得像实时创作。用户不再需要反复调试结构化咒语,而是通过简单自然语言对话就能对图像进行精确修改。Nano Banana继承了Gemini大模型的“原生世界知识”,这意味着它不仅是图像生成器,更是具备常识和推理能力的系统,能理解和生成具有深层语义准确性的图像。在罗永浩与周鸿祎的最新对谈中,也提到了语言对AI帮助的核心价值。
据报道,这一切让Nano Banana在风格一致性、多图融合、精准逐步编辑以及设计与风格迁移等多个方面表现出色。
Nano Banana通过更精确的理解和更细致的任务拆分,实现了高度一致性的图像编辑。某种程度上,这是通过模型定义实现的一种更近似Agent的能力。
从这个角度看,其颠覆感正如姚顺雨所说,正在改变交互方式,这也是它震动AI圈的原因。在此基础上,Nano Banana也做到了成本低、速度快。在Google的介绍中,Nano Banana定价为30美元/百万token,每张图片生成所需token约1290个,成本约0.039美元。
从另一视角看,Nano Banana的实现路径似乎很难复制。在团队访谈和公开分享中,Nano Banana的几个方向被反复提及:文字渲染、交错生成、速度哲学以及世界知识的引入。这些关键词背后是强大模型能力带来的降维打击。那么,另一问题值得关注:面对如此强大的工具,以及国内逐渐明朗的大模型厂商格局,是否按Nano Banana思路就能成功颠覆垂类AI应用?
美图暴跌后,相关券商调研相继出炉。9月2日,摩根士丹利研报指出,美图增长轨迹未受Nano Banana影响,其真正价值在于提供基础AI模型无法企及的“最后一公里”解决方案。
报告强调美图凭借垂直领域深厚积累、专有数据以及对核心付费功能的专注,构筑了坚实护城河。此外,公司对所有AI模型保持开放中立,并已将Nano Banana等新技术无缝整合进产品中。
同时,业内人士表示,美图C端业务优势在于对美颜美体的精细化理解,目前Nano Banana的手办模型只是一种新玩法,不威胁C端主业。美图B端业务主要围绕商拍等核心功能服务大C小B客户,优势在于特定场景的know-how。在商拍环节,Nano Banana聚焦商品多角度复制性以适应不同社交平台模板,而美图产品则聚焦商品高匹配背景及模特。这个赛道国内海外涌现许多创业公司,但大家都在全新市场,玩法、打法不同,尚未到存量竞争状态。
尽管如此,从叙事看,美图作为垂类应用,AI仍是转型关键。从2022年开始,美图率先在旗下产品Wink中上线视频画质修复技术,逐步延伸出画质优化、视频分辨率提升、人像增强等细分功能,形成完整画质修复能力矩阵。2023年,美图进一步丰富AI功能版图,同时正式切入B端市场,为美业领域打造AI测肤解决方案,开启ToB业务探索。
2024年,美图与阿里巴巴达成2.5亿美元战略投资,双方明确在电商平台、AI技术、云计算三大核心领域展开深度合作。电商合作层面,重点推进两大方向:一是联合推出“AI试衣”功能——依托美图成熟的AI试衣技术,结合阿里巴巴平台丰富的商家服装资源,优化线上购物体验痛点;二是美图设计室向淘天商家后台开放部分核心能力,如“AI商品图”生成功能,帮助商家高效提升商品视觉呈现效果。
由此可见,美图位置微妙:在C端,通过AI技术自我迭代与升级;在B端,通过自身技术赋能电商用户。无论哪一业务,都是技术沉淀后的串联与精细化。某种程度上,美图更多优势在于用户心智、用户经验以及精细化,这些是否能保持现有业务模型不受干扰,需要时间验证。
另一方面,按之前逻辑,美图围绕美图秀秀等垂类赛道超级应用进行业务,似乎需要更大层面交互方式变化才能占住更强心智。同时,如国内头部模型厂商进入这一赛道后,对其是否有更强颠覆,值得思考。美图是AI变革下的典型代表,每当巨头模型公司发生技术溢出时,垂类AI应用就将经历考验,这种不确定性成为公司需要长期面对的命题。
从硅谷经验看,大模型公司与垂类AI公司的竞争是经久不衰话题,例如anthopic旗下的cloude code与编程垂类应用cursor,追赶速度超乎寻常。面对这类竞争,垂类AI办法似乎不多。投资人朱啸虎曾在采访中坦言:AI Coding一开始就不敢投,觉得肯定是大厂天下。今年特别有意思,中国在补贴外卖,美国在补贴AI Coding,几乎都是负毛利。收几十美金月订阅费,消耗Token可能几百美金,都是拿投资人钱补贴程序员。而程序员群体最没忠诚度,哪个API好用、便宜就用哪个。
回归事件主角,美图此前计划重心在出海。大摩报告中,公司设定首个里程碑:三年内将整体付费率提升至8-10%——基于2024年4.7%的巨大飞跃;长期目标更指向休闲类产品付费率10%以上、生产力工具付费率20%以上的更高天花板。但要实现这一系列聚焦“用户付费转化”的目标,美图首先要应对Nano Banana代表的通用大模型冲击:当“对话式创作”重构用户对图像AI的交互期待,垂类应用若仍困守传统功能,此前付费率规划便可能沦为空谈。
美图应对逻辑——将Nano Banana技术整合进自身产品,同时联合阿里深耕“AI试衣”这类场景化服务,恰恰为国产垂类AI指明破局方向:这场看似“巨头碾压垂类”的博弈,实则已被撕开转机裂缝。
危机从不是大模型的技术溢出,而是垂类对自身价值的误判——误将“工具能力”等同于“用户价值”;转机也从不是与大模型比拼参数算力,而是成为大模型落地现实场景的“场景翻译官”与“价值放大器”。毕竟大模型只提供“通用能力底座”,而垂类沉淀的用户心智、场景know-how、B端服务闭环,才是把技术转化为“用户愿付费的服务”的关键,也是决定AI能否真正解决痛点的“最后一块拼图”。
对国产垂类AI而言,真正突破点从不是“造一个更好的香蕉”,而是跳出“与大模型对抗”思维定式,像美图锚定付费率目标那样,聚焦“用大模型赋能场景”:当通用技术与垂类场景深度绑定,所谓“危机”便会转化为“差异化竞争”转机——毕竟AI终极战场从不是技术榜单,而是能否击中用户愿意买单的真实需求。
也许,正如朱啸虎所说,AI时代的演化速度可能是移动互联网的三倍速甚至更快,所以很多机会也会更快被证伪。当年移动互联网的很多工具App还能有不错退出,但在三倍速的AI时代,退出可能会难很多。所以创业者要用十年、二十年的眼光来看,什么东西是更可持续的,要去离大厂不只是一条马路,而是两条马路、三条马路之外寻找机会。
本文由主机测评网于2026-01-04发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114688.html