当前位置:首页 > 科技资讯 > 正文

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用

文|邓咏仪

编辑|苏建勋

阿里系公司正在To C市场全力出击,AI应用成为新战场。

11月19日,蚂蚁集团正式发布全新应用“灵光”,首批上线三大核心模块:“灵光对话”、“灵光闪应用”和“灵光开眼”。这款产品定位为“全代码生成多模态内容”AI助手,其独特之处在于,AI的回复不再是单纯的文本,每次对话都会交付一个可交互的网页,能够生成图文、3D模型、动画、地图、表格、音视频等全模态内容。

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用 灵光 蚂蚁集团 AI助手 阿里To 第1张

△来源:灵光

在“闪应用”功能中,用户只需输入一句自然语言,灵光便能在30秒内生成可编辑、可交互的小应用,支持多种信息输出方式,极大地提升了内容创作的效率。

“灵光开眼”则是一个视觉助手,用户可以通过上传图片或实时拍照,让AI识别并理解图片内容,进而提供相关信息或执行后续操作,例如识别物体、翻译文字等。

11月18日上线后截至发稿,“灵光”下载量已突破100万,攀升至App Store总榜第6位。这一增速甚至超越了多款现象级AI应用。据移动应用分析机构Appfigures数据,近期引发热议的Sora2,达到百万下载量用了5天。

一个有趣的巧合是,就在11月18日,阿里将旗下AI To C应用进行了翻新和整合,以“千问”App的形式重新推出;而蚂蚁的“灵光”仅相隔一天亮相。对于这种时间上的接近,蚂蚁集团CTO何征宇表示,双方并未提前约定,纯属巧合。

回顾过去几年,阿里在To C应用上的投入相对有限。但进入2025年,随着AI领域重回模型竞赛,阿里在To C应用上明显加速“补课”。“千问”上线时,阿里曾高调宣布全力打响AI To C之战,意图抢占新的流量入口。

何征宇透露:“马老师也鼓励我们,让我们冲到App Store榜前列。”这反映出阿里内部对To C AI应用的重视。当前模型能力快速迭代,充满不确定性,押注多个方向是更为稳妥的策略。何征宇比喻道:“如果在沙漠中要找水,我不会把所有人都派往一个方向,而是多路并进。”

两款产品在定位上也有明显区隔。“千问”基于阿里旗舰模型Qwen构建,更像阿里展现模型实力的窗口,擅长处理通用知识问答、长文本写作和复杂的逻辑推理任务。相比之下,“灵光”更侧重于移动端的交互创新:它不仅回答问题,还能通过生成代码渲染多模态内容(图表、界面等),直接交付信息容量丰富的网页;同时押注代码能力,让AI直接帮用户生成小程序。

何征宇补充道,灵光的目标并非成为通用助手入口,也不像豆包等应用主打陪伴功能,而是定位为效率工具。

不做AI陪伴,做信息密度更高的AI助手

与传统通用AI助手相比,灵光最显著的差异在于信息展现形式的创新。它将AI助手的对话形态向前推进了一步——AI的回答不再局限于文字,而是可以画图、做动画、生成3D模型、制作图表,像一个边说边画的老师,让抽象概念变得直观可感。

例如,当用户问“怎么做糖醋排骨”,传统AI助手通常会返回一段长长的文字食谱。但并非所有人都习惯这种长篇大论的交互,灵光则希望用更多模态的形式来展示。据《智能涌现》测试,搜索“怎么做糖醋排骨”后,灵光在数秒内生成了一个色泽鲜亮的糖醋排骨长图,不仅包含详细步骤,还通过不同字体、小标题、图表甚至表情包进行图文并茂的排版,让用户能更快地获取信息。

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用 灵光 蚂蚁集团 AI助手 阿里To 第2张

△来源:智能涌现制图

灵光产品负责人蔡伟用了一个类比:“这就像是从email进化到web时代。以前写邮件只能用文字,现在打开网页,有图片、视频、交互按钮。我们希望AI的回答也能达到这种信息密度。”这种“所见即所得”的交互天然更适合人类认知世界的方式,可以应用于更多场景——比如写论文时随口一问,AI直接生成图表;讨论装修时它画出3D户型图;聊到太阳系,一个行星运转的动画就出现在对话框里。

“我们每天都会接触海量信息,很多时候都淹没其中。”蔡伟表示,“以前去搜索引擎搜,它给你一堆链接,需要一个个点进去看。我们更希望用更高效的方式,让信息传递效率最大化。”

优化信息表达方式是第一步。灵光的另一个拳头功能“闪应用”,能根据用户需求自动生成交互式“小应用”。比如用自然语言说“帮我做一个计时器”,30秒后一个可直接使用的计时器应用就生成了,这些小应用可以直接使用、编辑、保存和分享,如同真正的App。

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用 灵光 蚂蚁集团 AI助手 阿里To 第3张

△来源:智能涌现制图

这种技术路径的难点并不在于概念——目前顶尖模型厂商都会用这种方式展示AI能力。但关键在于AI生成的网页、App是否真正达到可用状态。这种难度更多体现在模型架构和工程实现上。何征宇透露,相比纯文本输出,代码的膨胀率约为5-6倍。简单来说,对于一个15个字的指令“生成一个居中的蓝色‘提交’按钮”,模型需要生成可实际交互的组件,代码量可能达到几十甚至上百个字符。

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用 灵光 蚂蚁集团 AI助手 阿里To 第4张

△来源:智能涌现制图

难度在于,用简单指令让模型生成大量内容(高膨胀率)需要更多计算资源和时间。如何保证模型的高性能和稳定,“灵光”做了大量工程优化。这不仅需要代码生成能力,还需要精准的推理能力(判断信息呈现形式)、工具调用能力(动态生成地图、图表)、数学能力(处理数据可视化),以及对用户意图的深度理解。正因如此,在蚂蚁内部,灵光被定义为“在技术前沿上,在最不稳定的边界上建立产品”。

与其他AI生成web应用的产品相比,灵光的特色是直接在移动端生成可用的成品,工程难度更高。

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用 灵光 蚂蚁集团 AI助手 阿里To 第5张

△一句话用灵光制作的“吃什么”应用 来源:蚂蚁

DeepSeek解放了大厂做应用的包袱

今年1月DeepSeek R1的发布,成为蚂蚁决定all in AGI的转折点。何征宇用三个词概括当时的心情:兴奋、紧迫感、羞愧。“AGI原来是几百亿、上千亿美金的传说,DeepSeek用很小的资源投入就把它做出来了,这给了我们极大的信心,”何征宇说,“我们也在反思,以往很多技术积累没有很好地整合起来,让用户直接感受到价值。”

春节后,蚂蚁迅速集结资源,成立了独立的AGI组织“Inclusion AI”,采用Research(研究)、Engineering(工程)、Producting(产品)三位一体的架构。

战略上,蚂蚁做出明确选择:并不意在争夺AI通用助手的入口——比如主打AI陪伴的豆包,希望让用户消耗时间,而是先聚焦在更细分的方向:coding能力 + 全模态,定位效率工具。围绕这一目标,蚂蚁做了不少取舍。例如,今年模型厂商纷纷竞争推理能力,但灵光并没有选择嵌入到产品中。“DeepSeek已经做得足够好了,能帮大家解决很多问题,我们没有必要再去复刻。”蔡伟表示。

蚂蚁赌的是基础模型不断上涨的代码能力。在“灵光”立项的2025年3月,基础模型的coding能力仍在非常早期阶段,一句话生成应用的效果很不理想。“我们当时确定Coding是很重要的能力,并且会不断向前发展。但到底能发展到什么程度,是在3个月、6个月还是9个月达到用户预期?其实有非常多不确定性。”蔡伟说。

模型能力决定了产品的上限。蚂蚁选择从模型和产品两个方向同时发力——基模团队在这一阶段提升底层代码能力,应用团队负责后训练和产品打磨。而蚂蚁选择做的功能迭代,都是可以长期积累、可复用的模块。当基础模型升级时,所有的后训练优化都能叠加上去,而不是推倒重来。

在DeepSeek时刻之后,各家的AI应用在产品主张上已有明显分化。在当下,品味可能比短期竞争更重要。差异化是AI市场的关键问题——通用AI助手依托强大的基座模型迭代,场上的位置已然拥挤。比如,字节的豆包走更亲民、偏重语音交互等多模态路线;而DeepSeek、Kimi则侧重更专业化的工作场景。

如果用一句话概括蚂蚁的AGI策略,也许是要做AGI时代的二维码。这意味着用最小的成本寻找新技术的PMF(Product Market Fit),切口要小,交付的价值足够集中。“二维码不是我们发明的,但我们是推广最广泛的,把它应用于支付场景,今天的AI应用也面临这样的难题。”何征宇说。

未来,灵光还在规划闪应用生态,包括应用市场、托管平台和分享机制。“我们还是希望降低所有人创作和消费闪应用的门槛。”蔡伟说。短期内,灵光平台计划上线创作收益页面,探索从创作到消费的闭环。

封面来源|AI生成

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用 灵光 蚂蚁集团 AI助手 阿里To 第6张

👇🏻 扫码加入「智涌AI交流群」👇🏻

蚂蚁集团推出AI助手“灵光”:阿里系全面发力To C AI应用 灵光 蚂蚁集团 AI助手 阿里To 第7张

欢迎交流