当前位置：首页 > 科技资讯 > 正文

蚂蚁集团推出AI助手“灵光”：阿里系全面发力To C AI应用

主机测评网
科技资讯
2026-02-19
812

文｜邓咏仪

编辑｜苏建勋

阿里系公司正在To C市场全力出击，AI应用成为新战场。

11月19日，蚂蚁集团正式发布全新应用“灵光”，首批上线三大核心模块：“灵光对话”、“灵光闪应用”和“灵光开眼”。这款产品定位为“全代码生成多模态内容”AI助手，其独特之处在于，AI的回复不再是单纯的文本，每次对话都会交付一个可交互的网页，能够生成图文、3D模型、动画、地图、表格、音视频等全模态内容。

蚂蚁集团推出AI助手“灵光”：阿里系全面发力To C AI应用灵光蚂蚁集团 AI助手阿里To 第1张

△来源：灵光

在“闪应用”功能中，用户只需输入一句自然语言，灵光便能在30秒内生成可编辑、可交互的小应用，支持多种信息输出方式，极大地提升了内容创作的效率。

“灵光开眼”则是一个视觉助手，用户可以通过上传图片或实时拍照，让AI识别并理解图片内容，进而提供相关信息或执行后续操作，例如识别物体、翻译文字等。

11月18日上线后截至发稿，“灵光”下载量已突破100万，攀升至App Store总榜第6位。这一增速甚至超越了多款现象级AI应用。据移动应用分析机构Appfigures数据，近期引发热议的Sora2，达到百万下载量用了5天。

一个有趣的巧合是，就在11月18日，阿里将旗下AI To C应用进行了翻新和整合，以“千问”App的形式重新推出；而蚂蚁的“灵光”仅相隔一天亮相。对于这种时间上的接近，蚂蚁集团CTO何征宇表示，双方并未提前约定，纯属巧合。

回顾过去几年，阿里在To C应用上的投入相对有限。但进入2025年，随着AI领域重回模型竞赛，阿里在To C应用上明显加速“补课”。“千问”上线时，阿里曾高调宣布全力打响AI To C之战，意图抢占新的流量入口。

何征宇透露：“马老师也鼓励我们，让我们冲到App Store榜前列。”这反映出阿里内部对To C AI应用的重视。当前模型能力快速迭代，充满不确定性，押注多个方向是更为稳妥的策略。何征宇比喻道：“如果在沙漠中要找水，我不会把所有人都派往一个方向，而是多路并进。”

两款产品在定位上也有明显区隔。“千问”基于阿里旗舰模型Qwen构建，更像阿里展现模型实力的窗口，擅长处理通用知识问答、长文本写作和复杂的逻辑推理任务。相比之下，“灵光”更侧重于移动端的交互创新：它不仅回答问题，还能通过生成代码渲染多模态内容（图表、界面等），直接交付信息容量丰富的网页；同时押注代码能力，让AI直接帮用户生成小程序。

何征宇补充道，灵光的目标并非成为通用助手入口，也不像豆包等应用主打陪伴功能，而是定位为效率工具。

不做AI陪伴，做信息密度更高的AI助手

与传统通用AI助手相比，灵光最显著的差异在于信息展现形式的创新。它将AI助手的对话形态向前推进了一步——AI的回答不再局限于文字，而是可以画图、做动画、生成3D模型、制作图表，像一个边说边画的老师，让抽象概念变得直观可感。

例如，当用户问“怎么做糖醋排骨”，传统AI助手通常会返回一段长长的文字食谱。但并非所有人都习惯这种长篇大论的交互，灵光则希望用更多模态的形式来展示。据《智能涌现》测试，搜索“怎么做糖醋排骨”后，灵光在数秒内生成了一个色泽鲜亮的糖醋排骨长图，不仅包含详细步骤，还通过不同字体、小标题、图表甚至表情包进行图文并茂的排版，让用户能更快地获取信息。

蚂蚁集团推出AI助手“灵光”：阿里系全面发力To C AI应用灵光蚂蚁集团 AI助手阿里To 第2张

△来源：智能涌现制图

灵光产品负责人蔡伟用了一个类比：“这就像是从email进化到web时代。以前写邮件只能用文字，现在打开网页，有图片、视频、交互按钮。我们希望AI的回答也能达到这种信息密度。”这种“所见即所得”的交互天然更适合人类认知世界的方式，可以应用于更多场景——比如写论文时随口一问，AI直接生成图表；讨论装修时它画出3D户型图；聊到太阳系，一个行星运转的动画就出现在对话框里。

“我们每天都会接触海量信息，很多时候都淹没其中。”蔡伟表示，“以前去搜索引擎搜，它给你一堆链接，需要一个个点进去看。我们更希望用更高效的方式，让信息传递效率最大化。”

优化信息表达方式是第一步。灵光的另一个拳头功能“闪应用”，能根据用户需求自动生成交互式“小应用”。比如用自然语言说“帮我做一个计时器”，30秒后一个可直接使用的计时器应用就生成了，这些小应用可以直接使用、编辑、保存和分享，如同真正的App。

蚂蚁集团推出AI助手“灵光”：阿里系全面发力To C AI应用灵光蚂蚁集团 AI助手阿里To 第3张

△来源：智能涌现制图

这种技术路径的难点并不在于概念——目前顶尖模型厂商都会用这种方式展示AI能力。但关键在于AI生成的网页、App是否真正达到可用状态。这种难度更多体现在模型架构和工程实现上。何征宇透露，相比纯文本输出，代码的膨胀率约为5-6倍。简单来说，对于一个15个字的指令“生成一个居中的蓝色‘提交’按钮”，模型需要生成可实际交互的组件，代码量可能达到几十甚至上百个字符。

蚂蚁集团推出AI助手“灵光”：阿里系全面发力To C AI应用灵光蚂蚁集团 AI助手阿里To 第4张

△来源：智能涌现制图

难度在于，用简单指令让模型生成大量内容（高膨胀率）需要更多计算资源和时间。如何保证模型的高性能和稳定，“灵光”做了大量工程优化。这不仅需要代码生成能力，还需要精准的推理能力（判断信息呈现形式）、工具调用能力（动态生成地图、图表）、数学能力（处理数据可视化），以及对用户意图的深度理解。正因如此，在蚂蚁内部，灵光被定义为“在技术前沿上，在最不稳定的边界上建立产品”。

与其他AI生成web应用的产品相比，灵光的特色是直接在移动端生成可用的成品，工程难度更高。

蚂蚁集团推出AI助手“灵光”：阿里系全面发力To C AI应用灵光蚂蚁集团 AI助手阿里To 第5张

△一句话用灵光制作的“吃什么”应用来源：蚂蚁

DeepSeek解放了大厂做应用的包袱

今年1月DeepSeek R1的发布，成为蚂蚁决定all in AGI的转折点。何征宇用三个词概括当时的心情：兴奋、紧迫感、羞愧。“AGI原来是几百亿、上千亿美金的传说，DeepSeek用很小的资源投入就把它做出来了，这给了我们极大的信心，”何征宇说，“我们也在反思，以往很多技术积累没有很好地整合起来，让用户直接感受到价值。”

春节后，蚂蚁迅速集结资源，成立了独立的AGI组织“Inclusion AI”，采用Research（研究）、Engineering（工程）、Producting（产品）三位一体的架构。

战略上，蚂蚁做出明确选择：并不意在争夺AI通用助手的入口——比如主打AI陪伴的豆包，希望让用户消耗时间，而是先聚焦在更细分的方向：coding能力 + 全模态，定位效率工具。围绕这一目标，蚂蚁做了不少取舍。例如，今年模型厂商纷纷竞争推理能力，但灵光并没有选择嵌入到产品中。“DeepSeek已经做得足够好了，能帮大家解决很多问题，我们没有必要再去复刻。”蔡伟表示。

蚂蚁赌的是基础模型不断上涨的代码能力。在“灵光”立项的2025年3月，基础模型的coding能力仍在非常早期阶段，一句话生成应用的效果很不理想。“我们当时确定Coding是很重要的能力，并且会不断向前发展。但到底能发展到什么程度，是在3个月、6个月还是9个月达到用户预期？其实有非常多不确定性。”蔡伟说。

模型能力决定了产品的上限。蚂蚁选择从模型和产品两个方向同时发力——基模团队在这一阶段提升底层代码能力，应用团队负责后训练和产品打磨。而蚂蚁选择做的功能迭代，都是可以长期积累、可复用的模块。当基础模型升级时，所有的后训练优化都能叠加上去，而不是推倒重来。

在DeepSeek时刻之后，各家的AI应用在产品主张上已有明显分化。在当下，品味可能比短期竞争更重要。差异化是AI市场的关键问题——通用AI助手依托强大的基座模型迭代，场上的位置已然拥挤。比如，字节的豆包走更亲民、偏重语音交互等多模态路线；而DeepSeek、Kimi则侧重更专业化的工作场景。

如果用一句话概括蚂蚁的AGI策略，也许是要做AGI时代的二维码。这意味着用最小的成本寻找新技术的PMF（Product Market Fit），切口要小，交付的价值足够集中。“二维码不是我们发明的，但我们是推广最广泛的，把它应用于支付场景，今天的AI应用也面临这样的难题。”何征宇说。

未来，灵光还在规划闪应用生态，包括应用市场、托管平台和分享机制。“我们还是希望降低所有人创作和消费闪应用的门槛。”蔡伟说。短期内，灵光平台计划上线创作收益页面，探索从创作到消费的闭环。

封面来源｜AI生成

蚂蚁集团推出AI助手“灵光”：阿里系全面发力To C AI应用灵光蚂蚁集团 AI助手阿里To 第6张