当前位置:首页 > 科技资讯 > 正文

爱诗科技完成超6000万美元B轮融资,登顶AI视频生成新高度

作者|周鑫雨

编辑|苏建勋

《智能涌现》独家获取信息,近期,人工智能视频生成领域的创新企业「爱诗科技」正式宣布完成B轮融资,融资金额突破6000万美元大关。

此轮融资由科技巨头阿里巴巴牵头投资,达晨财智、深创投、北京市AI基金、湖南电广、巨人网络以及Antler等机构共同参与。据悉,这一融资规模刷新了国内视频生成行业的单笔最高纪录。

爱诗科技在融资与业务增长上的强劲势头,成为当前国内视频生成赛道高速发展的一个典型代表。目前,其旗下核心产品PixVerse的全球用户数量已突破1亿,而在短短4个月前,这一数字仅为6000万。

商业化进程同样加速推进。爱诗科技创始人兼首席执行官王长虎向《智能涌现》透露,公司通过产品订阅获得的收入现已能够覆盖运营成本。

另一家视频生成领域的领先者快手的财务报告显示,2025年第二季度,其旗下的可灵AI业务营收已超过2.5亿元人民币,占快手总营收的4.8%。

然而,回溯一年前,由于Sora的横空出世以及大型科技公司的纷纷入局,AI视频生成创业一度面临市场质疑。

《智能涌现》曾在《杨立昆、朱啸虎不看好的赛道,正在海外悄悄赚钱》一文中提及,2024年初,许多投资人的普遍看法是:视频模型的投资回报率短期内难以转正,初创企业可能像语言模型赛道一样,被少数几家大厂淘汰。

成立于2023年4月的爱诗科技,深刻体会过市场的冷遇:当时的视频生成技术尚未形成共识,创业公司资源紧张,创始人王长虎和谢旭璋也并非资本追捧的“天才少年”类型。

在爱诗科技CEO王长虎看来,公司能够重返行业焦点,恰恰源于对“不变”原则的坚守:

自创立之初,团队就将视频生成视为确定性机遇,从自主研发模型到产品落地,始终聚焦主线;

在产品方向上,C端市场一直是团队看好的领域——爱诗推出的AI视频创作平台PixVerse(面向海外)和拍我AI(面向国内),致力于为普通用户提供低门槛的AI视频创作工具。

其特效模板通过“提示词封装”技术,将复杂的视频制作流程简化为“一键生成”操作。

2025年8月27日,爱诗发布了新一代视频生成模型PixVerse V5,在生成速度、视觉质量、指令遵循能力等方面进行了显著优化。

同步上线的还有一款面向C端用户的“Agent创作助手”,即使没有视频创作经验的用户,也能借助现有模板库和简单指令,轻松制作出一段视频。

爱诗科技完成超6000万美元B轮融资,登顶AI视频生成新高度 AI视频生成 B轮融资 爱诗科技 PixVerse 第1张

△通过“Agent创作助手”与内置模板创作视频。图源:作者试用

爱诗科技完成超6000万美元B轮融资,登顶AI视频生成新高度 AI视频生成 B轮融资 爱诗科技 PixVerse 第2张

△“拍我AI”生成的宠物主题视频。图源:作者试用

从市场冷遇到斩获最大单笔融资,爱诗的成功秘诀何在?

实现逆势崛起,爱诗究竟做对了哪些关键决策?王长虎总结为两大核心:

第一,无论是用户获取还是团队扩张,都避免盲目烧钱。

王长虎表示,过去半年,爱诗用户规模从6000万跃升至1亿,相较于大规模市场投放,依靠产品自身实力实现智能增长,是更为高效的战略。例如,2024年11月推出的“毒液变身”等展示模型能力的特效模板,至今已为PixVerse带来了超过百亿次的曝光。

第二,不盲目追求模型参数规模的无限扩大。

在爱诗科技看来,Scaling Law(缩放定律)虽仍适用于视频生成模型,但对于资源有限的创业公司而言,模型训练不容有失,试错成本远高于大型企业。

这意味着,每一次模型训练,爱诗都必须在保证质量的前提下控制成本,同时规划更精细的迭代路径。

爱诗的经验是,每一次模型和产品的升级,都必须紧密贴合用户的实际需求。

例如,团队观察到,无论在专业创作还是短视频场景中,大多数单镜头视频长度都在10秒以内,广为传播的视频也多在10秒左右,“60秒一镜到底”并非用户核心诉求。

因此,爱诗将资源集中投入于提升视频生成速度、画质以及指令遵循优化上。

基于“分布匹配蒸馏”技术,爱诗在行业内率先将视频生成速度从“分钟级”压缩至“秒级”。为确保生成质量,团队在训练中引入特征自约束损失函数,稳定了视频画质。

这两点经验共同指向一个方向:创业公司如何高效利用有限资源,构建自身竞争优势。

然而,资源限制也带来了一些遗憾。王长虎最为惋惜的是未能全球最早训练出对标Sora的模型。

“早期阶段,我们错过了一些融资机会。”他告诉《智能涌现》,“但回顾过去,我们应该更积极地储备资金,尽可能获取投资,以更早将模型推向市场。”

当然,时机对创业者同样至关重要。

2023年4月,爱诗成立于视频生成技术尚未成为共识的时期。

非共识创业的挑战显而易见。王长虎回忆,当时市场上缺乏高性能视频生成模型,小型创业公司常被质疑是否具备训练此类模型的能力和资源。

但另一方面,非共识创业也让爱诗避免了行业FOMO(错失恐惧症)情绪的干扰。王长虎指出:“这反而使我们在早期处于更健康的状态:估值与实力匹配,发展节奏更为稳健,而非被高估值所绑架。

此外,先发优势带来了技术和产品上的领先。2024年下半年,随着Sora使DiT架构成为视频生成领域的技术共识,海内外众多大厂和初创公司才陆续入局,发布视频生成模型。

彼时,PixVerse的全球用户规模已达1000万,并实现了规模化收入。近期发布的V5模型,在独立测评平台Artificial Analysis的最新测试中,登顶全球图生视频榜单,并在文生视频榜中位列全球第二。

爱诗科技完成超6000万美元B轮融资,登顶AI视频生成新高度 AI视频生成 B轮融资 爱诗科技 PixVerse 第3张

Artificial Analysis 最新测试结果

爱诗科技完成超6000万美元B轮融资,登顶AI视频生成新高度 AI视频生成 B轮融资 爱诗科技 PixVerse 第4张

Artificial Analysis 最新测试结果

视频生成领域,或将涌现“Canva”与“Photoshop”级产品

视频生成赛道是否真正存在创业公司的机会?这是王长虎和团队创业以来最常面对的问题。

爱诗几乎用整个2024年来回答这一问题。那一年,他们经历了Sora的冲击,以及快手、字节等大厂的激烈竞争。

但事实证明,在这一新兴赛道,机会并非强者专属。2024年7月,紧随可灵AI之后,爱诗发布了PixVerse V2,成为国内首家推出可实际应用DiT视频模型的创业公司。

对于未来格局,王长虎判断:AI技术并非简单替换短视频平台中的现有内容,而是带来了全新的交互范式:

“一旦视频能够实现实时或准实时生成,用户在观看内容的同时,即可即时调整并生成新内容。”在他看来,视频行业全新的交互逻辑,注定会像“短视频孕育抖音”一样,催生新的国民级应用。

2025年,视频生成赛道的竞争已从“复刻Sora”转向产品差异化角逐。

一个明显趋势是,视频生成领域的参与者正逐渐分散至风格、用户群体、功能各异的细分市场。

例如,前光年之外联合创始人曹越创立的Sand AI,跳出了主流的DiT技术路线,采用自回归方法,实现了视频的无限扩展生成。

爱诗聚焦于没有视频制作技术的普通用户。王长虎表示,由于视频创作门槛高、工具供给不足,目前95%人群的视频创作需求尚未被满足。

他将当前产品类比为视频生成领域的Canva,“更大众化、更平等”,而其他产品则类似于Photoshop和Figma,服务于专业创作者。

从外部视角看,2024年11月以来,“美人鱼变身”“毒液变身”等特效模板的全球爆火,似乎是爱诗押中的幸运一步。

爱诗科技完成超6000万美元B轮融资,登顶AI视频生成新高度 AI视频生成 B轮融资 爱诗科技 PixVerse 第5张

△“拍我AI”提供的视频生成模板。图源:“拍我AI”官网

但王长虎认为,特效模板的走红是必然趋势,“模板能极大降低用户创作门槛,是团队自然衍生的决策。”

如今,为C端用户提供视频生成模板已成为爱诗产品生态的重要组成部分。社区中不仅有官方模板,还涌现了大量用户自发创作的模板。例如,拍我AI上一款用户制作的“衣柜变装”模板,获得了超百万浏览量。

产品定位决定了爱诗当前最关注的指标:用户增长、留存率以及社区活跃度(如UGC模板创作)。

视频生成行业的发展远未定型。知名风投机构BVP在2025年AI报告中指出,未来一年内,视频生成领域的格局很可能像当前语言模型赛道一样趋于明朗。

谁能持续覆盖成本、稳步扩大用户规模,谁就更有可能留在竞争牌桌上。

爱诗科技完成超6000万美元B轮融资,登顶AI视频生成新高度 AI视频生成 B轮融资 爱诗科技 PixVerse 第6张

欢迎交流!