近期,一张「中国AI vs 美国AI」的对比图在网络上爆火,正值OpenAI与Anthropic相继发布新模型之际,中国这边也不甘落后,元宝与千问的红包大战正酣,这一幕充满了讽刺意味。
然而,这个笑话的保质期并不长,很快就被字节和快手相继发布的新一代视频模型所赶超。这些模型在外网引发了广泛关注,再次加深了外国人对中国AI实力的「刻板印象」。
钱钟书先生《围城》中的那句「寰宇就是一个围城,里头的人眼馋外边,外边的人羡慕里头」恰如其分地描述了当前AI领域的现状。字节的Seedance 2.0无疑是一个巨大的突破,它彻底改变了视频生成的方式。尽管发布时间较晚,但由于字节的巨大声量,其评价迅速增长。与此同时,快手的Kling 3.0也表现出色,其强大功能已经让我烧掉了三个账号,绝非强行塑造「双星闪耀」的概念。
这两个模型的发展方向也各不相同。Seedance 2.0更侧重于Sora 2的运镜、理解、模仿、转场等效果,极大促进了短视频创作者生态的发展;而Kling 3.0则更偏向于Runway代表的影视化、真实化和工业化能力,目标直指专业导演和工作室。因此,博主和用户自然对Seedance 2.0更有好感,但这并不妨碍我对Kling 3.0抱有高期待。它正在抹平真实与虚拟之间的界限,尽管短期内路线有所差异,但长期来看,大家终将殊途同归,全面替代现有的视频生产管线。
相比「闷声发大财」的AI Coding,多模态才是AI接近普通人的破圈手段。去年ChatGPT和Gemini的「翻倍级」增长,分别得益于GPt-4o的「吉卜力风潮」和Nano Banana的降维打击。这些都是多模态在发挥作用的实例。
今年,战场继续前移。除了Seedance 2.0和Kling 3.0外,马斯克也在这个月发布了Grok专有的视频模型Imagine 1.0,谷歌则发布了挑战游戏引擎市值的Genie 3。大家是否发现了共同点?
没错,都是视频。
人是视觉动物,视频所传递的信息量远超文本和语言。以往视频模型的主要短板在于能力不足、训练难度大以及生成质量参差不齐。但到了2026年,这些瓶颈似乎即将被打破。威尔·史密斯吃意大利面的场景仿佛还在昨天,但时间已经飞速前进,技术的进化速度令人惊叹。
再回到那个对比图。如果说中国AI公司渴望赶上Claude Opus 4.6和GPT-5.3-Codex的步伐,这确实不无道理。但这不仅仅是技术差距的问题,中美的商业环境决定了AI渗透的发力点不同,因此爆发点也显得不均匀。
表面上看,美国的AI巨头都在发力AI Coding,这确实容易货币化。但深入思考后你会发现,Coding自由的终点是什么?是工具、软件甚至系统的零成本化。因此,美股里的SaaS赛道突然崩塌。
SaaS是一个积累了近30年的万亿级规模市场,非常适合用来回应「AI投入太大、回报不足」的质疑。而眼见证这个时代的残酷美学——大厦将倾的此景,实在令人感慨。
王慧文在即刻上发了一条非常精辟的动态(图3):
「我们曾经以为,中国SaaS会像美国SaaS那么值钱,现在看,美国SaaS会像中国SaaS这么不值钱。」
大佬就是大佬,几句话就说到点上了。中国的AI公司在产业化方面面临诸多困难,尤其是面对美国同行的高歌猛进。原因很简单:你不可能去替代一个不存在的市场,拿走一份不存在的产值,讲述一篇不存在的故事⋯⋯
但在多模态尤其是视频模型方面,情况就不同了。中国互联网在短视频、直播和创作者生态方面处于全球领先地位。这里存在巨大的市场、产值和故事可以被AI接上的潜力。因此字节和快手对视频模型的投入动力完全不输美国大厂。
快手Kling有先发优势且ARR涨势迅猛在海外处于第一梯队;字节则后来居上其多模态能力对豆包的留存拉动明显更不用说其GPU储备量在国内大厂中名列前茅。真想做成事情绝非难事。
昨晚许多字节的朋友都在转发梁汝波和张楠用AI合拍的视频用来宣传搭载了Seedance 2.0的即梦张楠的性格搞这个不意外但梁汝波也参与了转发这确实少见。
晚点LatePost的稿子里提到字节内部期待AI这波能跑出下一个抖音且完全用字节的方法去做选择——数据决定地位这意味着赛马机制已经启动目前至少有三拨势力在争这个「太子」:
字节这家公司的活力之高和欲望之强在大厂里真的很少见丝毫看不到老化的痕迹。
本文由主机测评网于2026-04-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260435484.html