当前位置:首页 > 科技资讯 > 正文

AI革新工作流:视频与软件领域的双重变革

AI革新工作流:视频与软件领域的双重变革 AI 工作流 视频领域 软件领域 第1张

凌晨三点,我目睹了影视飓风Tim发布的字节即梦Seedance 2.0视频,彻夜难眠。

这是过去一年多来,AI的进步首次让我如此激动。它让我感到震撼。

许多人都在期待视频领域的GPT-3.5时刻,认为那还要等两三年。然而,Seedance 2.0告诉我们,这一时刻已经悄然而至。

Seedance 2.0的强大之处在于,它将运镜、分镜、音画匹配全部AI化,且表现卓越。它理解了光影、透视、镜头语言。

Tim在视频中展示的是控制,是AI对物理世界的完美复刻。

AI的逻辑正变得清晰而简单,它正在疯狂压缩我们的工作流程:从导演、拍摄到剪辑、配乐;从产品经理、开发到测试、交付。

所有中间环节都在逐步减少。

在此文章中,我想探讨AI如何改变工作流程,如何重构我们的工作。

01

视频工业的GPT3.5时刻

Tim在视频中的兴奋之情,我感同身受。

以前我们认为运镜是物理世界的特权,滑轨、摇臂、无人机等设备的操作成本高昂。但Seedance 2.0将这些都转化为参数。

通过图生视频技术,只需一张主角照片和一张场景照片,主角便能在场景中按照指定的运镜方式动起来,多主体一致性惊人。

过去需要铺设轨道、灯光师配合调整光位,现在只需在Prompt里输入一行字即可实现。

Seedance 2.0似乎理解了三维空间的一致性,知道镜头移动时背景物体的视差变化,以及光线变化时影子的长度调整。

它甚至涉足剪辑领域,能识别视频节奏、情绪高点,自动匹配音乐鼓点。对于剪辑师来说,这极大地缩短了工作时间。

声音处理也如此,复杂的声音同步变得轻松。

这种感知上的一致性,是判断“真实”的重要依据,AI做到了。

02

AI正在极致压缩我们的工作流

视频领域的变革只是AI重塑工作流的一个方面,更深刻的变革发生在软件领域和我们的手机屏幕上。

最近使用阿里通义千问点了一次奶茶的经历让我思考了很多。

这预示着App时代的终结,或“即时软件”时代的到来。

现在的互联网体验被“App”形态所限制。点一杯奶茶需要繁琐的步骤和等待。

而通义千问的能力正在接近理想状态:你给出指令,它在后台通过代码和Agent直接调用接口完成交付。

这就是“意图界面”,你输出意图,AI交付结果。中间的UI、交互、跳转都被压缩了。

当AI能力足够强大时,每一个需求都将通过即时生成的“一次性App”来交付。传统的工作流程将被瞬间压缩至1分钟以内。

这引发了根本性的商业追问:既然可以即时生成App满足需求,为何还要下载庞大的App?

现有App生态存在结构性矛盾。每个人的需求都是独特的,AI可以通过即时代码将需求转化为交付结果。这实际上是为用户量身定制的“专属App”,用完即走。

这对互联网巨头是巨大挑战。他们的流量和广告收入将受到威胁。下一个时代的入口可能逐渐清晰。

所有大厂都在争夺那个唯一的“超级Agent”,因为这将决定未来的商业格局。

传统App可能会转向个性化需求的AI内产品。现在的App开发商可能会变成“数据API服务商”,随着交付链路的大幅压缩和成本降低,App需求实际变成了API需求。

最终,传统工作流的消失意味着公司组织的解体。随着AI+人的组合能完成以前需要团队做的事情,庞大的组织变得没有必要了。

这样看来,AI对世界的改变正在加速。