当前位置:首页 > 科技资讯 > 正文

AI创造力的意外之源:扩散模型架构副作用的创新启示

想必您曾见过那些由AI生成的奇特图像:人物手部多出几根手指、面部细节扭曲,却散发着一种难以言喻的新颖感。

这引发了一个深刻疑问:扩散模型本质上只是「复制」训练数据,为何能创作出前所未见的作品?

最新研究揭示了惊人答案:

实际上,AI的创造力并非「灵光一闪」,而是模型架构设计带来的副产品。

仅会复制的AI,如何实现创造性突破?

扩散模型的核心任务极为简单:将数字噪声逐步还原为训练过的图像。

类似于把一幅画作碎成纸屑,直至化为微尘,再尝试将碎片重新拼合。

理论上,它应该只能产出「复制品」。

但现实却令研究者震惊不已。

DALL·E、Imagen、Stable Diffusion等模型,生成的并非「翻版」,而是全新图像:

不同视觉元素被巧妙组合,构成从未存在的场景。

更令人惊奇的是,这些组合并非杂乱无章的色块,而是蕴含语义的完整作品。

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第1张

DALL·E 2生成了这些「金鱼在海滩上啜饮可口可乐」的图像。这个由OpenAI开发的程序可能从未接触过类似画面,却能自主创作出这样的内容。

还记得那些在社交媒体上疯传的「AI多手指人像」吗?

有些图像仿佛超现实主义画作——人物手部凭空多出几根手指,却依然保持整体结构的连贯性。

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第2张

这类怪异输出,一度被视为笑谈,却也引起了科学家的深思:模型为何会「即兴发挥」?

Giulio Biroli将这一现象称为「扩散模型的悖论」:

「如果它们仅仅是记忆,就不该具备创造力;但它们偏偏能生成前所未见的内容」。

那么,AI的创造力究竟源自何处?

多指人像背后的「缺陷馈赠」

在最新研究中,两位物理学家提出了一个出人意料的解释:

AI的「创造力」,实际上是其架构内在的副作用。

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第3张

扩散模型在生成图像时,遵循两条严格规则:

第一条称为局部性。

它在绘制过程中,并不全局考量整个画面,而是每次仅关注一个微小的像素「拼块」。

犹如拼图时,你只专注于眼前的一块碎片,而非其在整个图案中的最终位置。

第二条称为平移等变性。

如果输入图像整体向左或向右移动若干像素,模型生成的画面也必须同步偏移。

这是维持图像结构连贯性的关键机制。

这两条规则,原本是扩散模型在「去噪」过程中的约束条件。

研究者曾认为这是缺陷,会阻碍模型生成完美复制品。

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第4张

但事实证明,正是这种「不完美」,迫使AI无法完全依赖记忆,必须在局部拼贴中进行即时重组。

从而导致了手指可能多长几根、元素拼接略显怪异,但整体画面却意外涌现新意。

换言之,AI的创造力,并非刻意设计的能力,而是其架构必然衍生的副产品。

ELS方程机:创造力的数学验证

若AI创造力真是副作用,如何证明?

斯坦福大学研究生Mason Kamb与导师Surya Ganguli,进行了一项实验。

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第5张

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第6张

他们基于这两条规则构建了一套纯数学系统,命名为ELS方程机(Equivariant Local Score machine)。

该系统的独特之处在于,它不依赖海量训练数据,也无任何黑箱深度网络。

它仅用一组方程,预测当噪声逐步被「清除」时,图像将如何拼合。

随后,他们将同一组噪声图像同时输入ELS方程机与真实扩散模型。

结果令人震撼:ELS方程机生成的结果,与扩散模型输出的平均重合度高达90%。

在机器学习领域,这几乎是史无前例的精度。

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第7张

Ganguli感慨道:

「这仿佛用一组公式,书写了创造力的起源。」

所谓「AI创造力」,并非神秘灵感,而是局部性与平移等变性在动态运行中必然产生的产物。

只要满足这两个条件,「创造」便会自动涌现。

AI的失误,映照人类创造力的本质

这项研究不仅揭示了扩散模型的秘密,更令人联想到生命系统。

Mason Kamb的灵感源自其长期研究形态发生——即胚胎如何从一团细胞自我组织成器官与肢体。

在此过程中,细胞仅根据邻近细胞的信号做出局部反应。

多数时候,这种自组织能形成正常躯体,但偶尔也会出错——例如多长手指。

当Kamb看到扩散模型生成的「AI多指人像」时,他立即联想到胚胎发育中的「局部拼贴错误」。

这表明,AI的创造力,本质上与生物的自组织过程惊人相似。

研究者甚至提出更大胆类比:人类的创造力,或许与AI并无本质区别。

AI创造力的意外之源:扩散模型架构副作用的创新启示 扩散模型 创造力 局部性 平移等变性 第8张

我们的大脑,并非凭空迸发灵感,而是在有限经验与记忆中,持续拼接、补全、想象,最终产出新事物。

正是偶尔的错误与缺口,反而成为创新的源泉。

正如IBM研究员Benjamin Hoover所言:

「人类与AI的创造力,可能都植根于对世界的不完整理解。」

创造力未必是高高在上的天赋,它也可能是一种副作用,一种「不完美」带来的意外惊喜。

当「创造力」能被一组公式描述,人类与机器的界限也愈发模糊。

或许,真正的灵感,从来不是天才的特权,而是「不完美」的副产品。

研究揭示的,不仅是AI的秘密。

更是在提醒我们:创造,往往孕育于偏差之中。

参考资料:

https://www.wired.com/story/researchers-uncover-hidden-ingredients-behind-ai-creativity/

https://www.quantamagazine.org/researchers-uncover-hidden-ingredients-behind-ai-creativity-20250630/