你或许已经见识过那些奇特的人工智能画作:人物手上多了几根手指,脸部细节虽怪但却带着新奇感。
这引发了一个疑问:为何扩散模型,这个只负责「复刻」的工具,还能创作出前所未有的作品?
最新研究给出了答案:
其实,AI的创造力并非「神来之笔」,而是模型架构的副作用。
扩散模型的任务简单明了:将数字噪声还原为训练过的图像。
这好比将一幅画放进碎纸机,直到只剩下细小的灰尘,再将这些碎片重新拼凑起来。
理论上,它应该只生成「复制品」。
然而现实却让研究者大跌眼镜。
DALL·E、Imagen、Stable Diffusion等模型,生成的不是「翻版」,而是全新的图像:
不同元素被组合在一起,构成前所未见的场景。
更令人惊讶的是,这些拼贴并非杂乱无章的色块,而是带有语义的完整作品。
DALL·E 2创作了这些「金鱼在海滩上啜饮可口可乐」的图像。这个由OpenAI创建的程序可能从未见过类似的图像,但它仍然能够自行生成这样的图像。
最新研究中,两位物理学家给出了一个出人意料的答案:
AI的「创造力」,其实是其架构里的副作用。
扩散模型在生成图像时,依赖两条严格的规则:
第一条是局部性。它在绘制过程中,并不会考虑整张画面,而是一次只关注一个小像素「拼块」。
第二条是平移等变性。如果输入图像整体移动几个像素,模型生成的画面也必须同步移动。
这两条机制原本是扩散模型在「去噪」时的限制条件。研究者一度认为这是缺陷,会让模型无法生成完美的复制品。
然而事实证明,正是这种「不完美」,让AI无法完全依赖记忆,必须在局部拼贴中即兴重组。
如果说AI的创造力真是副作用,那要如何证明?
斯坦福大学的研究生Mason Kamb和导师Surya Ganguli进行了一次实验。
他们基于这两条规则构建了一套纯粹的数学系统,命名为ELS方程机(Equivariant Local Score machine)。
这个系统的特别之处在于,它不依赖海量训练数据,也没有任何黑箱深度网络。
这项研究不仅揭示了扩散模型的秘密,还让人联想到生命系统。
Mason Kamb之所以产生这个灵感,是因为他长期研究形态发生——也就是胚胎如何从一团细胞自我组装成器官和肢体。
本文由主机测评网于2026-05-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260542509.html