36氪 - 科技频道 10月13日 08:39
AI画作的“创造力”源于模型架构的副作用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AI生成的图像有时会出现离奇的细节,如多出的手指,却又充满新意。最新研究揭示,这种“创造力”并非凭空而来,而是扩散模型架构的副作用。模型在遵循局部性和平移等变性规则进行“去噪”过程中,这种“不完美”促使其在局部拼贴时即兴重组,从而产生前所未见的作品。斯坦福大学的研究通过ELS方程机数学模型验证了这一点,显示AI创造力与生物体的自组织过程有相似之处,并暗示人类创造力也可能源于对世界的不完整理解和“不完美”的副产物。

💡 AI的“创造力”并非源于神秘灵感,而是扩散模型架构的必然“副作用”。模型在处理图像时遵循两条核心规则:局部性(仅关注像素小块)和Secondly,平移等变性(图像移动时画面同步移动)。正是这种看似“不完美”的约束,迫使模型在局部的图像拼贴中进行即兴重组,从而生成新颖的、前所未见的图像,而非简单的复制品。

✨ 斯坦福大学的研究通过构建“ELS方程机”(Equivariant Local Score machine)这一纯粹的数学系统,成功地用一组公式证明了AI创造力的来源。该系统不依赖深度网络或海量数据,仅基于局部性和平移等变性规则,就能与真实扩散模型生成的结果高度重合,证实了AI的“创造”行为是其架构的直接产物。

🧬 AI的创造力机制与生物体的自组织过程惊人相似。研究者将AI的“局部拼贴错误”(如多长手指)类比于胚胎发育中细胞根据邻居信号做出局部反应,偶尔也会出现发育异常。这表明,AI的“不完美”创造力可能与生命系统通过局部互动产生复杂结构的方式有着本质上的共通之处。

🧠 这一研究也引发了对人类创造力的深刻反思。研究者大胆类比,认为人类的创造力或许也并非凭空产生,而是基于有限经验和记忆的不断拼接、补全和想象。偶尔发生的“错误”或“缺口”,可能恰恰是创新的源泉,正如AI的“副作用”带来了新意。人类和AI的创造力,可能都根植于对世界的不完整理解。

你一定见过那些奇怪的AI画:人物手上多出几根手指、脸部细节怪异,却又带着某种说不出的新鲜感。

这让人产生一个疑问:扩散模型明明只「复刻」,为什么还能画出前所未见的作品?

最新一项研究给出了答案:

其实,AI的创造力并非「神来之笔」,而是模型架构的副作用。

明明只会复制,AI为何还能创作?

扩散模型的任务很简单:把数字噪声还原成训练过的图像。

就像把一幅画放入碎纸机,直到只剩下一堆细小的灰尘,然后将碎片重新拼凑到一起。

照理说,它应该只会生成「复制品」。

可现实却让研究者大跌眼镜。

DALL·E、Imagen、Stable Diffusion这些模型,画出的不是「翻版」,而是全新的图像:

不同元素被组合在一起,构成前所未见的场景。

更令人意外的是,这些拼贴并不是毫无意义的杂乱色块,而是带着语义的完整作品。

DALL·E 2制作了这些「金鱼在海滩上啜饮可口可乐」的图像。这个由 OpenAI创建的程序可能从未遇到过类似的图像,但它仍然可以自行生成这样的图像。

还记得那些在社交平台疯传的「AI多手指人像」吗?

有些图看上去像是超现实主义的画——人物手上莫名其妙多出几根手指,但整体仍旧保持了清晰的结构感。

这类怪异产物,一度被当成笑料,却也让科学家警觉:模型为什么会「即兴发挥」?

Giulio Biroli将这种现象称为「扩散模型的悖论」:

「如果它们真的只是记忆,就不该有创造力;可它们偏偏能画出前所未见的东西」。

那么,AI的创造力到底是从哪里来的?

六指人像背后的「bug奖励」

在最新研究里,两位物理学家给出了一个颇为出乎意料的答案:

AI的「创造力」,其实是它架构里的副作用。

扩散模型在生成图像时,依赖两条严格的规则:

第一条叫做局部性。

它在绘制过程中,并不会通盘考虑整张画面,而是一次只关注一个小小的像素「拼块」。

就像拼图时,你盯着一块颜色相近的小碎片,却不会去想它最终会出现在整幅画的哪个角落。

第二条叫做平移等变性。

如果输入图像整体往左或往右挪动几个像素,模型生成的画面也必须跟着同步移动。

这是它保持图像结构连贯的方式。

这两条机制,本来是扩散模型在「去噪」时的限制条件。

研究者一度认为这是缺陷,会让模型没法生成完美的复制品。

可事实证明,正是这种「不完美」,反而让AI无法完全依赖记忆,必须在局部的拼贴里即兴重组。

这就导致了,手指可能多长了几根,元素可能拼接得有点怪异,但整体画面却意外生出了新意。

也就是说,AI 的创造力,并不是额外设计出来的能力,而是它架构必然带来的副作用。

ELS方程机:创造力的数学化证明

如果说AI的创造力真是副作用,那要如何证明?

斯坦福大学的研究生Mason Kamb和导师Surya Ganguli,进行了一次实验。

他们基于那两条规则构建了一套纯粹的数学系统,命名为ELS方程机(Equivariant Local Score machine)。

这个系统的特别之处在于,它不依赖海量训练数据,也没有任何黑箱深度网络。

它是一套方程,用来预测当噪声一步步被「去除」时,图像会如何拼合。

然后,他们把同一组噪声图像同时输入ELS方程机和真实的扩散模型。

结果令人震惊:ELS方程机生成的结果,与扩散模型的输出平均重合度高达 90%。

在机器学习领域,这几乎是前所未有的精度。

Ganguli感叹道:

「这就像是用一组公式,写下了创造力的来源。」

所谓的「AI创造力」,并不是神秘的灵感,而是局部性与等变性在动态运行中必然产生的产物。

只要满足这两个条件,「创造」就会自动出现。

AI的小失误,揭开人类创造力的秘密

这项研究不仅揭开了扩散模型的秘密,还让人联想到生命系统。

Mason Kamb之所以产生这个灵感,是因为他长期研究形态发生——也就是胚胎如何从一团细胞,自我组装成器官和肢体。

在这个过程中,细胞只是根据身边邻居的信号做出局部反应。

大多数时候,这种自组织能顺利生成一个正常的身体,但偶尔也会出错——比如多长出几根手指。

当Kamb看到扩散模型生成的那些「AI多指人像」时,他立刻联想到胚胎发育里的这种「局部拼贴错误」。

这说明,AI的创造力,本质上和生物的自组织过程,有着惊人的相似。

研究者甚至提出一个更大胆的类比:人类的创造力,也许和AI并没有本质不同。

我们的大脑,并不是凭空冒出灵感,而是在有限的经验和记忆中,不断拼接、补全、想象,最后产出新东西。

正是这偶尔的错误与缺口,反而成为创新的源泉。

正如IBM研究员Benjamin Hoover所说:

「人类和AI的创造力,可能都根植于对世界的不完整理解。」

创造力未必是高高在上的天赋,它也可能是一种副作用,一种「不完美」带来的意外之喜。

当「创造力」能被一组公式写下,人类和机器的界限也愈发模糊了。

或许,真正的灵感,从来不是天才的特权,而是「不完美」的副产物。

研究揭示的,不只是AI的密秘密。

也许是在提醒我们:创造,往往生长于偏差之中。

参考资料:

https://www.wired.com/story/researchers-uncover-hidden-ingredients-behind-ai-creativity/

https://www.quantamagazine.org/researchers-uncover-hidden-ingredients-behind-ai-creativity-20250630/

本文来自微信公众号“新智元”,作者:新智元,编辑:倾倾,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI创造力 扩散模型 局部性 平移等变性 ELS方程机 自组织 AI Creativity Diffusion Models Locality Equivariance ELS Equation Machine Self-organization
相关文章