AI绘图到底是天才画手，还是潘多拉魔盒？

Voicer 1 Years 0

汽车在纽约上空飞行、中世纪居民头戴VR眼镜、宇航员在火星表面跳街舞、大卫雕塑爱打碟、古埃及的动物壁画玩电脑……欢迎来到AI绘图的世界！

输入文字就能得到你想要的任何画面，无论多么荒诞无理的要求，无论定制Edward Hopper画风还是宝丽来胶片，AI都能“使命必达”。

听上去如此梦幻的跨时代工具，似乎是下一波新技术浪潮的抬头，2022也被称为“AI绘图元年”。但是它就像任何一项新技术一样，难免伴随争议：究竟是开启了一个全新绘画时代，还是打开了潘多拉魔盒？无论你做何感想，AI绘图时代已经不可逆转地到来。

️ATTENTION!

以下图片纯属AI虚构

如有雷同，纯属巧合

● “一个人坐在办公室隔间里，用键盘打字，压力重重的样子 - 文艺复兴绘画风格”

● “金毛寻回犬小狗坐在小餐馆里喝咖啡，看起来很忧郁 - Edward Hopper风格”

● “战斗中戴着士兵头盔的猫猫特写 - 二战历史摄影风格，黑白”

● “一张非常细节、复古、颗粒感的纽约市汽车飞行照片（1936 年）”

● “宇航员b-boy组合在火星上表演 - 宝丽来风格”

● “用柯达专业Portra 400胶卷拍摄的外星人肖像 - 由Annie Leibovitz掌镜”

● “米开朗基罗的大卫雕塑正戴着耳机打碟”

● “在太空边缘奔跑，奔向星球，平静，抵达深渊 - 数字艺术风格”

以上这些画面都来自今年最热门的AI绘图平台DALL·E 2（ig：@openaidalle），AI制作它们的时间，可能不到一分钟。

不管是照片还是绘画，你想到什么，AI就能呈现什么。真有那么神奇吗？今天我们就先从DALL·E 2聊起。

创造奇迹的DALL·E 2

到底是何方神圣？

● DALL·E logo

作为AI绘图的大势平台，DALL-E 2的火爆常常让人忘记这个程序今年4月才刚刚推出。

初代DALL-E诞生于去年，在此基础上进行了升级的DALL-E 2图像分辨率更高，对指令的理解也更准确。

● 输入“日出时狐狸坐在田野上的画作，莫奈风格”，左右分别为第一代和第二代AI交出的作业

“DALL-E”的名字来自《机器人总动员》中的机器人瓦力（WALL-E）和超现实主义画家达利（Dalí）。它也确实在功能上兼顾了两者：一个能制作超现实主义图像的机器人。

● 左：半人半机器版达利，右：瓦力版蒙娜丽莎，都由DALL·E 2绘制

在DALL-E 2宇宙里，脑洞有多大，世界就有多大。

你只需要给它一些描述语，包括画面内容、参考画风/画家、形式（摄影/绘画/雕塑）、工具（xx胶卷/镜头），剩下的就全部交给它。

● “古埃及壁画上的动物神明正在使用计算机”

● “数千个星系的超深场天文学照片”灵感来自韦伯望远镜拍下的图像

比如说，可以画成什么样？DALL·E 2官网给出了两组词条：

A组词条描述行为：

“像狂热科学家一样混合化学物质”

“购买杂货”

“从事AI研究️”

B组词条描述风格/状态：

“儿童蜡笔艺术️”

“1980年代在月球上”

“和90年代科技产品一起待在水下”

“浮世绘风格”

……

把A组和B组连词成句，就能得到以下这些奇妙结果。

不过，DALL·E 2不仅会创造图像这么简单，还可以在现成图片上施展魔法。它能在照片里加入任何元素，并对阴影、反射和纹理进行细致处理，让新照片毫无违和感。

比如，我们要求DALL·E 2在美术馆照片上加一只柯基，并要求它分别出现在二次元画作上和三次元展馆里，AI就会自动计算柯基应该出现的样子。

● 在照片的1⃣️2⃣️3⃣️位置分别加入柯基会是什么效果？

当然你也可以丢给DALL·E 2一张画作，让它以此为灵感去创作，《戴珍珠耳环的少女》从此便有了多个模样。

● DALL·E 2版《戴珍珠的少女》

● 给蒙娜丽莎换个莫西干头发型，或是狗狗换小猫，都不在话下

DALL·E 2究竟是如何工作的？

OpenAI曾对此做过视频解释。和大多数AI一样，DALL·E 2的根本原理是算法。通过深度学习大数据，从而掌握内在逻辑。运用在绘图领域的话，就是对海量的主题图片作归类总结。

比如成千上万的“考拉”图片构成一个网络，而“摩托车”图片则是毫不相干的另一个。当用户输入“考拉骑摩托车”时，AI就把这两个网络交叉组合，并从中选出符合要求的图片。

● 如果对DALL·E 2生成的结果不满意，用户可以进行修改，这些修改也在不断帮助DALL·E 2变得更准确

AI绘画正在占领赛博世界

● “机器人梦见电子羊”（cr：Sam Altman）

看到这里，如果你已经迫不及待要上手感受下DALL·E 2，那么很遗憾：DALL·E 2目前并未对大众开放。虽然可以申请加入waitlist，但大多情况下你只能拿着爱的号码牌，陷入无尽的等候。

远水解不了近渴。一款与DALL·E 2极为相似、且对公众开放的免费工具DALL-E mini引起了大家的兴趣。

它与DALL·E 2并无直接关系（现已改名Crayon），功能却基本一致。只要提交描述，它就能在极短时间内生成图片——虽然质感与DALL·E 2存在肉眼可见的差距，但是对于图个新鲜的网友们来说已经足够。

● “泳池派对的黑客”（cr：weirddalle）

● “当黑武士遇见pingu”（cr：weirddalle）

● “腹语人偶版扎克伯格”（cr：weirddalle）

对于更“资深”一点的玩家来说，AI绘画工具早已是任君挑选。除了DALL·E 2，如今受到关注的AI工具还包括：Disco Diffusion、Midjourney、NightCafe、wombo、CogView等等。

这些工具使用起来难易程度不一，比如CogView是国内团队开发的AI工具，仅支持中文搜索。而Disco Diffusion充满代码的界面略为赶客，需要跟着教程一步步操作。

我们也玩了一把！

在AI绘图app“dream by wombo”（可免费下载）上，我们试着以“voicer”为关键词，分别生成了“吉卜力”“蒸汽朋克”“浮世绘”“达利”风格的图片。

● 你最中意哪个？

当然最终效果也大多与AI工具的操作难易程度成正比。CogView生成的图片多少带点AI痕迹，而Disco Diffusion的玩家社区，早已成为浪漫想象力与美术功底的竞技场。

这些原本就是高超画手的用户们，与Disco Diffusion不断磨合调教，创作出无数难以辨别AI绘画痕迹的优秀作品。

● “Father Time”（cr：@noah__proctor）

● 比起DALL·E 2，Disco Diffusion似乎更擅长描绘恢弘的场景（cr：@discodiffusion）

● Disco Diffusion社区用户总结了在同一描述下，各个画家的关键词会生成的不同风格，截图为其中一部分

虽然2022被成为“AI绘画元年”，但“AI绘画”绝非一个全新概念。

只是在这项技术发展早期，人们对此态度并不乐观。而当时算法也还没有那么强大，AI的作品停留在学龄前儿童水平。

● 即便是现在，DALL·E 2还是会生成两个手掌长在一起这样视觉错乱的图片

不过人们对于AI作画的探索并未就此停止，反而奋勇向前。在互联网流行AI作画之前，实体AI作画就已经受到不小的关注。

根据2018年的报道，当年国际机器人艺术大赛的获奖名单里有不少对AI作画的实验。

加拿大艺术家Joanne Hastie制作了由编程控制绘画的机械臂；美国艺术家Pindar Van Arman创造的AI机器人，可以模仿所给图片绘画；泰国机器人实验室CMIT Robotics则可以捕捉人类在绘画时的每一个动作轨迹，机器人通过精准复制动作，从而完整复刻人类的画作。

● Joanne Hastie创造的抽象作品

● 只要人类先画一遍，CMIT Robotics就能近乎完美地复刻

● Van Arman的AI机器人可以根据动态热力图来调整作画

而在四年后的今天，AI机器人作画显然又向前迈进一大步。在今年威尼斯双年展上亮相的AI艺术家“Ai-Da”，是一个拥有机械臂、外形酷似人类的机器人。

和街头画家一样，Ai-Da用机械臂绘制人物肖像，并且配置了和人类对话的智能程序及发声器，可以边作画边与绘画对象攀谈。

● Ai-Da和她的自画像

● Ai-Da的肖像作品

● 世界上第一幅由AI机器人绘制的英国女王肖像

天才画手还是恐怖黑箱？

● “人们戴着VR眼镜的中世纪画作”，由DALL·E 2生成

当AI绘画的实力越来越强劲，问题也随之而来：它会替代传统绘画吗？画手们是否会面临集体失业？

有人对此保持乐观。毕竟虽然AI很强大，但本质上还是依赖人类的原创。它没有独立创造某种风格的能力，而Edward Hopper有。

● 无论美漫风格、数字艺术风格还是宝丽来，DALL·E 2都是参照人类创造出的现有风格

也有人对此非常悲观。虽然高端画师暂时还不会被取代，但是普通画手的创作却可能变得越来越不值钱。

此外，AI绘图还面临着更多问题。

一个月前，DALL·E 2发布了一张AI图片，描述语为“一个男人举起双臂和双手，用手势表示‘这么多’”。

● DALL·E 2生成结果

这张生成图片里的男子，有点像每年苹果发布会上的乔布斯，立刻引发了网友不满：为什么“一个男人”=“年轻的白人男性”？难道AI世界也奉行白人中心主义吗？

但是考虑到DALL·E 2的运行逻辑，它也许只是这个充满偏见的世界的缩影。

它的学习素材都来自人类的图片——如果人类的图片世界本身就充满偏见和刻板印象，又怎么期待AI能根据“A man”的描述语生成黄种人或黑人？或者根据“护士”的描述语，生成男女比例对等的图片？

● DALL·E 2生成的“建筑工人”图片

● DALL·E 2生成的“空乘人员”图片

更严重的问题可能来自法律纠纷。

AI绘图是否会重蹈AI换脸技术的覆辙，被用来做一些侵犯他人权利的事情？如果AI能够随意生成他人的照片，那么狗仔们是否从此有了造谣利器，而政客们也有了陷害对手的把柄？

（亚利桑那州立大学计算机技术教授）

图片版权是一个更难厘清的问题。关于AI生成图片能否商用，各平台众口纷纭。通过学习他人画作生成的作品，是否会侵犯到原作者权益？这给知识产权领域提出了新的思考。

如果AI绘图有一天完全成为大众工具，那么现实与虚拟的边界无疑将被进一步模糊。

● 网友Aditya Ramesh使用DALL·E 2将维多利亚式房屋改造成现代房屋，把特斯拉变成老爷车，把iPhone变成老式电话

200年前摄影技术诞生时，给绘画带来的最大冲击即是“真实感”——我们可以不相信绘画，却不能不相信一张真实的照片。然而200年后蓄势待发的AI绘图技术反其道而行之，进一步消解了图像的真实性。

等到AI绘图真的占领互联网的那一天，我们还能相信眼睛看到的任何一张图片吗？