人工智能美学和创造力的人类中心主义神话 人工美学 从21世纪初开始,计算、数据分析以及人工智能(AI,Artificial Intelligence)逐渐进入到美学领域,被用于美术、音乐、书籍和电影的推送系统,或用于图像和视频的自动编辑。人工智能也越来越多地用于生成新的人工作品,包括艺术品、音乐、设计和文本。譬如,2016年一个深度学习算法通过分析已知的346幅伦勃朗(Rembrandt)画作来学习伦勃朗的风格,然后被要求生成一幅新的肖像画。生成的结果竟惊人地神似伦勃朗的真迹。同一年,巴黎的索尼电脑科学实验室(Sony Computer Science Laboratories)开发出了一个叫“深度巴赫”(DeepBach)的神经网络,可以生成巴赫风格的合唱康塔塔。①自此之后,其他的音乐生成算法也被开发出来——最近就有许多Youtube博主对观众发出做音乐“图灵测试”的挑战,让观众区分人工智能和人类作者创作的音乐。②对于经过一定音乐训练的人来说,这个挑战似乎非常简单,但是对于没有经过训练的听众来说就不那么容易了。2019年,一个人工智能仅使用一款新型智能手机的计算能力就完成了舒伯特的《未完成交响曲》(Unfinished Symphony[n.8,1822])。③不过,它也有一位作曲家的协助。作曲家会从人工智能生成的一系列旋律中挑选出最好的。同年,德国电信公司组织了一个由人工智能专家和国际音乐家组成的团队,完成了贝多芬未完成的《第十交响曲》以纪念他250周年诞辰。这个完成的《贝多芬第十交响曲——人工智能版》(Bethovon X-The AI project)于2021年在波恩首演。这些案例的情况都是将已经存在的风格输入电脑,然后生成和这些风格相符的变体,并尝试引入一些创新。它们并不会生成全新的歌曲或风格。相反,它们也许可以被看作是我们所谓的“计算机风格”的实例。
《贝多芬第十交响曲——人工智能版》海报 当一台机器绘出了一幅伦勃朗风格的作品,写出了一曲巴赫的奏鸣曲,或者完成了贝多芬的交响乐的时候,我们不会说它们是原创的、真正的艺术,而只会称之为人类文明中现存文化产品的精妙模仿和复制品。我们所要面对的是关于创造力本质的老问题:什么样的创意重组、精妙模拟或者概念的延续可以被认为是原创性的标志?如果一件艺术品或者一幅绘画是算法、设备或者其他技术发明的产物,而它们只是承继和重新阐释了设计师或者艺术家的意图,我们应该赋予谁作者身份?因为生产链有第三方软件日益复杂的参与(比如照片和视频运用很广泛的特效和滤镜或者一些修图算法),我们应该怎么确定创造性的来源以及作者的身份呢?人工智能艺术先驱之一、艺术家马里奥·克林格曼(Mario Klingemann)说:“如果你听到某人在弹钢琴,那你会不会问——这架钢琴是艺术家吗?”答案是不会,同理,对于人工智能艺术也是如此。因为它只是一个很复杂的机械装置,所以它的角色并不会改变。从这个角度来看,人工智能在艺术领域的应用可以看作是美学延展的一个简单实例,是在人类艺术家控制之下使用新的、明显更复杂精巧的设备。人工智能系统是艺术家和程序员的工具,是在创造过程中可以使用的更为精巧的仪器。但是,我们仍然会着迷于一个想法,即我们可以见证人工智能自主创造力在美学领域的出现,我们仍然有一种将真正的人工智能看作是自主和智能行为的表现的原初信念。 论美学“图灵测试”:我们到底对“美学”机器有何希冀? 2002年,普林斯顿大学的一名本科生将一个所谓的生成对抗网络(GAN)用于她的毕业设计,生成了一幅能够通过视觉图灵测试(Turing Test)的中国传统山水画。④图灵测试一开始是由艾伦·图灵(Alan Turing,1912-1954)开发的一套能够认定人工系统具有类人智能的标准。但是,我们不会说这个普林斯顿大学学生开发的生成对抗网络已经达到了人类的智力水平;它只是一个足够复杂、能够生成看起来像是人造的图像的程序罢了。而这给之后的讨论造成了许多概念上的混淆。 一方面,像“智能”或是“有创意”这样的概念看起来过于直观和直白,因为每个人都可以声称自己能够识别智能和创意行为。另外一方面,当我们尝试给这些概念一个能够奏效且可操作的定义的时候,我们会发现它们是多么地难以捉摸。这个问题将艾伦·图灵放在了路德维希·维特根斯坦(Ludwig Wittgenstein,1889-1951)的对立面,维特根斯坦认为我们在理解像“智能”这样的术语的意义时,需要先阐明我们在概念和语言上的习惯。图灵曾经在1939年参加维特根斯坦关于数学哲学的讲座,而维特根斯坦肯定也知道图灵关于机器思考的论文。有趣的是,维特根斯坦通过下文这样的形式表达了他的观点,这是从他的《哲学研究》(Philosophical Investigations,1953)中摘录的一段: 机器会思考么?——它会疼么?——该把人体叫作这样一个机器么?它可是极限接近于这一台机器啊?但机器不会思想!——这是一个经验命题?不是。只有说到人,以及和人相似的东西,我们才说它思想!我们还这样说布娃娃,我们还这样说精灵!把“思想”一词当作工具看!(Wittgenstein,1953:359-560)⑤ 从维特根斯坦的观点看,因为词语也是工具,我们需要问自己,在何种可能的情况下——如果有的话——我们会使用像“思考”(或者“智能”,又或者“创意”)这样的概念去描绘一个非人类的、人造的实体。 图灵测试是一种验证机器在计算机界面的言说是否能像人类一样通过测试的方法。因此,这个测试将模仿人类行为视为一个智力指标,因而优先关注口语交流和对话的生成。一方面图灵的标准看起来相当合理:如果不能在对话中将某物与人类区分开来,为什么我们不能说它是有智能的呢?但另一方面,人类其实不愿意轻易将智能的标志赋予非人类的实体。在过去,人们认为一台机器如果能在国际象棋比赛中击败特级大师(grandmaster),就可以被视为真正的人工智能。而这在1997年变为了现实,这一年“深蓝”(DeepBlue)打败了世界冠军加里·卡斯帕罗夫(Gary Kasparov)。也就是在这时,国际象棋被定义为了一种纯粹组合和计算的游戏,而不再是对智力的真正考验。这个门槛又变到了围棋等其他的项目上,因为它们被认为更复杂,更依赖创造性的直觉。但是在2016年,谷歌的“阿尔法狗”(AlphaGo)打败了世界冠军李世石(Lee Sedol),可是我们还是不认为它达到了真正的“智能”。再把目光放到聊天机器人上,根据图灵1950年的论文⑥,到20世纪末机器将能够在五分钟的会话后蒙骗到三分之一的人。在2014年,33%的人认为聊天机器人“尤金·古斯特曼”(Eugene Goostman)是真人,成功地通过了图灵测试(需要注意的一点是,“尤金·古斯特曼”的程序模拟的是一个来自乌克兰敖德萨的健谈而叛逆的13岁少年)。