一、算法时代的写作 我们所处的时代比科幻还要科幻。 2019年春节,原《收获》编辑、作家、科技创业者走走告诉我,他们用名叫“谷臻小简”的AI软件“读”了2018年20本文学杂志刊发的全部771部短篇小说,并以小说的优美度,即情节与情节之间的节奏变化的规律性,以及结构的流畅程度对这些作品进行打分。 截至2019年1月20日,分数最高的始终是莫言的《等待摩西》。然而,21日下午3点左右,参与此次评选的《小说界》和《鸭绿江》杂志的作品赶到,新增80部短篇小说。下午7点20分,情况发生了改变。AI最终选定的年度短篇是我发表在《小说界》2018年第四期的《出神状态》(收录于本书),《等待摩西》被挤到了第二位,差距仅有0.00001分。 更不可思议的是,在我的《出神状态》里恰好也用到了由AI软件生成的内容,这个算法是由我原来在Google的同事、创新工场CTO兼人工智能工程院副院长王咏刚编写的,训练数据包括我既往的上百万字作品。 “一个AI,何以从771部小说中,准确指认出另一个AI的身影?”走走在随榜单一同发布的《未知的未知——AI榜说明》一文中发问。确实,从使用的计算机语言、算法、标准都完全不同的两个AI,究竟是以什么样的方式建立共振,这给这次偏爱理性与逻辑的事件披上了神秘主义的色彩。 回到最初,第一次有和AI合作的想法还得追溯到2017年下半年。其实机器写作并不是新鲜的事情,包括微软小冰写诗,自动抓取信息生成金融新闻的程序等等,但是作为高度复杂的文学金字塔顶端,小说所要求的逻辑性、自然语言理解能力,以及对于人物、情节、结构、文法不同层面的要求,之前的AI必然尚未达到这样的能力。王咏刚听了我的想法之后也非常兴奋,他本身也是个科幻迷和科幻作者,还出过一本叫《镜中千年》的长篇科幻小说,他很爽快地答应了,觉得这是一个非常有趣的实验。 巧的是,2017年也正是Google发布重注意力机制与Transformer算法,并开启了机器学习在自然语言处理(NLP,Natural Language Process)领域狂飙突进的历史性时刻,如今回头看,一切似乎冥冥之中自有机缘。 编写深度学习的写作程序其实不难,Github上有一些现成的代码可以用,如CNN(Convolutional Neural Networks,卷积神经网络)与LSTM(Long Short-Term Memory Network,长短期记忆网络)模型。我们用CNN对语料(小说文本)进行特征提取,然后将输出的特征图谱(feature map)映射为序列矢量输入到LSTM网络,便能够训练出能够模仿人类写作的算法模型。 难的是如何通过调整参数让它写出来的东西尽量接近我们现有对于文学的理解和审美。输入了上百万字的陈楸帆作品之后,AI程序“陈楸帆2.0”可以通过输入关键词和主语,来自动生成每次几十到一百字的段落,比如在《出神状态》中的这些句子: 游戏极度发烫,并没有任何神秘、宗教、并不携带的人,甚至慷慨地变成彼此,是世界传递的一块,足以改变个体病毒凝固的美感。 你露出黑色眼睛,苍白的皮肤如沉睡般充满床上,数百个闪电,又缓慢地开始一阵厌恶。 你再次抬头,把那些不完备上呈现的幻觉。可他离开你,消失在晨曦中。 王咏刚告诉我,经过大批量语料学习之后,AI程序已逐渐习得了我的写作偏好——在使用祈使句时爱用什么句式、描写人物动作时喜欢用什么样的形容词或者副词等等。在掌握了关于语句的统计规律后,在写作环节,AI程序便会从大量的语料中随机找到一些词,并把这些词汇按照写作规律拼接在一起,形成句子。比起文学,它更像是统计学与数学。 第一次看到AI程序写出来的句子时,我觉得既像又不像自己写的,有先锋派的味道,像是诗歌又像俳句或者佛谒,更像是梦呓。可以肯定的是,它们没有逻辑性,也无法对上下文的剧情和情绪产生指涉性的关联,为了把这些文字不经加工地嵌入到人类写作中去,我必须做更多的事情。 所以最后我围绕着这些AI创作的语句去构建出一个故事的背景,比如《出神状态》中人类意识濒临崩溃的未来上海,比如《恐惧机器》中完全由AI进行基因编辑产生的后人类星球,在这样的语境中,AI的话语风格可以被读者接受被视为合理的,而且是由人类与他者的对话情境中带出,从认知上不会与正常人类的交流方式相混淆,因此它在叙事逻辑上是成立的,是真实可信的。 这次AI与人共同创作的实验性并不在于机器帮助我完成写作,而在于最后我发现,是我帮助机器完成了一篇小说的写作。而到了2020年的“共生纪”人机共创科幻写作实验中,我们不仅使用了更强大、更先进的GPT-2模型,能够生成更自然流畅、逻辑更圆融自洽甚至更“似人”的表达方式,更是邀请了鲁迅文学奖得主小白在内的十几位作者共同参与这场实验。 这样的实验令我们产生对于文学或写作本质更深入的思考。它不单单是人+机器,而是人与机器的复杂互动,其中对于“作者性”(authorship)的探讨重要性超出了故事与文本本身,可以称之为行为艺术。 当然这只是一个开始,未来的机器将更深入地卷入人类写作和叙事中,未来的文学版图也会变得更加复杂、暧昧而有趣。