维基百科机器人群体性编纂过程中的知识与话语权研究

作 者:

作者简介:
甘莅豪,华东师范大学传播学院教授,华东师范大学国家话语生态中心研究员;刘欣雨,华东师范大学传播学院国家话语生态中心研究员助理(上海 200241)。

原文出处:
新闻大学

内容提要:

维基百科全书存在着一个群体性、自组织的线上社区。在这个社区中,不仅活跃着众多来自不同国家、民族、文化和语言背景的人类群体,还存在着大量功能、地位、目的和职责彼此不同的机器人群体。这些人类和机器人共同维护着维基社区,通过撰写、修改、讨论、斗争、妥协和配合等一系列编纂行为全面提升维基百科全书条目的质量。在这一过程中,机器人不仅是人类力量的增强器,还是拥有独立账户的行动者。它们一方面被人类用户设置了严格的编辑门槛,另一方面依靠虚拟空间赋予的“生理”权力、维基社区赋予的“身份”权力、维基平台赋予的算法权力,在生产、保存、分类、分配知识的过程中,生成了机器自身独特的认知经验,同时逐渐消解着“人类中心主义”。


期刊代号:G6
分类名称:新闻与传播
复印期号:2022 年 02 期

字号:

      [中图分类号]TP242;G206 [文献标识码]A

      2003年12月4日,维基百科创始人吉米,威尔士(Jimmy Wales)在英文维基社区成立了仲裁委员会,目的是当维基百科成员之间的纠纷经过讨论区的公共辩论以及管理员调解等途径都无法解决时,为其提供一个最后的、终审式的裁决路径。可以说,在英文维基百科中,仲裁委员会拥有维基社区中最高的权力,通常被认为是维基百科的“最高法院”。该委员会最初由12名成员组成,一般先由维基社区的网络编辑们共同选举,推出得票最多的候选者,再由吉米·威尔士通过邮件亲自通知任命(Wikipedia,2019)。然而2006年英文维基百科仲裁委员会的成员选举却和往年有所不同,因为一个账户名为AntiVandalBot的维基机器人也报名参与了此次竞选(Lovink et al.,2012;Geiger,2018)。AntiVandalBot在维基社区中的主要职责是修复被人故意破坏的条目,虽然其编辑次数早已达到了维基社区规定的候选人编辑次数必须超过1000次的资格要求,但是经过维基社区的激烈讨论,该机器人最终还是没有成功进入仲裁委员会。

      显然,大多数维基人并不认为维基机器人拥有和人类一样的选举权。但是,维基机器人参加竞选的行为,却不能不引发学界深思:在维基社区中,生活着哪些种类的机器人?维基百科赋予了这些机器人什么样的编纂话语权力?这些机器人应该以什么样的话语身份和人类在互联网中共生共存,单纯是人类编辑工作的辅助性工具,还是在编辑社区中拥有和人类一样的社会地位?由于维基百科所编纂的群体性知识已经成为人类获得知识的主要途径(甘莅豪、翁彬婷,2019),而机器人话语更是群体性知识生产、分类和存储的重要组成部分。因此,关于这些问题的研讨,对于我们在信息社会重新把握知识生产、分类和存储的本质,具有重要的理论意义和现实价值。

      一、维基百科机器人研究综述

      早在维基百科成立的2001年,人类就开始借助脚本程序将《伊斯顿的圣经词典》(Easton’s Bible Dictionary)中的条目导入到维基百科中。2002年10月,维基百科用户Ram-man创建了维基历史上第一个大规模编纂的机器人写手Rambot。该机器人拥有独立用户名,主要被用来编纂和更新美国郡县和城市数据的条目(Livingstone,2016)。随着维基百科中出现了越来越多的机器人,2006年基特(Kittur)和米特科维奇(Mytkowicz)等学者观察到自动化机器人正逐渐接管一部分人类编辑工作,不过从当年收集到的数据来看,机器人的编辑总量仅占所有编辑的2%~4%左右,在维基百科全书整体编辑中的占比非常小(Kittur et al.,2007)。此时,这些机器人被视作人类编辑的辅助工具,用以提升人类编辑工作的效率。国内学者研究维基百科机器人起步较晚,只有成素梅和孙越在《维基百科的分布式知识评价基础》中介绍了人类编辑与机器人编辑构成的分布式编辑系统。考虑到维基百科条目内容的文化负载和易操控性,他们认为这些机器人可能成为利益集团利用算法权力和文化渗透操纵和控制维基百科,影响人们认知经验的工具(成素梅、孙越,2018)。

      随着机器人在维基百科全书编纂中所占比重逐渐加大,机器人在维基百科的编辑活动中占据着越来越重要的地位。2007年,普里德霍斯基(Priedhorsky)等学者在使用持续浏览指数PWV(persistent word views)计算编辑账户对维基社区的贡献值时发现,有3,300亿的PWV计算得分都是由维基百科中的自动或半自动化机器人创造的。而在根据编辑次数排列的超级编辑列表中,机器人竟然占据了所有用户排名中的前4名,前10名中的9名,前50名中的至少20名(Priedhorsky et al.,2007)。斯图尔特·盖格(R.Stuart Geiger)通过对2009年2月4日至4月1日间维基百科内所有账户的编辑数据进行检测发现,机器人编辑在所有编辑中的占比已经上升到16.33%,加上辅助编辑程序,两者在所有编辑工作中共占28.49%,比所有匿名人类用户还要多(Geiger,2009)。

      不仅在内容创建上,机器人在维基社区辅助人类承担管理工作的作用也日渐突出。穆勒·比恩(Müller-Birn)和多布斯(Dobusch)等学者将知识生产社区中的治理机制分为两类——社会治理机制和算法治理机制,他们认为维基社区将机器人用于管理正是算法治理的一种表现形式。通过对机器人Xqbot的研究,他们发现Xqbot的早期工作主要集中在提升百科全书条目的内容质量上,然而随着时间的更迭,Xqbot的活动逐渐向更多的维护活动和社区管理活动转变(Müller-Birn et al.,2013)。盖格(Geiger)和利贝斯(Ribes)通过痕迹民族志(trace ethnography)的方式研究维基百科中的“打击恶意破坏”行为(vandal fighting),他们认为人类和机器人共同建构了一种“分布式认知系统”,在协同作用下识别、评估、删除、禁止恶意的破坏性编辑,为维护集体智慧成果和维基百科的安全秩序做出了巨大贡献。在他们的研究中,人类、全自动机器人和辅助编辑程序共同组成了反破坏行动者网络,构建了维基安全秩序的三道防线:第一道防线,近乎全自动的机器人在几秒钟之内恢复那些最明显的破坏性编辑;第二道防线,Huggle或SKiki等半自动脚本程序自动生成一组可疑列表,人类编辑通过查看这个实时列表,点击修复那些有问题的编辑;第三道防线,人类编辑通过web浏览器采取传统在线编辑模式,进行手动编辑(Geiger & Ribes,2010)。更进一步的研究指出,机器人对维基条目质量管理效率具有异常重要的作用。通过对英语维基百科中最常见的防破坏机器人ClueBot NG停止运行时间及其产生的影响进行研究,他们发现当ClueBot NG因故障宕机时,维基百科中编辑错误恢复的速度有所降低,虽然其他代理软件接管了它的任务,完成了相同比重的恢复量,但执行速度却要慢得多。这说明虽然维基百科的质量控制网络是有弹性的,它能够在某个防破坏程序崩溃后及时重新分配任务,确保安全秩序的恢复和维系,但是另一方面机器人修复错误的效率也是不可忽视的(Geiger & Halfaker,2013)。

相关文章: