本文讨论修辞与人工智能之互动关系,即“人工智能+修辞”。“+”本文定义为应用,即把现有的人工智能技术用于处理修辞现象。修辞是人类语言生活中普遍存在的,除其普遍性外,更重要的是其意识性:在日常会话中,老百姓讲话时不懂主谓宾之类,但对用词不当、有口无心、言外之意等是非常敏感的。这些无处不在、使用者非常敏感的修辞现象,是当前人工智能所面临的最严峻的挑战。仅以隐喻自动处理而论,隐喻知识形式刻画如此之难,“人工智能研究者迄今像回避瘟疫那样躲避它”(Martin 1990:xxi)。 在人类学术史上,主攻修辞现象的修辞学,古今中外,已有几千年的历史,文献浩如烟海。人工智能作为研究领域相比之下还是初升的曦阳。我们若以图灵1950年在《心智》(Mind)上发表的题为“计算机器与智能”(Computing machinery and intelligence)(2004[1950])的论文作为其始祖,那么它仅有70多年的发展历程。Lungarella et al.(2007)针对技术演变对其做过50年成就总结。Grimson & Patil(1987)对上个世纪80年代人工智能进展做了断代概览。Dreyfus(1972,1999)从哲学的角度对其在概念和机器翻译实践上提出了比较负面的批评和总结。有兴趣了解人工智能研究全貌的读者可参阅此四本专著。姚天顺等(2002:1)用“智慧树”形象地描述人工智能各分支,其中自然语言处理居树顶(见下页图1)。“NLP[natural language processing]的接口,它吸收所有树根、树干和树叶的营养,形成一门独立的学科。由此可知NLU①的重要性。” 本文为压缩讨论范围,有所侧重,拟以被誉为计算机科学和人工智能之父的艾伦-图灵(Alan Turing 1912-1954)和图灵测试(Turing Test)为楔子,简要回顾人机互动模式的发展历程。根据机器与人互动的“智能”水平,人机互动可分为四个阶段。文章以这四个阶段为参考基点,逐一讨论修辞现象对人工智能发起的挑战。 修辞现象对人工智能的挑战,简要地说,就是看人工智能能否“应招”,用计算机处理自然语言修辞现象。这样表述容易造成单向应招的误解,以为如果计算机不能处理修辞现象,责任在人工智能研究者一方,他们还不够“智能”。实际上,修辞学者一方具有同样不可推卸的责任。 根据主流语言学方法论,非常复杂的语言现象通过抽象成不同的层次以方便研究,如词汇、语音/音系、句法、语义、语用/修辞等。目前人工智能,特别是自然语言处理,对词汇、语音/音系、句法、语义等方面的自动化处理,已经达到较高水平。语用/修辞②方面相比之下,起步晚,水平偏低。关于语用形式化研究,国外有Gazdar(1979),Searle & Vanderveken(1985),国内有蔡曙山(1998)、蒋严(2011)等。 语言信息自动化处理水平高低,主要取决于两个因素:一是研究对象的形式化;二是在形式化的基础上拿出有效的算法。研究对象形式化是把现象跟计算机自动化处理联系起来的桥梁。对象、形式化与处理三者的互动关系,如图2所示。
语言学家有责任提出语言学理论或模型,以便于对相关语言现象进行形式化。图2仅显示一类形式化工具——符号逻辑③。符号逻辑之所以如此命名,是因为逻辑推理跟数学运算一样,要运用大量符号,而不是通过自然语言的文字表达。这使得符号逻辑成为超越自然语言之外的一种通用符号推理系统。图2单独凸显它,是因为它是计算机科学的根基。符号逻辑跟计算机科学为“共生关系”:“计算机赋予逻辑以实际运行环境;逻辑为计算机科学理论研究提供逻辑语言和方法论。”(Hedman 2004:xiv) 符号逻辑除了提供研究对象形式化的手段外,还有一个功能,即为计算机科学中的可计算性提供逻辑证明的手段。计算机不是万能机,有些问题它是不可能解决的,符号逻辑为判断哪些问题计算机有解,哪些问题无解提供理论上的推理验证方法。我们要问:有些修辞现象是不是当前计算机无解?有些是不是永远无解?有些尽管当下有解,但因计算成本太高而无法实现?回答这些问题已经超越本文作者的知识范围。但还是要提出来,相信今后注定会有学者能够提供答案。科学史告诉我们,科学研究不怕做不到,只怕想不到! 下面第二节回顾人机互动50多年的研发脉络。第三节专门介绍词汇、语音/音系、句法、语义这几个层面的一些形式化方法。我们要问:这些方法是否适用于语用/修辞现象形式化?第四节讨论计算机处理修辞现象的潜在概念模型。最后第五节重温本文主旨人机互动中的修辞问题。 二、人机互动50多年的研发脉络 2.1 图灵早期设想人机互动模式 图灵1950年发表的论文,开宗名义发问道:“机器能思考吗?”(2004[1950]:67)在图灵看来,思维是人类智能的典型标记。人类思维离不开语言,人类语言行为(verbal behaviour)自然成为人类智能的可视、可闻的标记。如果人类发明的数字计算机④能够思考、答问,那么我们能不能说数字计算机有了像人类那样的智能?“像”字很重要。因为人类是生物生命体,数字计算机是有限状态机,本质上是完全不同的。然而,倘若让机器与人做模拟问答游戏,一问一答,顺畅到以至于旁听的第三方无法判断哪一方是机器,哪一方是人,那么图灵提议我们就应该认为机器具有了人类的智能。图灵测试后来被用做评估机器人或智能系统是否具有“人工智能”(artificial intelligence)的标杆⑤。