本体评估研究进展

作  者:
徐雷 

作者简介:
徐雷(1986- ),男,武汉大学信息管理学院情报学专业,博士,讲师,主要研究方向:本体与语义Web研究与应用开发,E-mail:xlei@whu.edu.cn。武汉 430072

原文出处:
情报学报

内容提要:

本体评估是根据各种评估指标并采用各种科学的评估方法对影响本体质量的各个要素进行综合测评的过程。本文总结了本体评估的应用场景及意义,从基于指标体系、任务与应用、数据驱动、黄金标准、逻辑与规则、统计分析等几个本体评估角度,对国内外本体评估的方法与工具进行了详细的综述与对比分析,总结了本体评估方法及工具的特点及优劣势,并指出本体评估领域目前面临的困境,如本体评估指标差异大且选择随意、评估方法较多但缺乏实践性、以需求为导向的本体适应性评估研究不足等,并给出了可能的解决法案以及本体评估研究未来的发展方向。


期刊代号:G9
分类名称:图书馆学情报学
复印期号:2016 年 11 期

字号:

  1 引言

  本体是语义Web技术的核心,具有高度形式化、互联共享等优良特性,目前在生命科学、医学、计算机、政府等诸多领域中广泛应用于资源的语义标注与组织、领域概念体系的构建、信息系统的互操作等过程。伴随着学术界和产业界对于本体研究与实践活动的广泛开展,本体构建活动也逐渐增多,造成目前本体数量越来越多,而本体质量却参差不齐。由于本体的开放性,任何个人和组织都有权利发布自己的本体数据,因此目前还存在领域本体重复构建、本体应用实践混乱等现象。本体评估是本体工程周期中不可或缺的一环,无论是本体构建、本体演化、本体管理、本体应用等过程都涉及对本体评估相关的活动。

  本文首先分析了本体评估活动主要的应用场景,然后通过对国内外本体评估相关的文献进行综述,从基于指标体系、任务与应用、数据驱动、黄金标准、逻辑与规则、统计分析等几个角度,总结了目前关于本体评估的主要方法、评估视角、评估对象、评估效果及本体评估工具的研究进展,并指出未来本体评估研究工作开展中可能存在的问题及发展方向。

  2 本体评估的应用场景

  本体评估在本体工程各个阶段都有重要作用。首先,本体评估是本体构建过程的关键,良构的本体可增加用户对本体的理解从而有利于本体重用。与目前本体构建活动如火如荼的情形相比,本体评估实践活动相对滞后。本体构建需要遵循一定的原则或方法论,要满足领域和应用目标的需求,以构建出高质量、高可复用性的本体。本体评估在本体构建的过程中,对本体应用需求、构建语料选择、本体词汇选择、概念分类、概念关联等具体的环节都具有直接或间接的作用。同时,本体评估也是本体自动构建过程的必要环节,用于改进本体学习算法;

  其次,本体评估是本体选择与排序的重要依据。在语义Web环境下,尤其是在大数据环境下,本体语义数据已由最开始的几个热门的领域,发展到几乎所有的领域都建立有自己的领域本体。本体数量之多,已超越了人们选择本体的能力。本体无论是应用在语义标注、信息检索还是信息系统互操作上,在面临具体的应用时,都面临着本体排序(Ontology Ranking)与本体选择(Ontology Selecting)的问题。这两项任务都是依据一定的评估指标从众多的领域相关或任务相关的本体数据集中筛选出满足需求的本体或按指标大小对本体数据集进行排序,类似于目前的搜索引擎是对海量的网页进行排序以便于用户选择,本体排序与选择也是为了满足用户对本体使用的需求;

  最后,本体评估也是本体计量(Ontology Metrics[1])和语义数据挖掘的一个研究方向。本体计量常年作为国际语义网大会ISWC的一个主题,本体计量指标很多,国外相关研究也较多,本体评估是本体计量研究的一个重要的部分,对于本体计量的发展具有重要意义。类似于目前的Web数据挖掘,本体语义数据的挖掘在语义Web的发展下,也将迎来其学术发展的高峰,而本体评估活动尤其是在网络环境下,也正是本体语义数据挖掘活动的一个侧面,通过对本体结构、内容等方面的分析与挖掘,对本体关键概念识别、本体模块化、可视化等应用具有重要的价值。

  当然本体评估的应用场景远远不止这3个方面。网络环境下,本体作为语义信息系统中不可或缺的一部分,在系统交互性方面发挥着重要的作用,本体的分布式查询与推理、本体核心概念识别、本体学习、本体映射、本体演化,以及诸多领域中的本体应用,都离不开本体评估对结果的保证。

  3 本体评估的主要方法

  本体评估可看作是由本体评估主体采用科学的评估方法对影响本体质量的各个方面的要素进行综合测评的过程。本体评估的主体决定了评估过程是人工参与的还是自动的,本体评估的方法则需要根据不同的应用场景和目的来加以选择,根据目前的研究进展,可将本体评估的方法大致分为:基于指标体系的本体评估、基于任务或应用的本体评估、数据驱动的本体评估、基于黄金标准的本体评估、基于逻辑或规则的本体评估、基于统计分析的本体评估等。本体各个方面的要素则是本体评估的对象,如本体的语法、语义、层次结构、本体的复杂性等都是本体评估的对象。

  3.1 基于指标体系的本体评估

  目前这类本体评估方法研究最多,首先提出本体评估的指标,或利用已有的指标,由此计算并判断本体是否满足这些指标,或对比本体在这些指标之间的差异。

  3.1.1 综合性评估

  Gomez-Perez[2]是较早系统回顾本体评估的学者,梳理了本体评测的指标,如一致性、完整性、简洁性、可扩展性、敏感性,以及本体构建中易出现的错误:继承循环、分类错误、冗余、语义错误等;Lozano-Tello和Gomez-Perez[3]采用AHP方法从本体的内容、语言、构建方法及工具以及构建成本等几个角度列举了本体的若干计量指标集合,来辅助本体之间的对比与选择任务。Lantow和Sandkuhl[4]从文献中收集了大量的本体结构化指标对本体设计模式(ODP)进行评估,最后从本体的清晰性、可理解性、适应性、可重用性对本体进行了专家评估,并和结构化指标的评估结果进行相关性对比;Fernandez-Breis和Aranguren等[5]从本体结构、功能、可靠性、可维护性等几个维度设计了本体质量评估指标,并由用户对这些指标进行打分评估本体质量;Tartir和Arpinar[6]将本体评价分为基于演化的、基于逻辑的和基于指标的方法,重点分析了OntoQA工具,将本体质量指标分为模式指标和本体知识库指标;Bachir Bouiadjra和Benslimane[7]对本体的覆盖度、丰富度、细节层次、综合度、连接性、计算效率几个指标进行了设计与度量;Kanellopoulos[8]从语法、语义、语用、社交、内聚度5个指标来评估本体;Duque-Ramos和Fernandez-Breis等[9,10]提出了一个本体质量评测的框架OQuaRE,包括一个质量模型和一个质量计量指标。目的是实现本体质量评价,其质量模型的特性需满足:可靠性、可操作性、可维护性、可兼容性,可移植性以及功能重组性,且每一个特征有其相关联的子特征;同时,该作者在后续的研究中[11]将本体构建指南和OQuaRE结合,使用统计分析技术来分析使用指南构建本体对本体质量是否有影响;为了实现本体在不同情境下的信息交互,Rico和Caliusco等[12]提出了一个本体评测框架,从完整性、简 洁性、语法正确性、语义正确性、表达正确性、有用性等几个方面设计了可定量计算的指标;Romano和McDonald[13]收集了200多个关于本体质量的指标,从过程、产品、效果质量三个角度分析了本体质量评估的方法;Tibaldo和Wilkinson等[14]从本体的完整性、简洁性、语法正确性、语义正确性、表达正确性5个层面设计了一系列本体结构化的计量指标对本体质量进行评估;Pak和Zhou[15]设计了一个本体评估框架,将本体评估划分为五个维度:本体范围、层级、生命周期、质量原则和评估方法,其中本体范围包括领域、概念和技术范围,本体层级包括本体词汇、结构、表达/语义、上下文/应用等层级,本体生命周期包括:本体规格说明、知识获取、概念化、集成。本体质量原则包括:一致性、完整性、精确性、可重用性,本体评估方法包括:独立的方法、验证性评估和确认性评估;Burton-Jones和Storey[16]等从语法、语义、语用和社会这4个维度提出了一套计量本体质量的指标体系;Kehagias和Papadimitriou[17]从内部维度和外部维度制定了一个本体精炼的评估体系,内部维度包括:词汇、结构、语义、应用和哲学,外部维度包括:用户依赖性、本体在信息交换中的参与性、是否文档化、是否是国际标准等;Gangemi和Catenacci[18]提出了O[2]和oQual两个关于本体评估与选择的模型,以及qood-grid本体选择框架,制定了认知、透明性、计算完整性和效率、元数据层面集成、灵活性、专业性、扩展性、可达性、适应性等诸多本体选择的原则,以及反映这些原则的指标参数;Zouaq和Nkambou[19]对本体学习效果进行了结构指标评价,如类匹配度、密度、中介度、语义相似度等,并和其他评估软件TEXCOMON做了对比性评价;Sabou和Fernandez[20]将本体评估的目标分为领域覆盖度、模型的质量、本体在应用和任务中的适应性、本体的采纳与重用的评估,并在NeOn项目中对诸多的评估方法进行了实际评估操作。

相关文章: