人们研究分类法由来已久。国外的杜威十进分类法、美国国会图书馆分类法,国内的中国图书馆分类法等,都是分类系统的集大成者。但是,这些分类法都是针对图书馆和情报信息机构的图书资料编制的,对于专业信息,应编制专业分类法,适应工作所需。例如档案界“为了建立统一规范的档案检索方法,实现我国档案分类检索体系的标准化”①,编制了《中国档案分类法》。新闻信息作为独特的信息资源,有简短性、时效性和多样性等特点,不同于图书资料的性质,因而也应该建立统一规范的检索标准和体系。遗憾的是,目前我国还没有统一的新闻信息分类标准,各个新闻单位各自为政,利用自己的体系对信息进行加工处理,这样的弊端显而易见:首先,新闻系统各单位标准不一,信息重复建设,造成了较大的经济浪费;其次,新闻信息软件商不得不对大量同一新闻信息反复标引和分类,不利于新闻信息的发展利用和自动分类标引软件的研制开发;第三,各系统之间兼容性小,用户没有统一的标准可以参考利用,检索的盲目性会影响信息的查全率和查准率。因此,制订统一的新闻信息分类标引体系是当前必要的和紧迫的工作之一。本文对国外比较成熟的系统之一——Factiva数据库和它的分类标引体系进行介绍,并结合自己的认识提出该体系对我国新闻分类法编制工作的启示。 一、Factiva介绍 Factiva是道琼斯和路透社联合成立的公司,是一家全球新闻和商业信息的提供商,通过其门户网站或集成解决方案提供齐集来自道琼斯、路透社新闻网络及《华尔街日报》等的世界主要环球化新闻及信息内容,并设有多个不同语言的用户接口及内容选择。目前Factiva有超过150万的企业级用户,其中全球500强企业中85%已经采用了Factiva的信息服务,信息内容涵盖咨询、金融、媒体、医药、教育、高科技,汽车、能源等众多行业。Factiva.com是Factiva公司第二代在线商业信息服务系统,是原Factiva公司道琼斯数据库和路透商业快讯合并而成的升级产品。它的内容包括来自118个国家近8000个区域性和全球性的信息源。具体内容包括: 1)1000多家在线报纸的当日最新内容和历史资料,如华尔街日报、南华早报、先驱论坛报等; 2)6500多家杂志包括一般商业以及行业必读的杂志,如经济学家、哈佛商业评论、远东经济评论等; 3)270个新闻专线,160多家媒体节目(如BBC,CNN,ABC,CBS,NBC,Fox等),9000多个网站; 4)3万多个公司报告及全球各地的公司档案,公司报告包括全球55个行业的36500万的公司②。 最近,Factiva与微软公司达成协议,将在微软Office2003系列中加入Factiva新闻检索内容③。 二、Factiva新闻信息分类标引(Factiva Intelligent Indexing[tm])体系介绍 Factiva拥有极其庞大的信息资源。为使用户快速、便捷,准确地查找自己所需信息,Factiva在2002年末发布了内容增强工具Factiva Fusion,用于对企业关键内容集进行分类,并创建各内容集之间的联系。更重要的是,Factiva推出了Factiva智能标引体系(Factiva Intelligent Indexing④,以下简称FII),FII对现有的门户、企业Intranet和内容管理系统等知识库的内容进行一致的组织,可以增强这些系统的性能。实际上,FII是由几份大型分类表和词表组成的网络体系,为Factiva数据库新闻信息的统一分类、标引提供支持,为用户检索提供指导和依据。FII允许用户通过4种范畴(即公司Company、产业Indus-try、地区Region、主题Subject)进行结构化检索(其中公司通过“公司代码表Company Codes faetsheet”进行检索),或者与自由文本结合进行检索。在扩展检索中用户可以限定日期、语言、检索词位置、排序标准等条件⑥,并可根据反馈信息再次制定检索策略,查找到比较准确的数据。另外,检索策略能够被保存并且检索结果能够被跟踪和更新。 FII在标引和检索体系中起着极为重要的作用,FII自制订之初到现在一直在不断的修订和完善中。1999年10月28日出版FII1.0。2003年5月6日出版的FII2.2是FII第11个修订版,是对FII2.1的修订。在每一版本修改后,都会注明对前一版本的修改之处。一般注明修改的类号、号码状态(是否是新号码),其直接上位类号、类号类型、类目名称、类目描述等。FII2.2对FII2.1有12处修改,其中新增类目9个,改动类目3个。现以FII2.2为例介绍整个体系。 FII体系主要由几大表格组成。每一表格就是一个分面分类表,或者说一种检索途径。每一表格的类目按照类级排列,电子版的FII是以:Microsoft Excel的形式出现的,以不同的颜色和“+”、“-”区分类级。大红色显示的为第一级类目。黑色、深绿色、浅蓝色和深紫色显示的分别是第二、三、四、五级类目。上位类用旁边的“+”、“-”可展开或紧缩其下位类。每一分类表基本由以下几项组成:Factiva代号,Factiva类目名称,Factiva类目描述,直接上位类。