基于物流成本主题域数据仓库的DSS开发

作 者:
郭磊 

作者简介:
郭磊(1976-),男,河南安阳人,安阳师范学院计算机与信息工程学院讲师,硕士,主要从事数据库与数据仓库、决策支持系统研究,河南 安阳 455000

原文出处:
新余学院学报:社会科学版

内容提要:

基于物流成本主题域数据仓库的DSS的研究,在我国尚属一个新的研究课题。在基于物流成本主题域的数据仓库的设计上,采用了星型模型,即一个以物流成本事实表为中心,若干维度表环绕四周的数据仓库模型。在数据挖掘部分,首先对数据进行了聚集,然后使用关联规则挖掘技术,从不同维度对物流成本库中的纪录进行资料挖掘。


期刊代号:F14
分类名称:物流管理
复印期号:2012 年 04 期

字号:

      1 开发背景及现状

      当前,我国物流业的发展已经达到了一个鼎盛时期,物流企业像雨后春笋般拔地而起,各企业间的激烈竞争也就在所难免。在竞争中,要立于不败之地,对成本的控制是关键所在。如何充分利用、挖掘现有数据,来支持科学决策,充分降低成本,使效益最大化,已被很多大型物流企业认识到。

      物流业,本身就是一个融交通运输与信息管理为一体的新兴行业,所以在物流企业中,拥有大量的数据。只不过,这些数据具有冗余、大量、分散、异构等特点。据我国物流行业协会统计,目前92.56%[1]的物流企业,其物流业务系统只作为录入数据的工具,物流数据只作为各物流站点间要传递的信息,物流数据库只作为保存数据的场所。就企业决策而言,数据处于“死数据”状态,对企业决策基本没有意义。

      而数据仓库(Data Warehouse,简称DW)正是在这些冗余、大量、分散、异构的数据之上,对数据进行查询、分析、抽取、转换、整合、优化等数据挖掘处理,对企业的决策起到积极地支持作用[2]。决策支持系统(Decision Support System,简称DSS)是辅助决策者通过从DW中挖掘出的数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。

      在我国,目前虽然还没有基于物流业的决策支持系统,但是基于成本主题域的其他行业DSS已经存在,如,人力资源成本DSS、财务成本DSS等。所以,基于物流业成本主题域DSS的研究与开发,是一个新颖、实用的新课题。

      2 物流成本的构成

      按成本项目划分,物流成本由物流功能成本和存货相关成本构成[3]。其中物流功能成本包括物流活动过程中所产生的包装成本、运输成本、仓储成本、装卸搬运成本、流通加工成本、物流信息成本和物流管理成本,存货相关成本包括企业在物流活动过程中所发生的与存货有关的资金占用成本、物品损耗成本、保险和税收成本。

      (1)运输成本。一定时期内,企业为完成货物运输业务而发生的全部费用,包括从事货物运输业务的人员费用、车辆(包括其他运输工具)的燃料费、折旧费、维修保养费、租赁费、养路费、过路费、年检费、事故损失费、相关税金等。

      (2)物流信息成本。一定时期内,企业为采集、传输、处理物流信息而发生的全部费用,具体包括物流信息人员费用,软硬件折旧费、维护保养费、通讯费等。

      (3)保险和税收成本。一定时期内,企业支付的与存货相关的财产保险费以及因购进和销售物品应交纳的税金支出。

      3 基于物流成本数据仓库的DSS结构框架

      

      物流成本DSS的基本结构框架如图1所示。其主要可以划分为三个部分。

      (1)源数据部分:是来自于不同地域、不同类型数据库、不同名称数据项的异构外部数据。

      (2)数据仓库管理部分:ETL(Extract-Transform-Load,即数据抽取、转换、装载)是数据抽取、转换、清洗、装载的过程。是构建数据仓库的重要环节,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

      (3)分析处理决策部分:联机分析处理(On-Line Analysis Processing,OLAP)是共享多维信息的、针对特定问题的联机数据访问和分析的快速软件技术。它通过对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取,允许管理决策人员对数据进行深入观察。决策数据是多维数据,多维数据就是决策的主要内容。其结果是以图形或者表格的形式来表示的对信息的总结。

      4 基于物流成本数据仓库的DSS的构建

      由于数据仓库是面向决策支持的,它具有数据量大但更新不频繁等特点,所以必须对数据仓库进行精心设计,才能满足数据量快速增加而查询性能并不下降的要求,为决策者提供强有力的决策支持。

      4.1 确定主题域,设计数据仓库物理存储结构

      由于数据仓库本身就是面向主题域的,所以,构建数据仓库的第一步就是确定主题域。本项目的主题域确定为物流成本主题域。

      在确定了主题域后,下一步就是开发数据仓库中的数据物理存储结构。由于本系统使用的是关系型数据库,而未使用多维数据库,所以,需要设计与构建事实表与维度表。

      事实表通常包含大量的行,其主要特点是包含数字数据(事实),并且这些数字信息可以汇总[4]。事实表由两部分组成,一部分是维度表的主键,另一部分是相关主题的数值型测量值,即事实。物流成本事实表的部分主要字段及其说明,如表1所示。

      维度表可以看做是用户来分析数据的窗口。维度表包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息,维度表包含帮助汇总数据特性的层次结构。部分物流成本维度表的部分主要字段如表2所示。

相关文章: