一、引言 随着物流业的迅猛发展和物流信息化水平的不断提高,物流数据信息也呈几何级增长,运用传统的处理手段通常难以对这些庞大的数据信息进行深入分析,而关联规则等数据挖掘技术是解决这类问题较好的处理工具。把关联规则挖掘技术应用到物流领域,对海量物流信息进行分析,挖掘出这些信息的潜在价值,有利于第三方物流企业(Third- party Logistics Enterprises)管理层及时发现内在关联规律,为进行市场营销等经营决策提供科学指导。[1] 二、物流信息挖掘 数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database,KDD)。贝里和利诺夫(Berry & Linoff)认为,[2]数据挖掘就是针对大量的数据,利用自动化或半自动的方式作分析,以找出有意义的关系或法则。瓜佩等人(Guape & Owrang)则认为,[3]数据挖掘是从现存数据中剖析出新事实及发现专家们尚未知晓的新关系。法耶兹(Fayyad)等学者把数据挖掘定义为,[4]数据挖掘为依据使用者需求自数据库中选择合适数据,加以处理、转换、探勘至评估的一连串过程,期望能找出真实世界运行时隐含于其内的运作规律,以辅助解决问题之用。 综上所述,数据挖掘就是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。关联规则(Association Rule)是数据挖掘的常用技术之一,它能够有效地发现数据间的联系,根据已有数据预测未来发展趋势,在企业客户关系管理、营销策略制定方面有着广泛的用途。[5] 随着物流信息化水平的提高,通过数据挖掘技术分析货物流向对于物流企业或者物流用户都有着至关重要的意义。借助关联规则挖掘技术可以在不增加成本的情况下预测出客户可能会感兴趣的产品,有针对性地推广产品。应用关联规则挖掘技术对客户的发货数据进行分析,从中可找到客户发货去向之间的关联,以及发货去向与发货种类之间的关联。[6]企业则可以根据挖掘结果内在的关联规律作出市场营销分析决策报告,列出潜在目标客户群,有针对性地拓展业务,推销客户所需的服务,提高业务营销的成功率,创造更大的经济效益。
三、实证研究 第三方物流(3PL)企业远成集团在全国各省会城市及经济发达的二、三线城市有着较完整的物流网络布局。现对其部分业务数据做一些试探性分析,从中找出客户发货去向之间的关联,以及发货去向与发货种类之间的关联,为公司制定营销决策提供支持。挖掘策略是:先对远成集团成都公司的数据进行分析,以成都公司为基点,找出各种关联规则。 1.数据准备 从该企业成都公司数据库抽取2008年某时间段内的业务记录作为数据源,进行如下数据处理: (1)发货方向归类。发货方向包含了全国各大中城市,为分析方便,归为六个方向:①东北方向:哈尔滨、沈阳等;②华北方向:北京、天津、青岛、石家庄等;③华东方向:上海、无锡、杭州、南京、宁波等;④华南方向:广州、深圳等;⑤西北方向:西安、乌鲁木齐等;⑥重庆方向。华中方向因为业务量较少,没有符合标准的记录。 (2)发货种类归类。归为九大类:①食品:泡菜、榨菜、淡口菜、大头菜、竹笋、醪糟、食用油等;②调味品:豆瓣、鸡精、火锅料、花椒油等;③酒类:郎酒、全兴酒、泸州老窖等;④药品保健品:三勒浆、中药材、西药、兽药等;⑤纺织品:服装、棉布、双宫丝、坯布等;⑥化工原料:PC料、A胶、BZS添加剂、聚磷酸铵等;⑦纸张类产品:白纸、静电纸、夹板纸、胶版纸、纸浆等;⑧金属制品:锌锭、铁合金、稀土、射钉、皮带轮、柴油机等;⑨石材:花岗石、大理石等。 经过发货方向和发货种类归类处理后的部分数据如表1所示。 2.挖掘关联规则 本实证研究采用Spss公司开发的数据挖掘软件——Clementine对处理后的数据进行分析。执行“Apriori”模型,设置支持度为10%,置信度为20%,得到的挖掘结果如表2所示。Clementine的可视化功能非常强大,通过执行“网络”模型,得到了非常直观的挖掘结果,从图1网络节点挖掘结果可以看出,{纺织品(金属制品),华东方向}、{食品(调味品),华南方向}被保留了下来,说明这几对项目关联程度是最大的。
图1 网络节点挖掘结果 执行Clementine的两个模型得到的结果基本相似,验证了挖掘关联规则的可行性与准确性。 3.结果评估及对策制定 (1)成都和广州往返货源分析 表2显示,调味品和食品的发送量中分别有54.55%和47.19%是发往华南地区的,占发往华南地区货物总量的29.78%,这表明了华南地区对食品和调味品的特殊吸引力。远成集团华南地区货物集散中心——广州公司到成都的货源情况如表3所示,其中数码产品和家用电器等两类货物的交易记录分别占总量的35%和25%。