数据挖掘技术在物流业中的应用研究

来源:来源于网络发布时间:2009-11-19
 随着信息时代数据量的剧增,深化物流管理的最有效方法是在其中引入数据挖掘技术,充分合理的利用数据挖掘技术,可以进行市场预测和分析,这必将为正确的决策奠定坚实的基础。本文介绍数据挖掘技术的概念及方法,并结合物流企业的管理,阐述数据挖掘技术在物流企业中的具体应用。
  1 引 言
  物流需求的个性化、多样化和集成化,要求物流服务企业必须不断改进和优化企业的运作流程,开发出具有针对性的物流服务,以适应物流市场发展的变化。数据挖掘技术,以其强大关联、分类、预测等功能,可将物流企业运营过程中产生的信息数据进行有效整合处理,为物流企业的决策提供依据。
  2 数据挖掘技术
  数据挖掘又称为基于数据库的知识发现,是从大量的、不完全的、模糊的、随机的实际应用数据中,提取隐含在其中的、潜在有用的信息和知识的过程。它不仅仅局限于对数据的查询和访问,主要在于找出数据之间的潜在联系。从企业角度看,数据挖掘是一种企业信息处理技术,特点是对企业数据库中的数据进行抽取、转换、分析等,从中提取可用于辅助企业决策的关键数据。数据挖掘的目标是从大量数据中,发现隐藏于其后的规律或数据间的关系,从而服务于决策。数据挖掘方法有很多种,其中比较典型的有关联分析、序列模式分析、分类分析、聚类分析等。
  (1)关联分析
  数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之问存在某种规律性,就称为关联。关联分析即利用关联规则进行数据挖掘,而关联规则是描述事物之间同时出现的规律的知识模式,关联分析的目的是为挖掘出隐藏在数据间的相互关系。
  (2)序列模式分析
  序列模式分析和关联分析相似,他把数据之问的关联性与时间性联系起来,为了发现序列模式,不仅需要知道事件是否发生,而且需要确定事件发生的时间。其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据问的前后或因果关系。
  (3)分类分析
  分类分析就是分析样本数据库中的数据,为每个类别做出准确的描述建立分析模型或挖掘出分类规则,然后用这个分类规则对其他记录进行分类,能够把数据集中的数据映射到某个给定的类上,其输入集是一组记录集合和几种标记。
  (4)聚类分析
  与分类分析不同,聚类分析法的输入集是一组未标定的记录,也就是说此时输入的记录还没有进行任何分类。其目的是根据一定的规则,合理地划分记录集合,使组之间的差别尽可能大,组内的差别尽可能小。
  3 数据挖掘技术在物流企业中的应用
  现代物流信息系统是一个庞大复杂的系统,特别是全程物流,包括运输、仓储、配送、搬运、包装和物流再加工等诸多环节,每个环节信息流量十分巨大。以往物流企业主要利用信息的有效沟通、快速传达、物流运作调控和辅助决策的功能,而很少挖掘信息中的有用数据。但随着市场竞争的加剧、企业精细化管理愿望的增强以及先进技术方法的开发应用,对信息中的数据进行挖掘利用已成为物流企业赢取客户、增加利润、提升自身竞争力的有效途径。
  3.1 数据仓库的建立
  数据仓库作为数据挖掘的基础,不同于传统的联机事务处理系统,它具有面向主题的、集成的、不可更新以及随时间变化的特性。各个联机事务处理系统作为数据仓库的原始数据源,以文件方式提供企业在日常活动中收集的包括定货单、存货单、应付帐、交易条款、客户情况等在内的大量数据资料和报表。同时还有大量的外部信息等数据。数据仓库通过ETL过程(抽取、转换和加载)处理这些接口文件,并且按不同的主题域组织、存储和管理这些客户数据。通过数据仓库接口,对数据仓库中的数据进行联机分析和数据挖掘。在建立完成企业级的信息数据仓库之后,可以基于这个数据仓库平台进行数据挖掘工作。
  3.2 物流企业中的数据挖掘
  一般来讲,数据挖掘在物流企业中可以应用在以下几方面:
  1)市场预测
  产品在进入市场后,并不会永远保持最高销量。一般来讲,随着时间的推移,产品会遵守销量变化的模式,经历四个阶段,即导入期、增长期、成熟期和衰退期。在各个阶段,产品的生产要求和实物分拨策略是不同的。如在导入期,产品逐步得到市场的认可,销售量可能会快速的增长,这时需要提前的生产计划、生产作业安排以及适合的库存和运输策略,指导企业的生产,合理地控制库存和安排运输。数据挖掘可以作为市场预测的手段,通过聚类和预测工具,达到上述目的。
  2)物流中心的选择
  物流中心(流通中心、配送中心)选址问题即求解运输成本、变动处理成本和固定成本等之和为最小的最小化问题。
  物流中心选址,需要考虑到中心点数量和中心点如何分布等情况。针对这一问题,可以用数据挖掘中的分类树方法来加以解决。分类树 (classification)的目标是连续的划分数据,使依赖变量的差别最大。分类树的真正的目的是将数据分类(classify)到不同组或分支中,在依赖变量的值上建立最强划分。用分类树的方法解决这个问题时,通常需要以下四个方面的数据:1)中心点的位置;2)每个中心点的业务需求量;3)备选点的位置;4)在中心点和备选点之间的距离。
  通过分类树的方法,不仅确定了中心点的位置,同时也确定每年各个地址问物品的运输量,使整个企业必要的销售量得到保证。企业的长期折现的总成本也会达到最小值。
  3)优化配送路径
  配送路径是个典型的非线性问题,它一直影响着物流企业配送效率的提高。在许多配送体系中,管理人员需要采取有效的配送策略以提高服务水平、降低货运费用。其中要考虑车辆的路径问题,车辆路径问题是为一些车辆确定一些客户的路径,每一客户只能被访问一次,且每条路径上的客户需求量之和不能超过车辆的承载能力。其次还应考虑到车辆的利用能力,如果车辆在运输过程中的空载率过高或整车的承载力未完全利用,这些无疑会增加企业的运输成本;另外涉及到车辆的运输能力,就必须考虑到货品的规格大小和利润价值的大小。
  数据挖掘中的遗传算法为配送路径的优化提供了新的工具,它可以把在局部优化时的最优路线继承下来,应用于整体,而其他剩余的部分则结合区域周围的剩余部分 (即非遗传的部分)进行优化。如此下去,逐渐把其他的区域并入优化的范畴,最后扩展到整体,模型得出的信息即可用来决策输出,即根据每次配送顾客数量的不同、顾客位置的不同,以及相应订货量的不同,输出本次送货线路车辆调度的动态优化方案。
  4)合理安排商品的仓储
  商品的合理储位对于仓容利用率、储存搬运分拣效率的提高具有重要的意义。对于商品量大、出货频率快的物流中心来讲,商品储位就意味着工作效率和效益,要真正解决好这个问题,数据挖掘是必不可少的。
  如何合理安排货品的存储、压缩货品的存储成本正成为现代物流管理者不断思考的问题,对于货品的存放问题,哪些货品放在一起可以提高拣货效率?哪些货品放在一起却达不到这样的效果呢?可以利用以往的商品流动数据,采取数据挖掘中的关联模式来分析解决这个问题。
  关联模式分析的目的就是为了挖掘出隐藏在数据间的相互关系,即通过量化的数字,描述A类产品的出现对B类产品的出现有多大影响,可以用四个属性来描述关联规则:
  ·可信度:在产品集A出现的前提下,B出现的概率
  ·支持度:产品集A、B同时出现的概率
  ·期望可信度:产品集B出现的概率
  ·作用度可信度:对期望可信度的比值
  通过上述关联分析可以得出一个关于同时购买商品的简单规则,从而来决定这两种货品在货架上的配置,可以战略性的布置货品在仓库中的位置,以促进交叉销售和某类交易模式。
  5)顾客价值分析
  根据市场营销的原则,对待不同类型的顾客所提供的服务水平也应该有所不同的。通过分析客户对物流服务的应用频率、持续性等指标来判别客户的忠诚度,通过对交易数据的详细分析来鉴别哪些是物流企业希望保持的客户,通过挖掘找到流失客户的共同特征,就可以在那些具有相似特征的客户还未流失之前进行针对性的弥补。
  6)物流需求预测
  物流企业规划和控制物流活动需要准确估计供应链中所处理的产品和服务的数量,这些估计主要采用预测和推算的方式。数据挖掘可以对物流活动中的产品和服务类型随时问变化的规律和趋势进行建模描述。时间趋势分析可以对现有商品在时间上的变化找出趋势,然后确定需要注意和开发商品的类型。空间趋势分析可以根据地理位置的变化找到趋势,然后确定以往重点发展的区域,这对于物流企业长远的发展也是至关重要的。
  4 结束语
  数据挖掘技术已经在商业、金融业、保险业、电信业等多个领域开始得到应用,取得了令人满意的效果。我国物流企业在数据挖掘应用方面还处于起步阶段,经验不足,应用实践在国内物流企业中还并不多见。但随着数据挖掘应用研究的深入开展,以及物流企业追求运营绩效愿望的增强,将会有越来越多的物流企业引入数据挖掘,为各物流企业在激烈的竞争中掌握主动,在未来的发展中提供更广阔的空间,发挥重要的作用,数据挖掘在物流企业管理中将会有更加广阔的前景。