决策树例题经典案例280_决策树在产品满意因素分析中的应用

来源:教师总结 发布时间:2019-03-30 04:46:11 点击:

  【摘要】将决策树算法应用到产品满意因素分析领域,探讨了决策树算法在客户分析产品满意因素时的应用策略,建立了产品满意因素分析模型,模型的结果分析说明了应用策略的合理性。
  【关键词】决策树;客户分析;模型建立
  
  随着经济的全球化、市场的国际化,国内市场环境已渐趋合理且竞争日益加剧。在产品制造领域,以生产为中心、销售产品为目的的市场战略逐步被以客户为中心、服务为目的的市场战略所取代。新的市场战略指导下,企业纷纷加大了产品客户满意因素的分析,生产并销售出让客户更为满意的产品,达到了吸引潜在客户、巩固现有客户、加大产品市场占有率的目标。
  针对产品客户满意因素分析这一预测分类问题,引入了决策树算法,探讨了决策树算法在产品客户满意因素分析中的应用策略,建立了产品满意因素分析模型,实现了决策树在产品客户满意因素分析中的应用。
  一、决策树简介
  决策树是通过一系列规则对数据进行分类的过程,它提供了一种在什么条件下会得到什么值的类似规则的方法。可以用一棵倒置的树状结构来形象地描述决策树,一棵决策树包含一个根节点、零个或者多个内部节点和一个或者多个叶子节点。它利用树结构的不同对记录集进行不同的分类,树的每个叶节点就代表某个条件下记录集中的一个子集,根据记录集中属性的不同来进行属性的分裂,建立下层节点,即进行树的分支,整个过程自顶向下递归构造决策树,这就是决策树生成的思想。假设记录集为S,下面是生成初步决策树的递归算法:
  partition(S)
  if (all tuples in S are of the same class) then return;
  /*无需分类*/
  for each value of attribute A do evaluate the split on that value;
   /*评估分裂的算法见下文*/
  use best split found to partition S into S1 and S2;
  partition(S1); /*递归调用partition( )*/
  partition(S2);
  在决策树的生成过程中,需要对一个根节点或者内部节点进行依据记录集属性的分裂,选择不同的属性,会使划分出来的记录子集不同,从而决策树生长的快慢和得到的信息规则都会受到有很大的影响。如何找到最优的分裂,从而建立下层节点,这是决策树建立过程中一个重要问题。基尼指数(Gini Index)是用得较多的一种决策树分裂评估准则,其定义为:
   (1)式中,S是被分类的属性关系,设有N个元组; 为各类在S中出现的相对频度;n是S中所含的类的个数。一个属性关系的基尼指数愈小,其分类情况愈好。如果S按某种条件分裂为S1和S2,设S,S1和S2的元组数分别为N,N1和N2,则此分裂的基尼指数可定义为:
  
   利用(2)式可以评估每个分裂的好坏,取最小者作为优选的分裂。
  二、决策树在产品满意因素分析中的应用策略
  1、属性字段的选取
  调查客户对产品属性的满意程度和需求趋势等相关信息,选取重要的产品属性字段。面对众多的产品属性,选取客户较为关心的属性字段进行产品客户分析。
  目前选取的某产品的输入属性字段一共有7个变量,分别为:产品重量、产品外形、产品颜色、产品价格、产品配置、产品质量、产品维护。
  2、数据采集和数据处理
  根据选取的产品属性字段,调查客户对产品不同属性组合的满意程度,听取客户对新产品的属性组合的需求趋势,搜集一定量的客户调查记录。然后将采集到的有效数据记录做统一的处理、分类工作,直到满足数据建模要求。
  经过处理我们得到了如表1所示的部分数据,该产品的属性字段含义如下:
  A.产品重量:1表示≤1000kg;2表示>1000kg
  B.产品外形:2表示2门;4表示4门
  C.产品颜色:1表示红;2表示黑;3表示其他
  D.产品价格:1表示≤¥150,000;2表示>¥150,000
  E.产品配置:1表示基本;2表示较高;3表示更高;4表示最高
  F.产品质量:1表示一般;2表示较高
  G.产品维护:1表示定期维护;2表示不定期维护
  H.产品满意:1表示满意;0表示不满意
  3、生成决策树模型
  运用决策树算法进行建模是整个产品客户分析中最为关键、最为核心的阶段。该阶段的主要任务是选择合适的输入变量,设置合适的决策树参数来建立模型。常用的决策树训练可分成两个阶段:首先,根据最优的分裂标准选择某个属性对训练集进行划分,递归调用直到每个划分中的所有记录都属于同一个类,建立初步的树;然后,对建立的树进行剪枝,消除错误的分支并限制树的深度。
  设定决策树分裂时一个分支的最小样本数为2,连续值分叉结点的最大分叉数设为3,选用基尼指数作为决策树分裂评估标准,并对决策树进行深度剪枝,决策树最大深度为5,得到下面的决策树规则和图1所示的决策树图。
  决策树规则:
  规则1
  如果: 颜色属于 [0.99 ,2.07)
  并且: 配置属于 [0.99 ,1.20)
  那么: 满意===> 1
  规则2
  如果: 颜色属于 [0.99 ,2.07)
  并且: 配置属于 [1.20 ,3.20)
  并且: 价格属于 [0.99 ,1.07)
  那么: 满意===> 0
  规则3
  如果: 颜色属于 [0.99 ,2.07)
  并且: 配置属于 [1.20 ,3.20)
  并且: 价格属于 >=1.07
  那么: 满意===> 1
  规则4
  如果: 颜色属于 [0.99 ,2.07)
  并且: 配置属于 >=3.20
  那么: 满意===> 1
  规则5
  如果: 颜色属于 >=2.07
  并且: 价格属于 [0.99 ,1.10)
  那么: 满意===> 1
  规则6
  如果: 颜色属于 >=2.07
  并且: 价格属于 >=1.10
  那么: 满意===> 0
  分析决策树图和相关规则,我们可以得到产品客户满意因素分析初步结果。根据上述决策树中的规则1,我们可以得到这样的知识:如果产品颜色是红色或者是黑色,并且产品配置是普通配置,那么客户对该产品一般都较为满意,该产品有一定的需求量。再如规则6,如果产品颜色是其他颜色,并且产品价格超过¥150,000,那么客户对该产品一般不是很满意,该产品的需求量也不高。
  三、结束语
  本文重点探讨了决策树在产品客户分析中的应用策略,并用决策树方法构建了产品满意因素分析预测模型,用于分析预测客户对产品属性的满意程度和需求趋势。本文采用了基尼指数生成决策树的方法,介绍了生成决策树模型的主要步骤。产品客户分析算例证明,该算法分析预测效果好,性能稳定,为产品生产和销售服务等工作提供了重要参考和建议。
  
  【参考文献】
  [1] 潘微, 叶晓俊. 提高客户满意度的决策支持模型[J]. 哈尔滨工业大学学报, 2005,37(4):504-506.
  [2] 郭玉滨. 决策树算法研究综述[J]. 电脑知识与技术学术交流, 2006,(1): 155-160.
  [3] Breiman L, Friedman J H, Olshen R A, et al. Classification and Regression Trees[R]. Montery, CA: Wadsworth International Group, 1984.

推荐访问:思想汇报 思想汇报 思想汇报 思想汇报
上一篇:侍坐章中孔子教育_从《侍坐章》窥探孔子的教育理念及浅谈对当今教育的启迪
下一篇:汉语教程三册上答案 《汉语教程》(一二册)中的量词

Copyright @ 2013 - 2021 韩美范文网- 精品教育范文网 All Rights Reserved

韩美范文网- 精品教育范文网 版权所有 湘ICP备11019447号-73