51Testing软件测试论坛

标题: 模糊数据挖掘在CRM中的应用 [打印本页]

作者: Kingson 时间: 2007-12-29 14:56
标题: 模糊数据挖掘在CRM中的应用
　　1 CRM概述
　　客户关系管理(CRM)就其功能来看，就是借助先进的信息技术、网络技术和管理思想，通过对企业业务流程的重组来整合客户信息资源，并在企业内部实现客户信息和资源的共享，为客户提供更经济、更快捷更满意的产品和服务，提高客户价值、忠诚度和满意度，保持和吸引更多的客户，从而增强企业的赢利能力，最终实现企业利润的最大化。
　　为实现这样的目标，企业可通过建立完整的客户数据、量身订制的产品及服务、有效的管理来建立以客户为中心的组织，去了解客户生命周期、掌握最有价值的客户及其需求、发展以个人财务需求为导向的销售模式，最终达到提高客户满意度，并提升企业的竞争力与获利率。
　　客户划分是 CRM中的首要问题，一个企业在经营策划时要非常明确以下问题:销售对象是哪个客户层，哪些客户需要这样的产品，是否考虑了客户生命周期，是否建立了以客户需求为导向的客户关系，谁是公司最有价值的客户。要回答和解决以上问题，首要任务就是综合各种数据，从不同角度对客户进行分群、分组划分。
　　2 数据挖掘技术概述
　　数据挖掘是一种知识发现的过程，它主要基于统计学、人工智能、机器学习等技术，从大量的数据中，抽取出潜在的、有价值的知识、模型或规则的过程。高度自动化地分析数据，做出归纳性的推理，从中挖掘出潜在的模式，并对未来情况进行预测，以辅助决策者评估风险，做出正确的决策。对于企业而言，数据挖掘有助于发现业务的趋势，揭示已知的事实、预测未知的结果，提高市场决策能力。其演化过程如图 1所示。
　　然而单纯的数据挖掘可能会导致“尖锐边界”等问题，因此考虑将模糊逻辑和数据挖掘结合起来的模糊数据挖掘技术引人到客户关系管理系统中。
　　

　　3 模糊数据挖掘方法
　　3.1 确定模糊集
　　建立样本特性指标矩阵，设聚类的对象的全体集合X={x1，x2，…，xn}，为了使分类效果科学合理，首先要选取具有实际意义且有较强分辨性和代表性的统计指标。现假设X中每一个元素Xj(j=1,2,…,n。)有m个统计指标Xij=(x1j，x2j，…，xnj)，其中，分量Xij表示第j个元素的第i项统计指标值(i=1，2，…，m;j=1，2，…，n)。本步骤的关键是统计指标值的求法。统计指标值反映实际的精确程度，是取得最优聚类的先决条件，由于各企业的实际情况不一样，所选取的统计指标也应各不相同。因此，统计指标值的求法因实际问题而定。
　　3.2 对样本特性指标矩阵进行数据规格化
　　在实际问题中，通常不同的数据有不同的量纲。因此，需要根据模糊矩阵的要求，进行标准化处理。一般可通过以下变换来实现。
　　3.2.1 平移/标准差变换
　　

　　3.3 标定— 建立模糊相似矩阵
　　所谓标定，是指根据实际情况，选用一定的方法对对象进行比较得出模糊相似矩阵。根据上述已建立的指标体系Xj(j=1，2，…n)，求出相似系数rij表示Xi与Xj按m个特征相似的程度，得到模糊相似矩阵R=(rij)mxn本步骤的关键是如何合理地求出相似系数rij，由于求相似系数的方法很多，而且需要因实际情况不同而选用不同的方法。
　　求相似系数的方法很多，主要有最大最小法、算术平均值最小法、几何平均值最小法、相关系数法、夹角余弦法、距离法、数量积法、绝对值指数法、绝对值倒数法、绝对值减数法等方法。
　　对于一些实际问题，很难用解析表达式来刻画事务间的相关程度，这时只有请有经验者或专家进行评分，用〔0，1〕上的数表示。选取什么样的方法描述两个元素之间的相似程度，将直接影响分类的效果。通常是同时选三四种，最后看分类与实际吻合的情况，择优选取。

作者: Kingson 时间: 2007-12-29 14:57
　　3.4 求传递闭包— 构造模糊等价矩阵
　　用传递闭包法求R的模糊等价矩阵。传递闭包是包含R的最小传递矩阵，设 t(R)是R的传递闭包，通常采用平方法求R的传递闭包，即R→R2→R4 →Rg →…→R2k经有限次运算后，一定有R2k=R2k+1，于是t(R)=R2k。
　　3.5 聚类结果
　　利用各个需求对该次分类的相对隶属度数据应用相对类别(级别)特征公式，得到各个部件归属各类的相对类别特征值H(r)表，从而获得了该分类数目下的部件类别划分结果。
　　根据择近原则，判断该样本接近哪个模式，从这个模式的整体情况预测其发展结果。
　　4 应用模糊数据挖掘实现客户分类
　　假定每一个客户对一类产品的外观、使用环境功能、可靠性都有各自的要求，那么，对于产品簇建模过程来说，要将这些不同客户的不同需求转化为产品的工程指标，并最终转化为产品的零部件，工作量是非常大的，也是不科学的。所以要对不同客户的需求进行必要的聚类，通过聚类将产品需求分为不同的簇，同一簇中的产品需求视为相同，不同簇中的产品需求视为相异。这样就可以减少产品模型的种类，并且使形成的产品种类最大限度地满足不同客户的需求。
　　4.1构造模糊集
　　选取样本为5x5阶矩阵。设从外观、使用环境、产品功能、可靠性、忠诚度5个方面描述对产品的需求，构建模糊集 R如表1所示。
　　

　　4.2 关联矩阵规格化
　　

　　首先根据各个产品需求在产品中的地位给出其相应的权重(相当于指标对聚类作用的权重)。应用式(1)和式(2)实现规格化，结果如表2所示。

作者: Kingson 时间: 2007-12-29 14:57
　　4.3 求传递闭包— 构造模糊等价矩阵
　　用传递闭包法求R的模糊等价矩阵。传递闭包是包含R的最小传递矩阵，设 t(R)是 R的传递闭包，通常采用平方法求R的传递闭包，即R→R2→R4 →Rg →…→R2k经有限次运算后，一定有R2k=R2k+1，于是t(R)=R2k。求得最优模糊矩阵。最优模糊矩阵表述的内容是每一个需求对各类别(共有m个)的相对隶属度。
　　4.4聚类结果
　　利用各个需求对该次分类的相对隶属度数据，应用相对类别(级别)特征公式，得到各个部件归属各类的相对类别特征值H(r)表，从而获得了该分类数目下的部件类别划分结果。应用下述的公式对最优模糊矩阵进行处理。
　　设分类状态为1~m，某部件对某正态的相对隶属度表示为RA1(r)~ RAc(r)，即表达了上文的最优模糊矩阵。首先，相对隶属度满足归一化条件:
　　

　　设状态变量i以对应的相对隶属度为权重，其总和
　　

　　称为相对状态特征值或级别特征值。表示了i与H(r)分布列的整体相对特征，因此，H(r)可以作为样本R对模糊概念或指标Ai归属状态判断的相对指标，它利用了状态变量i对全部相对隶属度信息，使样本 R的归属更为全面和客观。改变分类的数目m，重复上述步骤，产生新的分类，最终得到针对不同m分类的产品需求聚类结果。当m=3时，最优模糊矩阵如表3所示。
　　

　　通过对m=3时产品需求聚类分析结果的观察，可以容易地发现各个需求指标的聚分程度:{R5}，{R1，R3}，{R2，R4}。这说明，在考虑客户需求时，对于忠诚度高的客户群体，可以将他们的需求作为一类产品类型来重点构建;对于第二种分类，说明应该着重针对产品外观和产品功能来构建一类产品模型;同理，另外一种产品模型的构建应着重考虑产品的使用环境和产品的可靠性。可以看出，通过这样的聚类，产品模型的种类减少了，但产品模型覆盖的客户需求是完备的。
　　5 结束语
　　模糊数据挖掘能够自动地从数据库中发掘出新的知识，经过检验和验证，然后返回对用户有用的结果，而不是根据用户对事物的假设去检验和验证。它与传统的数据分析本质的区别是:它是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘系统已成功地用于超大型数据库的知识挖掘。
　　在信息时代，要充分利用企业的信息资源，从以产品为中心的管理模式转变为以客户为中心的管理模式上来，利用模糊数据挖掘技术，分析客户的特征，探索企业和所对应市场的运营规律，不断提高企业的经济效益是企业发展的必由之路。

欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/)