CRM系统:数据挖掘在企业CRM中的研究
数据挖掘在企业CRM中的研究
李忠
( 1 江南大学; 2 常州高等职业技术学校, 江苏常州213000)
摘要:本文主要介绍了数据挖掘的基本概念、功能分类以及数据挖掘技术在CRM中的典型应用; 随后文章选择C4.5 算法
为本系统增加分析功能; 接着对C4.5 算法进行了深入的研究与分析, 发现在计算速度以及生成结果的复杂性上有待改进, 在
此基础上提出了改进优化的方法并用程序实现, 通过实验比较证明取得了良好的效果。在文章的最后用改进后的C4.5 算法
为本CRM系统实现了客户的保持分析功能。
关键词: CRM; 数据挖掘; 改进C4.5 算法; 功能; 处理
1 引言
客户关系管理(Customer Relationship Management)的指导思
想就是对客户进行系统化的研究, 以便改进对客户的服务水平,
提高客户的忠诚度, 并因此为企业带来更多的利润。这就要求
CRM系统要能够在有效地获取客户的各种信息的同时, 对客户
的行为方式进行深入地分析, 寻找其中的规律, 为客户提供更
好、更个性化的服务, 为企业决策提供支持。然而如何管理和分
析大量、庞杂的客户信息, 从中找出对企业管理决策有价值的知
识则需要有更先进的技术和工具的支持, 而数据挖掘等新兴技
术的出现, 为CRM的实施提供了良好的支持。
数据挖掘的功能以及方法有多种, 如关联分析、分类、聚类和时
序模式等, 关联分析可以用于交叉营销中的连带销售; 聚类一般
可以用于数据挖掘前数据的预处理; 而分类是CRM中运用最为
广泛的一种方式, 它可以被用于客户细分、客户获取等方面, 本
文将使用分类方法为CRM系统实现客户的保持功能, 在接下来
将重点讨论数据挖掘的CMR 中的运用。
2 典型算法分类与选择
目前已经出现了好几种决策树分类算法, 如: ID3; C4.5;
CHAID; CHART; SLIQ; SPRINT; PUBLIC 等, 现列出与本课题相
关的具有代表性的一些算法。
ID3 算法虽然是比较经典也是最老的一种算法, 可是它存
在许多的不足: 一是它不能处理连续属性值, 对于连续值属性,
它都要把该属性离散化, 这样就大大降低了分类的精确度; 二是
算法过程不灵活, 不能处理有空缺值的样本集合, 这就对训练样
本集合的质量提出很高的要求。三是生成的决策树太大, 因为对
于每个离散属性如果作为分裂属性, 如果有n 个属性值, 那么就
会长出n 个子树。
SPRINT 算法是一种比较成熟的决策树分类算法, 它几乎克
服了以往已经提出的算法中的一些缺憾, 可是该算法的侧重点
在于处理超大形容量的数据。此算法可以不受到机器主存大小
的限制, 可以把数据在主存与辅存之间来回切换。本人认为在本
文所建立的CRM系统中所处理的数据是与客户有关, 而象中小
型企业这样的客户容量远没有这样的大, 所以不建议使用该算
法。
C4.5 算法是Quinlan 的ID3 算法的改进版本, 该算法克服
了ID3 中的缺憾, 能够直接处理连续值属性, 能够处理有空缺值
的样本集合。它从树的根结点处的所有训练样本开始,选取一个
属性来区分这些样本。对属性的每一个值产生一个分支, 分支属
性值的相应样本子集被移到新生成的子结点上, 这个算法递归
地应用于每个子结点上, 直到结点的所有样本都分区到某个类
中, 到达决策树的叶结点的每条路径表示一个分类规则。这样自
顶向下的决策树的生成算法的关键性决策是对结点属性值的选
择。该算法简单易懂, 而且效率高, 这也正是我们所追求的目标。
所以本文中, 我们选择该算法为CRM实现客户的保持分析功
能。
3 基于C4.5 算法的改进
C4.5 算法虽然添加了对于有连续值的属性的处理方法, 可
是在每个结点处都要对连续值进行排序, 浪费大量CPU 时间。
本文在C4.5 算法的基础上引进了SPRINT 算法中对于连续值的
处理方法, 采用属性列表( attribute lists) 的方式对记录集一次性
进行排序。在表的数据集中, 我们在读入内存的过程中就将其
分解为两个属性的列表, 然后对有连续值的属性进行一次性的
排序。
强力推荐:
天柏客户关系管理系统
天柏客户关系管理系统(CRM)是一款集专业性、实用性、易用性为一体的纯B/S架构的CRM系统,它基于以客户为中心的协同管理思想和营销理念,围绕客户生命周期的整个过程,针对不同价值的客户实施以客户满意为目标的营销策略,通过企业级协同,有效的“发现、保持和留住客户”,从而达到留住客户、提高销售,实现企业利润最大化的目的。通过对客户进行7P的深入分析,即客户概况分析(Profiling)、客户忠诚度分析(Persistency)、客户利润分析(Profitability)、客户性能分析(Performance)、客户未来分析(Prospecting)、客户产品分析(Product)、客户促销分析(Promotion)以及改善与管理企业销售、营销、客户服务和支持等与客户关系有关的业务流程并提高各个环节的自动化程度,从而帮助企业达到缩短销售周期、降低销售成本、扩大销售量、增加收入与盈利、抢占更多市场份额、寻求新的市场机会和销售渠道,最终从根本上提升企业的核心竞争力,使得企业在当前激烈的竞争环境中立于不败之地。