CRM系统:数据挖掘在通信行业客户关系管理中的应用
数据挖掘在通信行业客户关系管理中的应用
曾耀辉
(广东南方电信规划咨询设计院有限公司惠州分公司 惠州 516003)
摘 要 数据挖掘(Data Mining),是指从大量数据中,提取正确的、新颖的、潜在有用的并能够被理解的知识
的过程。本文介绍了数据挖掘在通信行业客户关系管理中的应用过程,以及应注意的问题。指出,通过
利用数据挖掘技术建立基于数据挖掘技术的客户关系管理模式,终将极大地提升企业的竞争优势,提高
企业的竞争水平。
关键词 客户关系管理 数据挖掘 通信企业 客户流失
1 数据挖掘的概念和流程
1.1 数据挖掘的概念
数据挖掘(Data Mining),也叫知识发现、数据
开采等,是指从大量数据中,提取正确的、新颖的、潜
在有用的并能够被理解的知识的过程。 数据挖掘能进行
分类预测、聚类分析、关联规则和序列模式的发现、相
关分析、异常监测和趋势分析[1]。
数据挖掘技术是目前数据仓库领域广泛使用的数据
分析手段。 它的分析思想是利用已知的数据通过建立数
学模型的方法找出隐含的业务规则, 在很多行业中都有
成功的案例。比如信用卡欺诈预测、通信行业恶意呼叫
行为分析等。
按照所挖掘的数据模式的不同,可以将数据挖掘方
法划分为以下4 种[2]。
(1)关联规则发现,关联规则挖掘发现大量数据中
项集之间有价值的关联或相互联系。
(2)分类和预测,分类和预测用于提取描述重要数
据类的模型并运用该模型预测未来的数据趋势。
(3)聚类分析,聚类就是将数据对象分组成为多个
类或簇,在同一个簇中的对象之间具有较高的相似度,
而不同簇中的对象差别较大。
(4)序列模式分析,序列模式分析和关联分析相
似,其目的也是为了挖掘数据之间的联系,但序列模式
分析的侧重点在于分析数据间的前后序列关系。
通常一个完整的数据挖掘过程由业务问题定义、 数
据过滤、预处理、分析、准备、模型选择与建立、模型
的评估与检验、模型应用与巩固等多个步骤组成。以下
介绍运用数据挖掘技术分析客户流失的一般过程。
1.2 数据挖掘流程
通信企业保存着客户的相关信息, 呼叫数据及计费
等大量的数据,这些业务数据虽看似普通,却能释放出
关于客户流失方面的珍贵信息, 数据挖掘技术与海量数
据有密不可分的关系,以及其强大的数学算法,使得它
能够根据这些数据建立有关客户流失的预测模型, 从而
分析出客户流失的主要原因并且采取相应措施有效地挽
留有流失倾向的客户。
数据挖掘是一个周而复始的过程, 许多软件供应商
和数据挖掘顾问公司都提供一些数据挖掘过程模型, 来
指导他们的用户一步步的进行数据挖掘工作,比如
SPSS 的5A 和SAS 的SEMMA。但基本的数据挖掘步
骤包括以下几个步骤。
1.2.1 定义业务问题
业务问题定义要明确数据挖掘技术解决的是何种商
务问题,对客户流失管理来说就是要定义何为流失。移
动通信领域的客户流失有三方面的含义: 一指客户从本
移动运营商转网到其他通信运营商, 这是流失分析的重
点;二指客户使用的手机品牌发生改变,从本移动运营
商的高价值品牌转向低价值品牌, 如中国移动的用户从
全球通客户转为神州行客户;三指客户ARPU(指每用
户月平均消费量)降低,从高价值客户成为低价值客户。
在客户流失分析中有两个核心变量:财务原因/ 非财
务原因、主动流失/被动流失。客户流失可以相应分为
4种类型,其中非财务原因主动流失的客户往往是高价
值的客户。他们会正常支付服务费用,并容易对市场活
动有所响应。这种客户是通信企业真正需要保住的客
户。
1.2.2 数据处理
这一过程所花的时间和精力要占整个数据挖掘项目
的50%~90%,它包括4 个步骤。
(1)数据过滤,这一步骤可以确保收集的数据符合
分析的需要。
(2)数据预处理,这一步骤应确保原始数据和输入
标准一致,将分布在不同的数据库中的数据和输入标准
一致,将分布在不同的数据库中数据,集合和合并到单
一的营销数据库,并协调来自多个数据源的数据在数值
上的差异,使数据属性标准化。
(3)数据分析,在建立良好的预测模型之前,必须
对预处理后的数据进行初步分析,初步认识,找出对预
测输出影响最大的数据字段,和决定是否需要定义导出
字段。
(4)数据准备,这是建模前数据处理的最后一步,
也是数据挖掘过程的核心。
主要有4个部分:选择变量、选择记录、创建新变
量、转换变量,使之和选定用来建立模型的算法一致。
1.2.3 建立模型
在多个可供选择的模型中找出最佳模型, 初始模型
可能没法达到数据挖掘的目的,需要多次反复。在寻找
最优模型过程中,可能要修改正在使用的数据,甚至修
改问题的定义。
1.2.4 评估和解释模型
这个阶段是对数据挖掘阶段构建的模型进行比较和
评估,生成一个相对最优模型,并对此模型用业务语言
加以解释。模型验证的标准方法是从预处理数据中随机
抽取两个样本,一个校准样本用于构建模型,一个样本
用于验证校准样本产生的模型。 通常一个好的模型运用
到验证样本中能得到较好的效果,如果效果差,就需要
重新构建模型。
1.2.5 运用和巩固模型
对模型在实际应用中的表现进行监控, 将数据挖掘
的结果同运营市场反馈紧密联系起来, 如果模型表现不
好,应实时适应市场调整挖掘模型,对模型做进一步的
考察和修正,以反映业务运作规律的变化。
2 客户关系管理中数据挖掘的应用条件
目前通信运营商都具有业务营运系统、业务受许多
理网站、客户服务呼叫中心等客户信息系统,也拥有许
多成熟的数据库应用系统,这些系统具有如下特点。
(1)目前通信运营系统实质上是实现了数据的物理
集中,业务系统之间则相互独立。
(2)众多的客户数据、市场营销数据、账务数据以
不同的数据格式和访问方式分散在不同的系统中,过于
分散、冗余,没有形成整体的、唯一的、集中的客户数
据,不能满足数据挖掘过程中数据必须具有单一视图的
要求。
(3)这些系统都是联机事务处理(On-Line Transaction,
OLTP)系统,实时处理在线事务,不能适应数
据挖掘应用大规模、频繁的检索和查询操作。
数据挖掘技术本身不是万能的,一个完善的CRM
系统应该以数据挖掘技术为核心,要有效的支持客户关
系管理,必须建立企业级的客户信息数据仓库,能够把
强力推荐:
天柏客户关系管理系统
天柏客户关系管理系统(CRM)是一款集专业性、实用性、易用性为一体的纯B/S架构的CRM系统,它基于以客户为中心的协同管理思想和营销理念,围绕客户生命周期的整个过程,针对不同价值的客户实施以客户满意为目标的营销策略,通过企业级协同,有效的“发现、保持和留住客户”,从而达到留住客户、提高销售,实现企业利润最大化的目的。通过对客户进行7P的深入分析,即客户概况分析(Profiling)、客户忠诚度分析(Persistency)、客户利润分析(Profitability)、客户性能分析(Performance)、客户未来分析(Prospecting)、客户产品分析(Product)、客户促销分析(Promotion)以及改善与管理企业销售、营销、客户服务和支持等与客户关系有关的业务流程并提高各个环节的自动化程度,从而帮助企业达到缩短销售周期、降低销售成本、扩大销售量、增加收入与盈利、抢占更多市场份额、寻求新的市场机会和销售渠道,最终从根本上提升企业的核心竞争力,使得企业在当前激烈的竞争环境中立于不败之地。