CRM系统:数据挖掘在电信客户关系管理的应用
数据挖掘在电信客户关系管理的应用
何明轩
( 同济大学, 上海200092)
摘要: 本文介绍了数据挖掘的相关概念与知识, 提出了数据挖掘在当今从海量数据中提取相关信息, 和知识发现的过程, 与此同时介
绍了数据挖掘在帮助企业进行数据分析, 推理, 预测的应用, 例如: 关联分析、时序模式、偏差分析、分类、聚类、预测等。与此同时, 着重提
出了数据挖掘在电信行业营销的应用, 介绍了国内外应用现状, 并以国内某电信运营商的数据仓库项目为例, 例证了数据挖掘在客户分
群和流失预测的成功应用, 在此基础上, 展望了未来的可发展方向。
关键词: 数据挖掘; 企业应用; 电信客户分群; 客户流失预测
中图分类号: TP274 文献标识码: A 文章编号: 1009- 3044(2007)03- 10620- 02
The Application of Data Mining on CRM in Telecommunicaion
HE Ming- xuan
(Tongji University,Shanghai 200092)
Abs tract:This paper is about the introduction of data mining including the conception and some related knowledge which is discovering invisible
information from huge of data, we can call it process of knowledge of learning. Meanwhile, it also presents the application of data mining
on the field of data analysis, consequence and forecast in enterprises. For example, association analysis, warp analysis, sequence module, classification
and clustering. It also takes a telecommunication enterprises as example, which testified the success of attempt at using data mining at customer
clustering and prediction of losing customers. At the end of the paper, it prospects the future of the App of data mining on the solution of
other problems in telecommunication.
Key words :Data mining; Application on enterprises; Customer clustering; Prediction of losing customer
1 引言
随着国内电信市场竞争的日趋激烈, 电信运营商的经营模式
逐渐从“技术驱动”向“市场驱动”、“客户驱动”转化。这就要求运
营商要采取以客户为中心的策略, 根据客户的实际需求提供多样
化、层次化、个性化的服务解决方案。因此, 客户关系管理成了电
信运营商增加收入和利润, 提高客户满意度、忠诚度的有效工具。
在客户关系管理的流程中, 为了准确、及时地进行经营决策, 必须
充分获取并利用相关的数据信息对决策过程进行辅助支持。另
外, 面对用户的多样化、层次化、个性化的需求, 大众化营销已经
失去了它的优势, 基于客户信息、客户价值和行为的深入的数据
分析的洞察力营销、精确化营销的理念逐渐被各大电信运营商所
接受, 并渴望通过从数据中挖掘价值来减少营销成本、提高
营销效益。近几年迅速发展起来的数据挖掘技术成为实现这些目
标的必要手段。
数据挖掘是从海量数据中提取隐含在其中的有用信息和知
识的过程。它可以帮助企业对数据进行微观、中观乃至宏观的统
计、分析、综合和推理, 从而利用已有数据预测未来, 帮助企业赢
得竞争优势。例如, 利用数据挖掘可以对企业的海量数据进行客
户分析, 包括客户类型、各类客户的需求倾向、购买行为预测和客
户信用政策分析、客户流失分析等; 进行市场研究, 包括商品市场
占有率预测、市场拓展计划仿真; 进行经营策略研究, 包括经营成
本与收入分析、风险控制、欺诈行为甄别等。
数据挖掘旨在从数据库中提取正确的、非平常的、未知的、有
潜在应用价值的并最终可为用户理解的模式。它的出现为自动和
智能地把海量的数据转化成有用的信息和知识提供了手段。数据
挖掘涉及到诸如机器学习、模式识别、统计学、数据库和人工智能
等等众多学科, 是数据库理论和机器学习的交叉学科。
2 数据挖掘主要的一些应用
(1)关联分析: 其目的就是挖掘出隐藏在数据间的相互关系。
例如, 买电脑的顾客同时会买某种软件, 这就是一条关联规则。
(2) 时序模式: 通过时间序列搜索出重复发生概率较高的模
式, 这里强调时间序列的影响。例如, 购买了激光打印机的人中,
半年后80%的人会买新硒鼓。
(3)分类: 找出一个类别的概念描述, 它代表了这类数据的整
体信息。分类数据挖掘中应用最多的任务。
(4)聚类: 按一定规则将数据分为一系列有意义的子集。同一
聚类中, 个体之间的差距较小; 不同聚类中, 个体之间的距离偏
大。聚类和分类有着很大的区别: 分类时, 我们总是事先知道哪些
属性是重要的, 我们总是将重要的、有影响力的属性作为分类的
依据; 而聚类时, 我们事先根本不知道哪些属性起作用, 我们的任
务就是要找到那些起关键作用的属性。
(5)偏差分析: 从数据库中找出异常数据, 比如欺诈行为的发
现。
(6)预测: 利用历史数据找出规律, 建立模型, 并用此模型预测
未来数据的种类、特征等。
在国内外, 数据挖掘已经有不少成功案例。目前国内企业实
现数据挖掘的困难在于缺少数据积累、难于构建业务模型、各类
人员之间的沟通存在障碍、缺少有经验的实施者、初期资金投入
较大。而在国外, 数据挖掘首先在金融、证券、电信、零售业等数据
密集型行业实施, 因为这些行业信息化程度比较高, 数据库中已
经保留了大量数据资源。有数据表明, 进入二十世纪90 年代, 人
类积累的数据量以每月高于15%的速度增加, 如果不借助强有力
的挖掘工具, 仅依靠人的能力来理解这些数据是不可能的。数据
挖掘的前景被人们普遍看好。国际知名调查机构Gartner Group 在
高级技术调查报告中, 将数据挖掘和人工智能列为“未来三到五
年内将对工业产生深远影响的五大关键技术”之首, 还将并行处
理体系和数据挖掘列为未来五年内投资焦点的十大新兴技术前
两位。Gartner 的调查报告预计: 到2010 年, 数据挖掘在相关市场
的应用将从目前少于5%增加到超过80%。美国银行家协会预测
数据仓库和数据挖掘技术在美国商业银行的应用增长率是
14.9%。
数据挖掘目前在电信行业也已得到广泛应用, 比如:
(1)客户消费模式分析
客户消费模式分析( 如固话话费行为分析) 是对客户历年来
长话、市话、信息台的大量详单、数据以及客户档案资料等相关数
据进行关联分析, 结合客户的分类, 可以从消费能力、消费习惯、
消费周期等诸方面对客户的话费行为进行分析和预测, 从而为固
话运营商的相关经营决策提供依据。
(2)客户市场推广分析
客户市场推广分析( 如优惠策略预测仿真) 是利用数据挖掘
技术实现优惠策略的仿真, 根据数据挖掘模型进行模拟计费和模
拟出账, 其仿真结果可以揭示优惠策略中存在的问题, 并进行相
应的调整优化, 以达到优惠促销活动的收益最大化。
(3)客户欠费分析和动态防欺诈
通过数据挖掘, 总结各种骗费、欠费行为的内在规律, 并建立
一套欺诈和欠费行为的规则库。当客户的话费行为与该库中规则
吻合时, 系统可以提示运营商相关部门采取措施, 从而降低运营
商的损失风险。
(4)客户流失分析
根据已有的客户流失数据, 建立客户属性、服务属性、客户消
费情况等数据与客户流失概率相关联的数学模型, 找出这些数据
之间的关系, 并给出明确的数学公式。然后根据此模型来监控客
户流失的可能性, 如果客户流失的可能性过高, 则通过促销等手
段来提高客户忠诚度, 防止客户流失的发生。这就彻底改变了以
往电信运营商在成功获得客户以后无法监控客户流失、无法有效
实现客户关怀的状况。
各运营支撑系统所积累的海量历史数据是企业的一笔宝贵
财富, 谁能正确地挖掘与分析隐含在数据中的知识, 谁就能更好
地向用户提供产品与服务, 从而在竞争中获胜。数据挖掘正是充
分利用这些宝贵资源从中提取知识的一种技术。在国外, 英国电
信选用了SPSS 的数据挖掘产品Clementine, 为其“商业高速公路”
活动分析数据和建立探索模型, 更好地了解了这些客户的行为特
征, 向销售人员提供最佳客户的清单, 直邮活动回应率提高了
100%。美国西部电信利用销售活动管理软件, 连同SAS 的Enterprise
Miner 一起, 既消除了销售人员对全部客户数据进行评分
的负担, 也减少了手工干预所造成的人为错误, 公司的市场营销
周期大为缩短, 使企业得到了更高的营销投资回报。麻萨诸赛州
Lightbridge 公司用数据挖掘技术中的分类回归树为英格兰一家主
要电话公司建立和部署了一个分析客户流失的预测模型, 使得公
司能及时发现高价值的流失客户并且能够及时采取挽留的措施,
极大降低了电话公司客户流失率。比利时国家电信使用数据仓库
建立顾客信息系统, 通过实施客户欺骗检测, 能够很快发现反常
电话以及欺骗性的打电话方式, 并能在造成重大经济损失之前终
止这种欺骗行为。
某电信运营商实施数据挖掘应用有非常好的基础, 某电信运
营商在ITSP 规划指导下, 于2004 年3 月启动数据仓库项目, 并
于2005 年6 月完成项目初验。建立了企业统一数据视图和统一
统计口径的数据仓库为数据挖掘提供了进行广泛的数据分析的
基础。数据挖掘和数据仓库的协同工作, 一方面, 可以迎合和简化
数据挖掘过程中的重要步骤, 提高数据挖掘的效率和能力, 确保
数据挖掘中数据来源的广泛性和完整性。另一方面, 数据挖掘技
术已经成为数据仓库应用中极为重要和相对独立的方面和工具。
数据挖掘和数据仓库的融合与互动发展为广大渴望从数据“奴
隶”到数据“主人”转变的企业最终用户提供了通途。另外, 该电信
也已经在数据挖掘应用方面作出了许多卓有成效的尝试。数据仓
库的建设期间, 数据挖掘应用也在其地市电信分公司进行了试点
工作, 在客户流失预测和客户分群分面取得了显著的应用效果。
该公司于2005 年1 月20 日在某市启动基于数据挖掘的客户分
群应用的MR 项目试点, 4 月1 日完成试点客户分群, 随后用一个
月时间在另一试点进行了推广, 目前已于8 月30 日通过了MR
试点初验。通过客户分群, 根据客户可能的行为和潜在的价值对
客户进行分类, 针对每一类客户的特点制定有针对性的营销策
略, 为市