CRM系统:数据挖掘在儿童培训机构客户关系管理中的应用
数据挖掘在儿童培训机构客户关系管理中的应用
赵艳芹,孙昌立
(黑龙江科技学院计算机与信息工程学院,哈尔滨150027)
(zyq_jean@sina. com)
摘 要:针对Ap riori关联规则算法需要多次扫描事务数据库及产生的候选集庞大的瓶颈问题,提出一种不产生
候选项目集,即可产生项目集的新算法,对数据的处理次数大大减少,提高了挖掘效率。并结合在儿童培训机构客户
关系管理(CRM)中客户选择的培训内容的具体应用分析,阐明了基于Ap riori改进算法的CRM数据挖掘对于儿童培
训机构增强竞争优势的重要意义。
关键词:数据挖掘;儿童培训机构;客户关系管理;Ap riori算法;频繁集
中图分类号: TP301. 6 文献标志码:A
Applica tion of da ta m in ing in CRM of children tra in ing institute
ZHAO Yan2qin, SUN Chang2li
(College of Com puter and Inform ation Engineering, Heilongjiang Institute of Science and Technology, Harbin Heilongjiang 150027, China)
Abstract: Concerning the bottleneck of classicalAp riori algorithm which need scan the transaction database multip le times
and might p roduce large candidate item sets, a new Ap riori algorithm was p roposed. The new algorithm could p roduce the item
sets without p roducing candidate item sets, thus greatly decreased the dealing timeswith data and imp roved the efficiency of data
mining. The new algorithm was app lied to analyze the chosen training items in the children training institute, expounding the
importantmeaning for increasing the competition of the imp roved Ap riori algorithm in CRM of children training institutes.
Key words: data mining; children training institute; Customer Relationship Management (CRM) ; Ap riori algorithm;
frequent itemset
0 引言
随着我国对教育投资力度的增大,各大城市的规模不一
的儿童培训机构也应运而生。面临残酷的市场竞争(儿童资
源有限) ,所有的儿童培训机构都在不遗余力地争取尽可能
多的客户(儿童) ,与客户保持长期稳定的关系。客户关系管
理(Customer RelationshipManagement, CRM)作为一种旨在改
善企业与客户之间关系的新型管理理念,其核心是“了解客
户,倾听客户”,目标可以概括为“提高现有客户满意度和忠
诚度,降低客户流失,吸引潜在客户进入”,最终目的当然是
提高收益与竞争力。各大城市的儿童培训机构要想从市场中
胜出,实施CRM的重要性不言而喻。数据挖掘中的关联规则
算法通过对客户需求进行深入的分析可以发现数据之间的潜
在联系,为我们提供自动决策支持。
1 关联规则数据挖掘
1. 1 数据挖掘理论基础
数据挖掘(DataMining, DM) ,就是从大量的、不完全的、
有噪声的、模糊的、随机的数据库中,提取隐含在其中的、人们
事先不知道的、但又是潜在有用的信息和知识的过程[ 1 ] 。关
联规则挖掘的经典算法是频繁集Ap riori算法[ 2 ] ,主要应用于
大规模商业数据中的规则提取,目前很多关联规则算法均是
基于Ap riori算法改进的。
挖掘关联规则就是发现存在于大量数据集中的关联性或
相关性,例如关联规则“95%客户在购买酱油的同时也会购
买醋”,其直观意义为顾客在购买某些商品的时候有多大倾
向会购买另外一些商品。
关联规则挖掘问题是采用形式化描述来说明的,具有通
用意义,具体为:
设I = { i1, i2, ⋯, im } 是m个不同的项组成的集合。给定
一个事务数据库D,其中的每一个事务T是I中一组项的集
合,即T A I,每个T有唯一的标识符T ID。若项集X A I且X A
T,则称事务T包含项集X。关联规则是形如X] Y的蕴涵式,
其中X A I, Y A I,且X ∩ Y = Á 。若关联规则X] Y成立还应
具有以下两个标志参数:支持度S,即事务数据库D中至少有
S% 的事务同时包含X和Y中的所有项;置信度C,即在事务
数据库D中包含X的事务至少有C% 同时也包含Y。在X] Y
中, X被称为规则前件, Y被称为规则后件,其中的X和Y均可
以由合取表达式构成。
1. 2 关联规则经典频繁集算法Ap riori
Ap riori算法是一种使用逐层搜索的迭代方法。Ap riori算
法利用Ap riori性质:“频繁项目集的任何子集也一定是频繁
的。”将满足给定支持度的所有12频繁项的每种组合作为产
生频繁项的候选项,再对它们进行修剪,判断其支持度是否大
于给定值,这样递推得到最后的频繁集。由于Ap riori算法可
以产生相对较小的候选项目集,扫描数据库的次数由最大频
繁项目集的项目数决定,适合最大频繁项目集相对较小的数
据集中的关联规则挖掘问题。
1. 3 Ap riori算法的性能瓶颈
Ap riori算法作为一种经典的关联规则挖掘算法,却有两
个致命的性能瓶颈[ 3 ]。
1)多次扫描事务数据库。对每次k循环,候选集Ck 中的
每个元素都必须通过扫描数据库一次来验证其是否加入频繁
项集Lk ,假如有一个频繁大项集包含10个项的话, 那么就至
少需要扫描事务数据库10遍。
2) 可能产生庞大的候选集。由Lk - 1产生k2候选集Ck是指
数增长的,如此大的候选集对时间和主存空间都是一种挑战。
由于Ap riori算法的不足,本文提出了一种新的高效的关
联规则挖掘算法,经实例验证,其效率大大优于Ap riori算法。
强力推荐:
天柏客户关系管理系统
天柏客户关系管理系统(CRM)是一款集专业性、实用性、易用性为一体的纯B/S架构的CRM系统,它基于以客户为中心的协同管理思想和营销理念,围绕客户生命周期的整个过程,针对不同价值的客户实施以客户满意为目标的营销策略,通过企业级协同,有效的“发现、保持和留住客户”,从而达到留住客户、提高销售,实现企业利润最大化的目的。通过对客户进行7P的深入分析,即客户概况分析(Profiling)、客户忠诚度分析(Persistency)、客户利润分析(Profitability)、客户性能分析(Performance)、客户未来分析(Prospecting)、客户产品分析(Product)、客户促销分析(Promotion)以及改善与管理企业销售、营销、客户服务和支持等与客户关系有关的业务流程并提高各个环节的自动化程度,从而帮助企业达到缩短销售周期、降低销售成本、扩大销售量、增加收入与盈利、抢占更多市场份额、寻求新的市场机会和销售渠道,最终从根本上提升企业的核心竞争力,使得企业在当前激烈的竞争环境中立于不败之地。