业务背景
目前运营商面临着激烈的市场竞争。对运营商来说,客户即生命,如何保持现有客户是企业客户管理的重中之重。因此,运营商拥有的客户越多,作为主要成本的前期投资就会越大,企业的利润也就越大。客户资源对于运营商来说其意义不言而喻,运营商之间的竞争实际上就是对客户资源的竞争。可以说,未来的电信行业,得客户者得天下。
痛点需求
客户在使用某运营商提供的某套餐过程中,可能因为价格、服务等各种因素选择继续使用或不再使用。客户是否会流失的信息很可能隐含在他的通话时间、短信使用、消费情况当中。我们可利用相关算子快速建立起流失客户的预测模型,有助于运营商根据历史数据分析用户是否会继续使用产品或服务,以帮助企业管理者对该类客户的行为特性进行预警分析,采取针对性的措施改善客户关系,避免客户流失或者挽留客户,达到亡羊补牢的效果。
解决方案
客户流失预警分析是通过数据挖掘,发现和分析出客户的许多属性特性和行为特征,从而找到流失客户的特征,为企业挽留这类客户提供决策参考。
针对运营商用户流失现状,我们将使用数据分析挖掘平台对客户数据进行挖掘建模,训练预测模型。
客户分为在网客户和流失客户两类,预测客户是否流失为一个分类问题,可尝试选用决策树、随机森林、GBDT等分类算法,根据分类效果确定最终模型。
主要分成两个步骤:
第一步:训练和测试分类模型,预测客户是否流失。
第二步:在该套餐数据其他时间段的新数据集上检验训练出的模型效果(训练用了3个月数据,新数据为其他的1年左右的数据)。
第一步:训练和测试分类模型
数据切分
在网客户数据量为10万条,流失客户数据量为1万7千条,考虑将在网客户数据三等分(SplitDataByPercent算子),流失客户数据二等分(SplitDataByPercent算子),互相融合(Union算子)形成3份数据(每份数据包含约33000条在网数据和8800条流失数据)。
训练分类模型
用三组数据分别训练出一个决策树分类模型。
利用模型分类
将三个模型和三组数据交叉验证进行分类,可以防止模型过拟合。
输出的结果我们可以双击PerformanceClassification的右端View接口看到,可以对比各个模型的分类效果。
同理,可以构建随机森林和GBDT的分类工作流,经过对比发现GBDT的分类效果最好,具体结果如表3所示。
第二步:在该套餐数据其他时间段的新数据集上检验训练出的模型效果
读取和合并新数据,并用三个保存的模型进行分类,同样双击View可以查看分类效果,具体如表4所示:
在新数据上测试结果:在网用户预测正确率99.05%,流失用户预测正确率88.39%。
实施效果
身处大数据时代,各种新的、强大的数据源会持续爆炸式的增长,而客户资源是运营商的生命,保留并巩固客户资源对运营商来说意义重大,运营商也在积极地探索以保持竞争力。
此案例中,我们通过训练的GBDT分类模型可以非常精确(97.45%)地辨别出某用户是否会流失。
用户基于此模型来针对性地设计客户反馈方案,对易流失客户进行访问和分析,从而通过用户流失预测能力的提升,更好地指导实施用户挽留工作,实现新的利润增长点。