图3.3:Logistic回归模型
非监督学习细分模型是基于十四个变量来做出的。在这种情形下,不需要设定目标变量。对于非监督学习细分,通常可以使用三种数据挖掘算法,也就是,两步聚类、Kohonen 网络以及K-means聚类。对于我们的演示,这里仅仅使用了两步聚类。
图3.4:两步聚类分析结果
图3.4显示了使用两步聚类法生成的五个类别的聚类模型。关于每一类的信息也列了出来。例如,第4类包含278个客户,它描述了在这个类别中大部分的客户是男性且大部分无抵押贷款的客户。另一方面,第2类描述了大多数为已婚女性且拥有赊账额度的客户。
更进一步的数据探索是建立在两步聚类结果上,通过利用我们所关心的变量的直方图或是分布图等图形化展示手段来比较五个类别的结果。图3.5显示了关于五个类别中流失状态以及流失率的比较。我们可以看到,第2类中拥有大多数的主动以及被动流失的客户。同样,第3类则是相当的混合了现存客户以及主动流失的客户。此外,第4类中具有最大的现存客户。对于其他的分类输入变量来讲可以绘出相似的分布图。
16
图3.5:五个类别中流失状态以及流失率的比较
最后,关于投资账户的直方图也可以根据五个类别分别绘出,参见图3.6。我们可以看到,第1类包含了相对其它几类更多的低投资账户的客户。另一方面,第3类则是由持有高价值投资账户的客户组成。如此,如果Z银行能够促销新产品,第3类的客户可能是更为有希望的目标群体,能够生成更好的市场营销结果。利用这些知识,Z 银行现在能够设计适当的银行产品来满足那些不同的客户群体。
图3.6:五个类别的投资账户余额的直方图
4.营销响应
为了发展新客户和推广新产品,企业通常会针对潜在客户推出各种直接营销活动。然而,如果目标客户的选择不明确,营销活动往往花费巨大而取得的实际效益不佳,甚至可能遭遇由于活动响应率太低而无法收回成本的境况。在当今竞争激烈的金融市场上,一方面,客户每天通过短信、电话、邮件、电子邮件、网站广告等方式会接触到大量的金融业务广告,缺乏针对性和足够吸引力的营销活动往往会被客户直接忽略。另一方面,用户越来越看重个性化服务,对新的金融产品具有较大的需求。
为了更好的满足客户需求,许多公司采用了促销活动管理系统来帮助执行促销活动。这些管理系统增加了公司采取的促销活动的数量,却并不一定能改善促销活动的效率。事实上,不合适的促销活动和过多的促销活动只会导致用户对公司的不满意度增加。
所以,有效促销活动不在于数量的多少,而在于要在恰当的时机,通过恰当的方式,向恰当的用户推销恰当的产品。也就是说,有效的促销活动,不在于涉及客户的数量多少,而在于针对的都是具有高响应概率的目标人群。这不仅可以提升客户的满意度,增强客户对公司的忠诚度,而且可以降低客户获取费用,增加营销活动投资回报率,直接带来公司效益的增加。数据挖掘中的营销响应分析可以帮助达到提高营销活动回报率的目标。
17
什么是营销响应?
营销响应模型是一种预测模型。目标变量是预测谁会对某种产品或服务的宣传进行响应,自变量是客户及其行为的各种属性,如:客户年龄,客户收入,客户最近一次购买产品的时间,客户最近一个月的购买频率等。利用响应模型来预测哪些客户最有可能对营销活动进行响应,这样,当以后有类似的活动时,可以针对具有较高响应可能性的客户进行相应的营销活动。而对响应度不高的客户就不用对他们进行营销活动,从而减少活动成本,提高投资回报率。
如何提高营销响应率?
金融机构应当在深入了解客户需求和客户特征的基础上,制定营销策略,从而达到增加营业收入和客户满意度的双重目标。我们提倡的不是针对最佳的客户群开展营销活动,而是针对每一个客户开展活动。所谓“知己知彼,百战不殆”,建立在对客户需求良好把握基础之上极具针对性的营销将极大地提高营销活动的成功率。要开展这样的营销活动,首先需要回答以下几个问题: ?
? 对谁开展营销活动? ? ? 多长时间开展一次营销活动? ? ? 何时开展营销活动? ? ? 如何开展营销活动?
金融机构在数据挖掘技术的帮助下,针对客户数据建立营销响应模型,在合适的时间,通过合适的渠道,以一种合适的接触频率,对合适的客户开展活动,从而提高营销活动的响应率和投资回报率。
图4.1:营销活动的四个要素
1)选择合适的客户
金融机构对以往的营销数据进行分析,采用决策树等数据挖掘方法,识别出具有高响应率的客户的特征。通过选择合适的客户,可以排除对促销活动响应不积极的客户,将目标客户的数量大大减小,从而在实现更有针对性地营销的同时减小营销成本。据统计,通过减小目标客户的数量,通常可以节省25%-40%的营销费用,同时增加营销响应率。
2)选择合适的渠道
第二步是要针对用户选择合适的营销渠道,也就是和客户接触的方式。通过使用每个用户偏爱的方式与之接触,也有利于提升客户响应率。在确定促销渠道时,要考虑客户对渠道的偏爱,渠道成本,期望的响应率,其他营销限制条件等。
3)选择合适的时间
在当今竞争激烈的社会里,客户有很多满足自己需求的机会和选择。因此,一旦发现了客户尚未被满足的需求或者出现遗失客户风险时,一定要及时和客户接触。这种事件驱动的促销方式,通常也可以取得较高的响应率。
18
4)选择合适的活动频率
此外,并不是促销活动越多,效果越好。活动计划者需要根据实际情况,针对具体的客户,选择一个最优的活动次数,既使得客户的各种需求得到较好的满足,又避免因为过于频繁的接触而导致客户的反感。同时,过多的营销活动,也会增加营销成本。需要在增加的成本和提高的响应率带来的收益之间寻找一个最优点。客户自身的偏好对于营销活动的频率确定也至关重要,比如,对于不喜欢过于频繁的接到促销电话的客户,就要适量降低电话促销的频率。通过选择更有针对性地选择客户和根据客户的需求和偏好来推广促销活动,可以将促销活动的投资收益率提高25%-50%。
表4.1:营销活动四阶段总结
阶段 目标 方法 策略 1.合适的客户 为营销活动选择最佳客户 预测分析 预测谁是最有可能响应营销并且能给营销活动带来收益的客户 好处 降低25%-40%的营销成本 2.合适的渠道 为目标客户选择最优营销方式 渠道优化 3.合适的时间 4.合适的营销频率 在合适的时间对目标客户开展营销 确定最适合客户的营销频率 事件营销 促销优化 在客户偏爱的方式和公司的成本与能变小的,经常性的营销活动为事件触在客户响应率和公司收益之间选力之间选取最优结合点 降低接触客户的成本 发的营销活动 响应率的提高至少达到两倍 择最佳结合点 提高25%-50%的收益 营销响应应用案例
一家虚拟银行新推出了一种新的抵押贷款业务,为了推广新产品,该银行决定执行直接营销活动。为此,分析人员收集了以往进行类似产品的营销时公司执行营销活动的相关数据,经过数据挖掘应用,计算客户影响概率,得到客户响应率模型,进而对客户对新产品的响应概率进行预测。从中选取响应率高的客户开展新产品营销活动。
(1)商业理解
识别出可能响应直接营销活动的客户,提高营销活动的响应率。
(2)数据理解
收集部分以往的营销活动数据(包括对活动响应的客户数据和未对活动响应的客户数据),选择客户属性,包括客户人口统计学特征和账户信息等。利用直方图、分布图来初步确定哪些因素可能影响客户响应。所选取的数据属性包括:用户编号、年龄、收入、孩子数目、是否有汽车、是否抵押、居住区域、性别、婚姻状况、在该银行是否有储蓄账户、在该银行是否有活期账户、是否对促销活动响应等12个字段。
其中是否响应是预测的目标变量,共有两个属性: 否:客户未响应营销活动;是:客户响应营销活动。
19
图4.2:数据
首先采用直方图,散点图等工具对数据之间的关系进行初步探索。下图是按照响应与否察看收入与孩子数目之间的散点图。可见,如果只考虑“孩子数目”属性,发现随着孩子数目增加,响应的客户比率降低。同时考虑“孩子数目”和“收入”属性,发现响应比率与“收入”和“孩子数目”的比值相关,这个比值通常被成为“相对收入”。
图4.3:收入与孩子数目的散点图
下图是孩子数目的分布图。有一个孩子的客户占44.3%。而在这些客户中,大部分是对直接营销活动进行响应的客户。总的说来,随着孩子数目增加,客户响应率降低。
图4.4:孩子数目的分布图
(3)数据准备
根据数据理解的结果准备建模需要的数据,包括数据选择、新属性的派生,数据合并等。在数据理解中发现,是否响应与“收入”和“孩子数目”的比率有关,因此,派生出“相对收入”属性,定义为:如果“孩子数目”为0,则“相对收入”=“收入”;否则,“相对收入”=“收入”/“孩子数目”。
(4)建立模型及评估
对数据进行预处理之后,分别使用C5.0决策树模型,神经网络模型,C&RT决策树分类模型,以客户属性为输入变量,以客户是否响应为目标变量进行分类。然后对测试集分别应用这三个模型,选取效果最好的模型部署到企业中。
20