RFM客户分类模型的应用——R语言
作者:互联网
RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。RFM是一种综合评分的分类模型,由于其计算简单方便,在众多的客户细分模型中,RFM模型是被广泛提到和使用的。
一、RFM模型
RFM分析主要由3个指标组成,分别为R(Recency,近度)、F(Frequency频度)、M(Monetary,额度)组成。RFM是三个指标的缩写:Recency:最近一次消费距离现在的时间,该值越小越好;Frequency:某段时间内的消费次数,这个值越大越好;Monetary:某段时间内的消费金额,对于企业来说,消费自然越多越好。这三个维度需要根据实际业务确定,比如针对游戏行业,R可以定义为最近一次充值距离现在的时间,F可以定义为某段时间的充值次数,M为某段时间的充值金额。
指标 | 解释 | 意义 |
---|---|---|
R(Recency,近度) | 客户最近一次交易时间到当前时间的间隔 | R越大,表示客户越久为发生交易;R越小,表示客户越近有交易发生 |
F(Frequency,频度) | 客户在最近一段时间内交易的次数 | F越大,表示客户交易越频繁; F越小,表示客户交易越少 |
M(Monetary,额度) | 客户在最近一段时间内交易的金额 | M越大,表示客户价值越高;M越小,表示客户价值越低 |
依据如上三项指标,划分为6,8,11等几种模型。最常见的为8种:
二、RFM的评分
RFM模型基于下面的理解:假设最近有过交易行为的客户比最近没有交易行为的客户,更有可能再次发生交易行为;假设交易频率较高的客户比交易频率较低的客户,更有可能中再次发生交易行为;假设过去所有交易总金额更多的客户比交易总金额较少的客户,更有消费积极性。如果没有特别的分组标准,通常按照平均值划分为两个组,并分别赋值1,2。
定义 | 说明 | 取值 | 说明 |
R_score | 近度得分,最近一次交易日期距离指定日期越近,R_score越大 | 2 | R<=平均值 |
1 | R>=平均值 | ||
F_score | 频度得分,交易频率越高,F_score越大 | 2 | F>=平均值 |
1 | F<=平均值 | ||
M_score | 额度得分,交易金额越高,M_score越大 | 2 | M>=平均值 |
1 | M<=平均值 |
2.1 R值分:最近一次消费(Recency)
消费指的是客户在店铺消费最近一次和当前的时间间隔,理论上R值越小的客户是价值越高的客户,即对店铺的回购几次最有可能产生回应。目前网购便利,顾客已经有了更多的购买选择和更低的购买成本,去除地域的限制因素,客户非常容易流失,因此CRM操盘手想要提高回购率和留存率,需要时刻警惕R值。如下图,某零食网店用户最近一次消费R值分布图(时间截至2016年12月31日):
从图中可以看出,客户R值呈规律性的“波浪形”分布,时间越长,波浪越小;最近一年内用户占比50%。这个数据说明每引入2个客户,就有一位用户在持续购买。说明店铺复购做的比较好,R值在不断的变为0。
2.2 F值分:消费频率(Frequency)
消费频率是客户在固定时间内的购买次数(一般是1年)。但是如果实操中实际店铺由于受品类宽度的原因,比如卖3C产品,耐用品等即使是忠实粉丝用户也很难在1年内购买多次。所以,一般店铺在运营RFM模型时,会把F值的时间范围去掉,替换成累计购买次数。如下图,某零食网店用户购买频次图(如1个客户在1天内购买多笔订单,则自动合并为1笔订单):
从图中可以看出,购买1次(新客户)占比为65.5%,产生重复购买(老客户)的占比为34.4%;购买3次及以上(成熟客户)的占比为17%,购买5次及以上(忠实客户)的占比为6%。
2.3 M值分:消费金额(Monetary)
M值是RFM模型中相对于R值和F值最难使用,但最具有价值的指标。大家熟知的“二八定律”(又名“帕雷托法则”)曾作出过这样的解释:公司80%的收入来自于20%的用户。
可能有些店铺不会那么精确,一般也会控制在30%客户贡献70%收入,或者40%贡献60%收入。理论上M值和F值是一样的,都带有时间范围,指的是一段时间(通常是1年)内的消费金额,M值对客户细分的作用相对较弱。
2.4 RFM综合加权得分
在得到R值、F值、M值的分组分值后,就可以计算RFM综合分值了,常用的RFM综合分值计算公式为
RFM = 100×R值 + 10×值 + 1×M值
这样设置的原因是用百十个位的组合,考虑了这几个指标的实际作用和效果,构造一个RFM分值,三个分数的加权平均数。
三、RFM模型的数据准备
数据来源于英国在线零售数据。数据里涵盖了从2010年12月1号到2011年12月9号期间在英国注册的在线零售店发生的所有交易。该公司主要销售一些通用的节日礼品,其客户许多都是批发商。
3.1 数据源
Online Retail.xlsx百度网盘数据文件
数据来源于英国在线零售数据。数据里涵盖了从2010年12月1号到2011年12月9号期间在英国注册的在线零售店发生的所有交易。该公司主要销售一些通用的节日礼品,其客户许多都是批发商。
主要字段信息:
InvoiceNo | StockCode | Description | Quantity | InvoiceDate | UnitPrice | CustomerID | Country |
---|---|---|---|---|---|---|---|
发票编号。 | |||||||
标称值,6位整数。如果代码以字母“c”开头,则表示取消 | 产品代码。标称值,为每个不同的产品唯一分配的5位整数 | 产品名 | 产品数量 | 发票日期 | 单价,英镑单位的产品价格 | 客户编码 | 每个客户所在的国家 |
3.2 数据源图片展示
四、RFM模型的数据处理
总结
参考文献
1.(R语言 RFM分析)[https://blog.csdn.net/weixin_58587245/article/details/122767879]
2.(深入解读RFM模型(内含实例))[https://www.aisoutu.com/a/1203113]
3.(数据分析实战-RFM模型)[https://zhuanlan.zhihu.com/p/407283531]
标签:score,模型,分类,客户,购买,交易,RFM 来源: https://www.cnblogs.com/haohai9309/p/16453786.html