数据分析方法和思维——RFM用户分群

2023-06-01 0 497

01

写在后面

在营运情景中, 时常须要对使用者展开多层, 把总体的使用者多层相同的层级的使用者, 接着特别针对相同层级的使用者采行相同的营运思路, 也称作系统化营运。但怎样利用自然科学的方式对使用者展开分割呢。

时常遇到的范例是这种的, 比如说特别针对抖音的红包的使用者, 把这些使用者依照相同的商业价值度展开分割, 接着特别针对相同商业价值的使用者派发相同的折扣拳法, 比如说储值啥折扣啥

时常商品就会依照单个的月订阅单次准则去分割, 比如说如下表所示, 他们就能获得四种相同商业价值的使用者, 此种分割的方式单纯上看是没大难题的, 但对统计数据挖掘师而言并不是自然科学的方式。

数据分析方法和思维——RFM用户分群

主要的优点有三个, 具体而言是再加单个的订阅单次来来衡量使用者的商业价值度, 没考量使用者的订阅数额, 两个使用者倘若订阅的单次很频密, 但订阅的数额小, 因此他的商业价值度可能比不上除此之外两个使用者订阅单次大于他的 但订阅数额比他高许多。

除此之外数人定的分割的国际标准比如说用付费单次 10, 100做为三个分割的临界值, 没自然有效性, 很难分出的基本上大多数都变为高商业价值的使用者, 这种的确是片面的。

一般而言, 的确是高商业价值的使用者的数目相比之下大于低商业价值的使用者, 但此种数目是跟他们分割的国际标准密切有关的, 相同的异肢的分割的值国际标准是不那样的, 因此定出的高商业价值和低商业价值的差异就会非常大, 因此他们须要去用一种自然科学的, 通用型的分割方式去做使用者科栅。

而RFM做为使用者商业价值的分割的经典之作数学模型, 就能化解此种科栅的难题。

02

什么是RFM

数据分析方法和思维——RFM用户分群

RFM 数学模型是利用 R, F, M 三个特征去对使用者展开分割的。

其中R是表示最后一次订阅的日期距离现在的时间, 比如说你在 12月20号给两个主播打赏过, 因此到现在的距离的天数是5 因此R就是5, R是用来刻画使用者的忠诚度, 一般而言R越小, 代表使用者上一次刚刚才订阅的, 此种使用者的忠诚度比较高。

F是表示一段时间的订阅频次, 也就是比如说两个月付费了啥次, 这个是用来刻画使用者订阅行为的活跃度, 他们认为使用者的订阅行为频次越高, 一定程度上代表他的商业价值度

M是表示一段时间的订阅数额, 比如说两个月订阅了10000元, M=10000, M主要是用来刻画使用者的土豪程度。

以上他们就从使用者的忠诚度, 活跃度, 土豪度三个方面去刻画两个使用者的商业价值度。

根据RFM的值, 他们就能把使用者分割为以下相同的类别:

重要商业价值使用者: R 低, F 高, M 高, 此种使用者商业价值度非常高, 因为忠诚度高, 订阅频次高, 又很土豪

重要召回使用者: R 低, F 低 M 高, 因为订阅频次低, 但数额高, 因此是重点召回使用者

重要发展使用者: R 高, F 低, M 高 因为忠诚度不够, 因此须要大力发展

重要挽留使用者: R 高 F 低 M高 因为 忠诚度和活跃度都不够 很难流失 因此须要重点挽留

还有四种其他使用者就不一一列举

数据分析方法和思维——RFM用户分群

03

RFM怎样展开使用者科栅

1.具体而言是利用sql 计算 每两个使用者的 R, F, M, 最终获得的统计数据格式如下表所示

数据分析方法和思维——RFM用户分群

2. 读取统计数据和查看统计数据

pay_data= pd.read_csv(d:/My Documents/Desktop/train_pay.csv)# 路径名 d:/My Documents/Desktop/train_pay.csv 填写你自己的即可pay_data.head() # 查看统计数据后面几行

br

3. 选取他们要聚类的特征

pay_RFM = pay_data[[r_c,f_c,m_c]]

br

4. 开始聚类, 因为他们使用者科栅分的是八个类别, 因此k =8

# 创建数学模型model_k = KMeans(n_clusters=8,random_state=1)# 数学模型训练model_k.fit(pay_RFM)# 聚类出的类别赋值给新的变量 cluster_labelscluster_labels = model_k.labels_

br

5. 对聚类的结果中每两个类别计算 每个类别的数目 最小值 最大值 平均值等指标

rfm_kmeans = pay_RFM.assign(class1=cluster_labels)num_agg = {r_c:[mean, count,min,max], f_c:[mean, count,min,max],m_c:[mean,sum,count,min,max]}rfm_kmeans.groupby(class1).agg(num_agg).round(2)

br

数据分析方法和思维——RFM用户分群

6. 把聚类出的类别和使用者id 拼接在一起

pay_data.assign(class1=cluster_labels).to_csv(d:/My Documents/Desktop/result.csv,header=True, sep=,)

br

下面就是最终结果, label 表示使用者是属于哪两个细分的类别

数据分析方法和思维——RFM用户分群

04

RFM数学模型的应用

重要商业价值客户:占比11.7%,处于正常水平,RFM都很大,对这部分优质客户要特殊保护

重要唤回客户:占比13.28%,交易数额和单次多,但最近无交易,须要营运/业务人员对其展开唤回(可用红包、奖励、折扣券等方式)

重要深耕客户:占比16.12%,该类客户占比最多,近期有交易且平均交易数额也多,交易频次低,因此须要对其识别后展开个性化推荐,增加使用者订阅单次,提高粘性

重要挽留客户:占比9.02%,该类客户占比最少,交易数额多于平均值,其订阅能力较强,但最近无消费、消费频率低,可能是他们的潜在客户或易流失客户,能找到该部分使用者让其给出反馈建议等

潜力客户:占比11.11%,交易单次多近期也有消费,但总体消费数额低,可能是对价格较敏感或订阅能力不足,可对该部分使用者展开商品关联推荐

新客户:占比14.79%,最近有消费,交易频率和数额也不高,可对该部分使用者增加关怀,推送折扣信息,增加粘性

一般维持客户:占比13.7%,累计单数高,近期无消费,交易数额不高,该部分客户可能快要流失,可低成本营销

流失客户:占比10.28%,三项指标均低于平均值,已经流失,有可能不是目标客户,若经费有限可忽略此类使用者

作者 | Rain;编辑 | 放开那芒果

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务