RFM模型-分析母婴类产品

1,场景描述

假设我们是某电商平台的数据分析师,负责分析母婴产品线的用户数据。母婴产品的购买行为具有一定的周期性和生命周期特征,如用户在不同怀孕阶段的需求不同,以及宝宝出生后的不同成长阶段需要不同的产品。

2,具体需求

  1. 识别高价值用户:通过RFM模型识别高价值用户,重点考虑用户的生命周期(例如:怀孕阶段、新生儿阶段)。
  2. 标签化用户行为:对用户行为进行标签化,包括季节性、促销活动、节假日事件等。
  3. 改进模型:针对母婴产品的特性,改进传统RFM模型的不足之处。

3,具体代码

数据模拟

import pandas as pd
import numpy as np
from datetime import datetime, timedelta# 模拟用户数据
np.random.seed(42)
user_ids = np.random.randint(1000, 2000, 1000)
dates = pd.date_range(end=datetime.today(), periods=365).to_pydatetime().tolist()
data = {'user_id': np.random.choice(user_ids, 5000),'order_date': np.random.choice(dates, 5000),'amount': np.random.uniform(10, 500, 5000)
}
orders = pd.DataFrame(data)# 假设部分用户的怀孕周数
orders['pregnancy_week'] = np.where(np.random.rand(5000) > 0.8, np.random.randint(1, 40, 5000), np.nan)# 生成一些标签,例如季节性、促销活动
orders['season'] = orders['order_date'].apply(lambda x: 'Winter' if x.month in [12, 1, 2] else ('Spring' if x.month in [3, 4, 5] else ('Summer' if x.month in [6, 7, 8] else 'Autumn')))
orders['promotion'] = np.random.choice([0, 1], size=5000, p=[0.7, 0.3])# 查看模拟数据
orders.head()

RFM 计算

# 当前日期
now = datetime.now()# 计算RFM值
rfm = orders.groupby('user_id').agg({'order_date': lambda x: (now - x.max()).days,'user_id': 'count','amount': 'sum'
}).reset_index()# 重命名列
rfm.columns = ['user_id', 'recency', 'frequency', 'monetary']# 计算RFM评分
rfm['R'] = pd.qcut(rfm['recency'], 4, ['1', '2', '3', '4'])
rfm['F'] = pd.qcut(rfm['frequency'].rank(method='first'), 4, ['4', '3', '2', '1'])
rfm['M'] = pd.qcut(rfm['monetary'], 4, ['4', '3', '2', '1'])# 组合RFM得分
rfm['RFM_Score'] = rfm['R'].astype(str) + rfm['F'].astype(str) + rfm['M'].astype(str)rfm.head()

标签化用户行为和生命周期分析

# 合并用户行为标签
rfm = rfm.merge(orders[['user_id', 'pregnancy_week', 'season', 'promotion']], on='user_id', how='left')# 根据怀孕周数标签化
def pregnancy_stage(week):if pd.isna(week):return 'Unknown'elif week < 13:return 'First Trimester'elif week < 27:return 'Second Trimester'else:return 'Third Trimester'rfm['pregnancy_stage'] = rfm['pregnancy_week'].apply(pregnancy_stage)# 计算用户在不同季节和促销活动中的消费
seasonal_promotion_agg = orders.groupby(['user_id', 'season', 'promotion']).agg({'amount': 'sum'
}).reset_index()# 合并
rfm = rfm.merge(seasonal_promotion_agg, on='user_id', how='left', suffixes=('', '_season_promo'))rfm.head()

4,改进模型

结合具体业务特性,针对母婴产品用户进行更精准的分析:

  1. 用户生命周期分析:重点分析怀孕阶段和宝宝成长阶段的用户需求。
  2. 行为标签:考虑用户在不同季节和促销活动中的消费习惯。

通过这样的改进,可以更精准地识别高价值用户和潜在流失用户,为制定营销策略提供数据支持。

# 模拟分析结果
# 查看高价值用户
high_value_users = rfm[rfm['RFM_Score'] == '444']# 查看高风险流失用户
high_risk_users = rfm[rfm['RFM_Score'] == '111']# 根据怀孕阶段细分用户群体
first_trimester_users = rfm[rfm['pregnancy_stage'] == 'First Trimester']
second_trimester_users = rfm[rfm['pregnancy_stage'] == 'Second Trimester']
third_trimester_users = rfm[rfm['pregnancy_stage'] == 'Third Trimester']# 分析用户在不同季节和促销活动中的消费行为
seasonal_promotion_analysis = rfm.groupby(['season', 'promotion']).agg({'amount': 'sum','user_id': 'nunique'
}).reset_index()# 结果展示
print("高价值用户:")
print(high_value_users)print("\\n高风险流失用户:")
print(high_risk_users)print("\\n第一孕期用户:")
print(first_trimester_users)print("\\n第二孕期用户:")
print(second_trimester_users)print("\\n第三孕期用户:")
print(third_trimester_users)print("\\n季节性和促销活动分析:")
print(seasonal_promotion_analysis)# 建议
print("建议:")
print("1. 针对高价值用户,提供专属优惠和服务,提升用户粘性。")
print("2. 针对高风险流失用户,分析流失原因并采取挽回措施,如发送个性化优惠券。")
print("3. 根据用户怀孕阶段,推荐相应的母婴产品,满足用户特定需求。")
print("4. 在促销活动期间,加强推广力度,吸引更多用户参与消费。")
print("5. 关注季节性消费变化,提前准备相关产品的库存和促销策略。")

(交个朋友/技术接单/ai办公/性价比资源)

c27159cc0cbd41ef98cb474cc2c7d5e5.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/336204.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TCP/IP协议族

基于这张图片的一篇blog TCP/IP模型通常被分为四个层次&#xff1a;应用层、传输层、网络层和网络接口层。在这个模型中&#xff0c;不同的网络协议负责完成不同的任务&#xff0c;以确保数据可以在网络中高效、可靠地传输。以下是对这张图中每个协议的解释&#xff1a; 应用层…

【Linux】Socket中的心跳机制(心跳包)

Socket中的心跳机制(心跳包) 1. 什么是心跳机制&#xff1f;(心跳包) 在客户端和服务端长时间没有相互发送数据的情况下&#xff0c;我们需要一种机制来判断连接是否依然存在。直接发送任何数据包可以实现这一点&#xff0c;但为了效率和简洁&#xff0c;通常发送一个空包&am…

FPGA——eMMC验证

一.FPGA基础 1.FPGA烧录流程 (1) 加载流文件 —— bitfile (2) 烧录文件 —— cmm 二.MMC 1.基础知识 (1)jz4740、mmc、emmc、sd之间的关系&#xff1f; jz4740——处理器 mmc——存储卡标准 emmc——mmc基础上发展的高效存储解决方案 sd—— 三.eMMC和SD case验证 1.ca…

slam14讲(第8讲、前端里程计)LK光流、直接法

直接法的引出 因为第7讲大部分都是讲特征点法&#xff0c;通过提取orb特征点和点的描述子&#xff0c;来构建两帧图像之间的特征点对应关系。这种方法会有缺点&#xff1a; 关键点和描述子提取计算耗时&#xff0c;如果相机的频率高&#xff0c;则slam算法大部分耗时被占。特…

HaloDB 的 Oracle 兼容模式

↑ 关注“少安事务所”公众号&#xff0c;欢迎⭐收藏&#xff0c;不错过精彩内容~ 前倾回顾 前面介绍了“光环”数据库的基本情况和安装办法。 哈喽&#xff0c;国产数据库&#xff01;Halo DB! 三步走&#xff0c;Halo DB 安装指引 ★ HaloDB是基于原生PG打造的新一代高性能安…

基于 FastAI 文本迁移学习的情感分类(93%+Accuracy)

前言 系列专栏:【深度学习&#xff1a;算法项目实战】✨︎ 涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域&#xff0c;讨论了各种复杂的深度神经网络思想&#xff0c;如卷积神经网络、循环神经网络、生成对…

JAVA:多线程常见的面试题和答案

请关注微信公众号&#xff1a;拾荒的小海螺 博客地址&#xff1a;http://lsk-ww.cn/ 1、并发编程三要素&#xff1f; 原 子 性 原子性指的是一个或者多个操作&#xff0c;要么全部执行并且在执行的过程中不被其他操作打断&#xff0c;要么就全部都不执行。可 见 性 可见性指多…

NSSCTF | [SWPUCTF 2021 新生赛]no_wakeup

打开题目后&#xff0c;点击三个&#xff1f;&#xff0c;发现是一个php序列化脚本 <?phpheader("Content-type:text/html;charsetutf-8"); error_reporting(0); show_source("class.php");class HaHaHa{public $admin;public $passwd;public function…

CentOS下安装SVN客户端及使用方法

一、前言 Subversion&#xff08;SVN&#xff09;是一款开源的版本控制系统&#xff0c;它可以帮助开发者追踪和管理代码、文档或其他文件的更改历史。在Linux系统中&#xff0c;特别是在CentOS环境下&#xff0c;安装和使用SVN客户端是日常工作中常见的任务。本文将介绍如何在…

数学建模--LaTex插入表格详细介绍

目录 1.插入普通的边线表格 3.三线表的插入和空格说明 3.基于复杂情况下表格的插入 1.插入普通的边线表格 &#xff08;1&#xff09;像这个右边的生成的这个比较普通的表格&#xff0c;我们是使用下面的代码实现的&#xff1a; &#xff08;2&#xff09;和插入一个一个图片…

【漏洞复现】大华智能物联综合管理平台 log4j远程代码执行漏洞

0x01 产品简介 大华ICC智能物联综合管理平台对技术组件进行模块化和松耦合&#xff0c;将解决方案分层分级&#xff0c;提高面向智慧物联的数据接入与生态合作能力。 0x02 漏洞概述 大华ICC智能物联综合管理平台/evo-apigw/evo-brm/1.2.0/user/is-exist 接口处存在 l0g4i远程…

基于FMEA保证汽车电控系统的可靠性

随着汽车技术的飞速发展&#xff0c;电控系统已成为现代汽车的“大脑”&#xff0c;掌控着车辆的方方面面。然而&#xff0c;这一复杂的系统也面临着诸多潜在失效风险&#xff0c;如何确保汽车电控系统的可靠性&#xff0c;成为汽车制造业亟待解决的问题。幸运的是&#xff0c;…

SQL刷题笔记day6-1

1从不订购的客户 分析&#xff1a;从不订购&#xff0c;就是购买订单没有记录&#xff0c;not in 我的代码&#xff1a; select c.name as Customers from Customers c where c.id not in (select o.customerId from Orders o) 2 部门工资最高的员工 分析&#xff1a;每个部…

LPDDR6带宽预计将翻倍增长:应对低功耗挑战与AI时代能源需求激增

在当前科技发展的背景下&#xff0c;低能耗问题成为了业界关注的焦点。国际能源署(IEA)近期报告显示&#xff0c;日常的数字活动对电力消耗产生显著影响——每次Google搜索平均消耗0.3瓦时&#xff08;Wh&#xff09;&#xff0c;而向OpenAI的ChatGPT提出的每一次请求则消耗2.9…

008-Linux后台进程管理(作业控制:、jobs、fg、bg、ctrl + z、nohup)

文章目录 前言 1、& 2、ctrl z 3、jobs 4、fg&#xff1a;将后台进程调到前台执行 5、bg&#xff1a;将一个暂停的后台进程变为执行 6、&和nohup 总结 前言 有时候我们需要将一个进程放到后台去运行&#xff0c;或者将后台程序切换回前台&#xff0c;这时候就…

【笔记】Pytorch安装配置

参考视频 安装前建议预留至少10个G的空间&#xff0c;会省下很多麻烦 查看安装是否成功&#xff0c;可以在Anaconda Prompt里输入conda list查看conda环境是否配置了pytorch/torchvision 1.安装anaconda 2.安装 CUDA CUDA在官网直接安装即可&#xff0c;需要先查看自己电脑…

文件IO(二)

文件IO&#xff08;二&#xff09; 标准IO缓冲类型全缓冲行缓冲不缓冲 打开文件fopen 操作文件按字符读写(fgetc fputc)按行读写&#xff08;fgets fputs&#xff09;按块&#xff08;对象&#xff09;读写&#xff08;fread fwrite&#xff09;按格式化读写&#xff08;fscanf…

计算机网络学习笔记——应用层

一、应用层概述 二、客户/服务器方式(C/S方式)和对等方式(P2P方式) 客户/服务器(Client/Server&#xff0c;C/S)方式 服务器总是处于运行状态&#xff0c;并等待客户的服务请求。服务器具有固定端口号(例如HTTP服务器的默认端口号为80)&#xff0c;而运行服务器的主机也具有固…

使用git生成SSH公钥,并设置SSH公钥

1、在git命令行里输入以下命令 ssh-keygen -t rsa 2、按回车&#xff0c;然后会看到以下字眼 Generating public/private rsa key pair. Enter file in which to save the key (/c/Users/xxx/.ssh/id_rsa) 例&#xff1a; 3、继续回车&#xff0c;然后会看到以下字眼 Enter…

Linux中断

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、中断的相关概念1.中断号2.中断的申请和释放申请API函数如下&#xff1a;释放API函数如下&#xff1a;中断处理函数如下&#xff1a;使能和禁止中断 二、上半…