淘宝用户行为分析

一、项目介绍

1.概述

        本数据集是阿里巴巴提供的一个淘宝用户行为数据集(数据来源:数据集-阿里云天池),包含了2017年11月25日至2017年12月3日之间有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:

列名称

说明

用户ID

整数类型,序列化后的用户ID

商品ID

整数类型,序列化后的商品ID

商品类目ID

整数类型,序列化后的商品所属类目ID

行为类型

字符串,枚举类型,包括('pv', 'buy', 'cart', 'fav')

时间戳

行为发生的时间戳

        用户行为类型共有四种,它们分别是:

行为类型

说明

pv

商品详情页pv,等价于点击

buy

商品购买

cart

将商品加入购物车

fav

收藏商品

2.数据清洗

        在Sequel Pro中,创建新表,将原数据集导入。考虑原数据集数据量大,本次分析随机抽取数据集中十分之一用户行为数据,并对数据进行如下清洗:

        (1)缺失值处理:建立新表时,设置各字段not null,确保导入数据无空值;

        (2)去重:对数据中存在的重复数据进行删除;

        (3)时间戳格式化处理:将时间戳改为可读的时间形式,并新建两列,分别为日期(%Y-%m-%d )、时间(%H);

        (4)异常值处理:限定时间范围为2017年11月25日至2017年12月3日,删除不在时间范围内的异常数据。

        最终得到随机抽取的数据集相关字段如下:

列名称

说明

user_id

整数类型,序列化后的用户ID

item_id

整数类型,序列化后的商品ID

category_id

整数类型,序列化后的商品所属类目ID

behavior_type

字符串,枚举类型,包括('pv', 'buy', 'cart', 'fav')

date_time

行为发生的日期时间

dt

行为发生的日期

hours

行为发生的时间(仅包含小时)

        最终得到随机抽取的数据集相关大小如下:

维度

用户数量

商品数量

商品类目数

行为数据量

数量

98,818

1,585,933

8,079

9,952,257

3.宏观指标

指标

浏览量

访客数

总订单数

转化率

平均浏览量

客均订单数

PV

UV

OD

CVR

PV/UV

OD/UV

指标数

8,916,542

98,818

201,284

2.26%

90

2

        ​​​​​​​使用Python对数据进行进一步分析。

二、用户行为习惯分析

1.用户日活跃情况分析

图1. 日访问量、日访客数分布图

图2. 日均访客浏览量分布图

        从上述图中发现,(1)日常访客和浏览量总体比较稳定,日常单日访客量在7万至7.4万之间,单日浏览量在98万到109万之间,平均访客浏览量集中在14次/人上下。(2)周末的日访客量、日浏览量、平均访客浏览量水平总体高于工作日,原因是相较于工作日,用户在周末有更多的休闲的时间进行进行网购消费。(3)12月2日-12月3日(周六、周日)日访客量、日浏览量、平均访客浏览量水平明显高于往常(工作日和上周末),因为 12月2日开始的双十二预热活动拉动大量用户“围观”,相关数据也明显提高。

图3. 日成交量分布图

        从日成交量分布图来看,12月2日-12月3日确实刺激了更多用户进行消费,单日成交量有了大幅提高。

2.用户时活跃情况分析

图4. 点击次数时段图

图5.收藏加购/成交次数时段图

        一天中,用户点击、收藏加购活跃在6:00-10:00、18:00-21:00上涨明显,在21:00-22:00达到顶峰;用户成交波动不大。针对这一特点,18:00-22:00推荐进行促销等营销活动,提高成交量,进而提高总交易额。

3.用户购买次数情况分析

图6.有购买行为用户购买次数分布图

        有购买行为的用户67016人,占总用户的67.8%,有购买行为的用户中约72%的用户购买三次及以内,与0-2-4次相比较,购买4-6-8次之间的用户流失较多,针对购买三次及以内的用户,要增加触达,使该批次用户养成消费习惯,进而向忠诚用户转化。

4.用户复购情况分析

图7.用户复购率水滴图

        结合图6,22907名用户在2017年11月25日至2017年12月3日之间出现一次购买行为,44109名用户出现复购行为,复购率为66%。

图8.各时间间隔下复购行为次数分布图

        80%的复购消费行为出现在2天内,针对近期有购买行为的用户,“精准营销”, “趁热打铁”,增加触达,培养用户忠诚度。

图9.用户复购热力图

        图9横坐标为2017年11月25日至2017年12月3日的日期,该热力图表示横坐标对应日期间隔一定天数后的日期用户留存比例,纵坐标为间隔天数。日常用户留存比例整体比较稳定,在17%-24%之间。

三、用户行为路径分析

        对用户行为路径进行分析,用户购买商品的路径可以分为五种:(1)不浏览商品详情页,直接购买;(2)浏览商品详情页——购买;(3)浏览商品详情页——收藏——购买;(4)浏览商品详情页——加购——购买;(5)浏览商品详情页——收藏,加购——购买。其中,通过路径(1)进行购买的行为数95251次,占总购买次数的47%,剩余购买路径分析如图下:

图10.用户浏览后购买商品路径图

        如图所示,浏览商品详情页次数8916542次,浏览商品详情页后直接购买59748次,浏览商品详情页后收藏或加购834431次,收藏或加购商品后购买46285次。由此商品详情页的跳失率为90%,商品详情页后最终转化为购买行为的转化率为1.7%。即用户对商品详情页的关注很大, “100%”次浏览商品详情页后,“90%”次退出后再未进行其他任何行为,最终转化为“1.7%”的购买行为。具体造成商品详情页跳失率大的原因需采取措施进行具体分析,进而进行针对性的调整。

图11.用户购买次数分布图

        针对不同行为路径,对用户购买商品行为次数做出区分。77%的消费行为来源于购买商品直接购买或者浏览商品详情页后直接购买,23%的消费行为来源于收藏或者加购。其中,收藏、加购、同时收藏加购三种行为转化为消费行为的转化率分别为6.18%、4.21%、6.7%,与收藏相比,买家更倾向于加购的动作,加购的动作具有较高的购买意图。

四、用户价值分类

        运用RFM模型对用户进行分层,因为没有累计交易金额M,所以针对R、F两个维度进行用户分层。依据原数据计算各用户最近一次消费的时间间隔(R)及均值,计算各用户2017年11月25日至2017年12月3日时间内消费频率及均值。按如下思路进行打分:

分数

R的分层标准

F的分层标准

0

用户最近一次消费的时间间隔大于均值

用户消费频率小于均值

1

用户最近一次消费的时间间隔小于等于均值

用户消费频率大于等于均值

        将分数进行连接,得到如下分层:

        a)11:重要价值,近期有购买且购买频繁

        b)10:重要发展,最近购买但历史购买次数少

        c)01:重要保持,近期没购买,历史购买次数多

        d)00:重要挽留,近期也没买,历史买的也少

图12.用户分层图

        重要价值用户占比21%,该部分用户忠诚度较高,可提供VIP服务,针对用户需求进行精准营销,同时拓宽与用户沟通渠道,加深与用户交流,使用户具有可持续的忠诚度。重要发展用户占比36%,针对该部分用户,可“趁热打铁”,在即将到来的双十二大促活动,通过发放优惠券、增加推送等手段,提高他们的购买频率,并在后期做好售后服务,加深用户对品牌的认同,进而增加入会的转化。重要保持用户占比6%,占历史购买较多用户的23%,从侧面反映出淘宝用户的黏性较高。针对该部分用户,可通过短信、推送、站内信息等方式,增加触达。重要挽留用户占比37%,占比较多,针对该部分用户,需弄清楚用户流失的原因,对症下药,进而挽留用户。

五、总结

        本次从阿里巴巴提供的一个淘宝用户行为数据集中随机抽取9.9万用户行为数据,从用户行为习惯、用户行为路径、用户价值三方面,搭建指标体系进行分析。主要结论及相应策略如下:

  1. 日常访客量、浏览量、成交量总体比较稳定,周末数据表现较工作日略好,大促活动能极大刺激用户浏览页面、成交订单。
  2. 从一天表现来看,用户点击、收藏加购活跃在6:00-10:00、18:00-21:00上涨明显,在21:00-22:00达到顶峰 。21:00-22:00为黄金时段,在该时段开展促销活动、增加产品曝光等获取更多用户。
  3. 用户粘性较好,复购率为66%,80%的复购消费行为出现在前次购买的2天内,且用户留存率较稳定在17%-24%。利用RFM模型中的“R”“F”对用户进行分层,对老客分策略进行积极维护。针对没有复购的用户,增加该客群的push,适当发放优惠券等,提高该用户群群体的复购率,进而逐渐提高用户忠诚度。
  4. 30%最终购买行为直接来源于商品详情页浏览,但商品详情页的跳失率高,商品详情页后最终转化为购买行为的转化率较低。建议进一步进行用户调研,找寻跳失率高,转化率低的原因,进而优化商品详情页。
  5. 与收藏相比,买家更倾向于加购的动作,加购的动作具有较高的购买意图 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/34183.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

模仿淘宝主页

图片资源链接&#xff1a;http://pan.baidu.com/s/1jHAdLNg 密码&#xff1a;5uo1 代码资源链接&#xff1a;链接&#xff1a;http://pan.baidu.com/s/1slRaUIT 密码&#xff1a;8kin html 代码如下&#xff1a; <!DOCTYPE html> <html lang"en"> …

Android模仿淘宝详情页界面

话不多说—先上效果图&#xff1a; 图1中主要需要实现的效果&#xff1a; 1.轮播图 2.顶部导航栏的渐变 3.顶部导航栏随着滑动的位置选择对应的值以及点击滑动到对应位置 Android模仿淘宝详情页界面文件&#xff1a;url80.ctfile.com/f/25127180-734377737-78795d?p551685…

聊聊淘宝天猫个性化推荐技术演进史

引言&#xff1a;个性化推荐技术直面用户&#xff0c;可以说是站在最前线的那个。如今&#xff0c;从用户打开手机淘宝客户端&#xff08;简称“手淘”&#xff09;或是手机天猫客户端&#xff08;简称“猫客”&#xff09;的那一刻起&#xff0c;个性化推荐技术就已经启动&…

淘宝买家秀后台操作与各场景展示逻辑

宝贝洋淘买家秀&#xff1a;可操作加精展示在宝贝评价页面 店铺洋淘买家秀&#xff1a;店铺买家秀内容查看及管理 精选买家秀&#xff1a;被平台审核通过的买家秀&#xff0c;就是精选买家秀集合地。可操作转发至微淘。 加精后的买家秀会在详情页下出现&#xff0c;效果如下 …

生成式 AI 讲故事,儿童也能创作自己的睡前故事? #Create With Alexa

哈佛大学的 Sandra Cortesi 认为&#xff0c;父母应该尽量多地让孩子接触能够激发其主动创造力的技术。 亚马逊正在通过一项新的 Alexa 功能进入生成式人工智能热潮&#xff0c; 开始涉足讲故事领域&#xff0c;Create With Alexa 就是亚马逊在讲故事技术的一次尝试&#xff0c…

COMSOL空气反应 模型框架

Comsol等离子体模块&#xff0c;40多种空气反应框架&#xff0c;主要N2和O2。

chatgpt赋能python:Python中文版转换指南

Python中文版转换指南 Python是一种流行的编程语言&#xff0c;它的简单易学和开发效率高受到了全球众多开发者的青睐&#xff0c;但是很多初学者非常苦恼的是&#xff0c;Python的官网和文档全都是英文版的。在中国大陆的用户中&#xff0c;这一问题尤为突出。 本文将介绍Py…

chatgpt赋能python:Python文本编码转换详解

Python文本编码转换详解 在Python中&#xff0c;文本编码转换是一个非常常见的任务。本文将详细介绍Python中的文本编码转换&#xff0c;并提供一些常见的示例和代码片段。 什么是文本编码转换&#xff1f; 在计算机中&#xff0c;文本是以二进制形式存储的。文本编码是一种…

Oracle帐户被锁了,怎么解锁

当多次输入错误密码时&#xff0c;会被oracle视为恶意连接&#xff0c;账户就会锁定&#xff0c;解锁也很简单&#xff0c;步骤如下 第一步&#xff1a; 在数据库安装的电脑上&#xff0c;运行窗口中输入cmd&#xff0c;调出命令提示符界面。 第二步&#xff1a; 用管理员身…

Oracle scott账户被锁定,scott默认密码,sys,system默认密码

Windows安装oracle 安装oracle 出现Environment variable: "PATH" 在stage\cvu\目录下修改cvu_prereq.xml文件&#xff0c;在<CERTIFIED_SYSTEMS>字段下添加&#xff1a; 改 cvu_prereq.xml 里面 的配置&#xff0c;cvu_prereq.xml 文件在oracle安装解压包da…

实现登录密码输入错误次数过多,锁定用户账号,前台可以进行解锁的业务(未完善版本)

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、前台实现解锁二、后台逻辑实现二、步骤1.数据库2.代码实现 前言 工作的第一天&#xff0c;就接到了一个登录锁定与解锁的需求&#xff0c;第一反应&#x…

geth如何解锁账户?

2019独角兽企业重金招聘Python工程师标准>>> 默认情况下&#xff0c;你在Geth中的账户是被锁住的&#xff0c;你不能用这些被锁住的账户发送交易&#xff0c;例如转账或调用合约方法。因此如果你需要使用Geth发送交易&#xff0c;就需要先解锁账户。那么&#xff0c…

烽火HG2543C1获得telecomadmin密码以及禁用tr069

因为在网上找不到删除tr069的教程自己摸索半天终于找到方法&#xff0c;特意来此分享一下我的思路 输入 192.168.1.1:8080 进入普通后台然后输入 192.168.1.1:8080/cgi-bin/telnetenable.cgi?telnetenable1 开启telnet 开启cmd输入 telnet 192.168.1.1 &#xff0c;密码是…

Oracle scott账户被锁定问题及更改密码

记录一下出现的问题及解决过程。 登录scott账户&#xff0c;显示被锁定。 1.登录高权限的账户&#xff0c;回车后连接到数据库 2.解锁scott账户 3.更改scott账户密码 &#xff08;注&#xff1a;alter后一定要加user&#xff0c;否则会提示“无效的alter命令”错误&#xff0…

“即玩即赚”“从玩到赚”类游戏所面临的问题及方案

先说我这篇博客的结论&#xff1a;如果你计划推出了一个拥有代币的游戏&#xff0c;并且打算从一开始就让代币与外部加密交易所挂钩&#xff0c;那么事实上&#xff0c;你可能从一开始就已经失败了。 承诺“即玩即赚”&#xff08;我们使用“即玩即赚”而不是“从玩到赚”这个术…

算法学习记录-二叉树的权值

算法学习记录 二叉树的权值 真没想到想到,就这样一道题花了我一上午… 一开始思路比较乱,后来不停的开单步调试,不停的看各种值,不停的想思路和代码是不是一样的,调了一上午最后终于悟出来了. 刚开始的时候只是脑子里能想明白怎么求和, 但是不能写出具体流程就之间写代码了.…

[Java] 自己写图书馆管理系统(详细版)

目录 一、简介 二、需求 三、具体设计 一、大纲 二、分析过程 三、小结 1.整体流程 2.ListBookOrderByXXXCommand 3.匿名类对象语法知识点 4.类和对象&#xff08;面向对象设计&#xff09; 四、完整代码 一、简介 实现一个简单的能对图书馆的书籍进行简单管理的一个…

周易名:传统周易结合现代人工智能起名字

ChatGPT是由OpenAI公司开发的一种自然语言处理&#xff08;NLP&#xff09;模型&#xff0c;它是一种基于Transformer架构的深度学习模型。GPT的全称是Generative Pre-trained Transformer&#xff0c;也就是基于预训练的生成式Transformer模型。 ChatGPT被训练在大规模的文本…

【AIGC】人工智能的新篇章:生成式人工智能对企业的影响和意义

目录 人工智能的新篇章:生成式人工智能对企业的影响和意义

关于计算机网络的好坏处的英语作文,网购的好处和坏处英语作文带翻译

010在线为您甄选多篇描写网购的好处和坏处英语作文带翻译,网购的好处和坏处英语作文带翻译精选,网购的好处和坏处英语作文带翻译大全&#xff0c;有议论&#xff0c;叙事 &#xff0c;想象等形式。文章字数有400字、600字、800字....缓存时间&#xff1a; 2021-07-09 We talked…