孕婴产品数据分析

一、数据集介绍

​ 数据集来源:

​ Baby Goods Info Data-数据集-阿里云天池

​ http://tianchi.aliyun.com

  • 会员基础信息表

(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571407490958.png)]

  • 销售数据表

    ​	[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zRTYCl8N-1571562639347)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571407426857.png)]

二、数据字段描述

​ 次数据是关于婴儿商品的,共两张表:

  • 表一会员(婴儿)信息表,共954条数据:

    • user_id:用户id
    • birthday:出生日期
    • gender:性别(0 男性;1 女性)
  • 表2为购买商品:

    user_id:用户id

    auction_id:购买行为编号

    cat_id:商品种类id

    cat1:商品属于哪一个类别

    property:商品属性

    buy_mount:购买数量

    day:购买时间

三、从数据中能得到哪些信息?

  • 产品分类数量
  • 单品销量如何
  • 月平均销售和年平均销量是多少
  • 购买的用户中,男女比例是多少
  • 用户年龄阶段
  • 不同年龄阶段的购物倾向
  • 用户生命周期

四、确定业务分析问题

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fYhYYmgd-1571562639348)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571408621592.png)]

五、数据清洗

​ 这里由于数据量比较小,可以使用Excel进行处理,但是本着能用代码装X的就不用软件的理念,比较喜欢使用python进行处理,主要是怕代码太久不敲,就没感觉了,提倡大家多使用代码处理,毕竟今后要接触的数据量会越来越大。

  • 读取数据

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6FP12fmj-1571562639348)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571409036403.png)]

  • 合并数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e4ObAup2-1571562639349)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571411698120.png)]

  • 缺失值、重复值检查
    在这里插入图片描述

    • 这里有一点小问题,合并之后是存在缺失值的,这个问题在python中需要写几层的逻辑,但是放到Excel中只需要用vlookup函数批一下就行了。
  • 删除不需要的字段

    在这里插入图片描述

  • 日期格式转换

    ​ 因为这里只有购买日期和生日,而且格式还是int64,日期需要进行运算才能得到宝宝的年龄。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WwnHwCaA-1571562639350)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571419347843.png)]

  • 替换列名,保存处理结果

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lPw1gCUn-1571562639350)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571420110680.png)]

    ​ 到此我们的数据预处理基本就结束了,下面我们换工具,用Excel做可视化。

    ​ 其实我们这里还需要处理一下,关于合并数据的时候有一些问题产生,我们pandas.merge中的参数‘outer’只是将数据简单合并了,还会遗留很多问题,比如缺失值,这里的逻辑比较复杂,就不一一称述了。

    提示一下:

    • 数据量不大的时候直接用Excel处理很方便,数据量大的时候只能写处理逻辑,你是可以有选择的。
    • 这里我用了Excel去做最后的处理,毕竟vlookup函数很好用,直接批一下就出来了。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Sd2bPWdp-1571562639350)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571486775935.png)]

    • 最后数据这个样子,中间就用vlookup函数在另一张用户信息表中批出来的生日和性别,年龄用(购买日期 - 生日)/365

    • Excel处理完数据后将内容拷贝到另一张表去,只拷贝数值和格式

    • 否则没办法进行换算

六、数据分析

  • 产品分类数量

  • 单品销量如何

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lBHGzhAn-1571562639351)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571491247616.png)]

    • 我们可以看到,这里商品的类别就6种,其中28类别的商品销量是最高的
  • 月平均销售和年平均销量是多少

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kuSRA9XL-1571562639351)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571495997937.png)]

  • 这里我们可以看到,近年的各类别商品的销售趋势,除了38、50022520、122650008销售量波动小,其他几项根据商品的具体信息可以猜测这段时间行情的变化。

  • 这里需要注意观察数据集的时间,这里的数据只到2015年第一季度,所以2015年的数据难免会有下降趋势。

  • 我们就从2012年看到2014年,从整体上看,所有商品的年销量是与日俱增的,行情趋于上升。

在这里插入图片描述

  • 这是所有数据的月销量,如果数据完整,我们以月分析的时候要将不完整的数据先剔除掉,这样有助于整体性的分析。

  • 这里有看到11月的销量特别,我们可以联想到“双十一”,很不错,这是一个非常重要的节点,画图看看

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-S1GMpUsH-1571562639352)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571552497033.png)]

    • 没错,数据是不会骗人的,我们在月销售总量表中可以看到,11月确实比其他月份销售数量高出一倍以上。其中50022520这个商品类型在这个时间段购买比较多,从这里我们可以看出,在双十一活动中,50022520这款产品是主导产品。
  • 购买的用户中,男女比例是多少

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qs3g9DjR-1571562639352)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571498136030.png)]

    • 还有一个“ 2 ”的选项,我们姑且认为这是未确定的,也就是还在肚子里。
  • 用户年龄阶段

    • 用户不同年龄段的百分比

      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bWTTYPeP-1571562639352)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571557911942.png)]

    • 这里我们能看出来我们的用户群体主要集中在哪个年龄阶段,这样更加适合我们去调整产品对应类型。

    • 我们可以看到,这里的数据显示我们的主要客户集中在0~3岁的用户占据将近80%

  • 不同年龄阶段的购物倾向

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8atuR2Y1-1571562639353)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571558465035.png)]

    • 图是服务于分析的,另外也是为了让被人更清晰直观的感受到数据的变化和分布情况。

7、报表撰写

  • 根据我们分析的结果,结合业务场景给出建议,在我们分析的时候其实有很多问题已经暴露出来了

  • 举几个例子

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Hcm8PaRq-1571562639353)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571491247616.png)]

    • 在这张图中,商品分类和销量之间的关系中我们可以根据商品具体类别查看到销售情况比较好的几个类别,我们可以建议在这些商品中加大营销力度。

- [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sqHqHmZf-1571562639354)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571552497033.png)]

  • 这张图中我们看到,11月份的某类产品销量突高,之前我们猜测是双十一活动造成的,我们可以考虑在营销方面下功夫,策划其他产品在各个购物节的活动。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uhhW4r1k-1571562639355)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571557911942.png)]

  • 这张图中也是有信息的,我们的主要服务对象在0-3岁之间,那么我们可以针对性的进行调研,提升用户体验,将主要用户服务好。
  • 还可以根据这部分用户的特性对热门商品进行竞品分析,引进大家喜爱的品牌和同功能不同款式的产品。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2pOmIHJG-1571562639355)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\1571558465035.png)]

  • 根据不同年龄阶段的购物倾向图,前面我们分析出主要用户在0-3岁之间,我们可以看到0~3岁之间编号28和50022520这两类产品的占比比较大,我们需要在这两类产品中深挖用户的购物倾向。
  • 在3-4岁这里有50014815占比特别高,我们能够从从之前的分析中得出,这个类别的产品是在购物活动中产出的热门产品,堆积出来的量不能将他放入购物倾向的分析。

总结:

​ 到此,简单的数据分析流程就梳理完了,由于数据有限,在很多用户的行为和产品相关信息都没有,没办法继续深挖。

​ 在实际工作中当然没有这么简单的数据,最难的是数据处理,和分析方法,多看书,多钻研,多搜索,大家共勉。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22374.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

塔望食业洞察|国内婴幼儿辅食市场现状、消费数据及趋势分析

随着人们对婴幼儿营养认识的不断增强,婴幼儿食品的消费习惯逐渐由仅仅为孩子购买奶粉等婴幼儿主要食品逐步向购买辅食以丰富婴幼儿饮食结构转换。受到政策利好和市场认知度变化的影响,国内市场对于辅食需求激增。“三胎政策”的出台更是推动了婴幼儿辅食…

2021年Q1互联网母婴行业网络关注度分析报告

新浪舆情通、微热点大数据研究院推出《互联网母婴行业网络关注度分析报告》,以2021年1月1日至3月31日为分析时段,在传播大数据视角下对互联网母婴行业的发展现状、传播平台、用户画像、网络关注点等方面进行洞察分析,为行业品牌、消费者提供一…

母婴产品分析

1、分析背景与目的 随着我国生育政策的开放以及电子商务的普及,婴儿相关的产品市场将迎来快速增长。为了能够获取更多的用户,提升商家的销售量,需要从产品和用户不同的角度进行分析,进而得到有价值的信息,指导商家进行…

【报告分享】 2021天猫国际母婴小童市场趋势报告-CBNDATA(附下载)

摘要:伴随着互联网长大的90/95后,在养娃上比“前辈”更加讲究科学,需求更加细化。他们不仅通过线上解决孩子吃、喝、玩、乐的基础需求外,还致力于为孩子提供一个多维营养、体智发育、全身呵护、时尚穿搭&趣玩的高阶育儿环境;他们逐渐将自…

【报告分享】2021母婴行业洞察报告-宝宝树(附下载)

摘要:超过七成的一孩年轻家庭(含怀孕)有生育二孩/三孩意愿;超过六成生育适龄人群表示生育奖励金及补贴、夫妻共同产假等配套福利能够提升其生育意愿。暂不考虑生二孩和三孩的原因略有不同,一孩家庭人群主要考虑养育成本和教育责任…

美团一面--后台开发

美团一面 感受 虽然挂了,但是感觉是自己的原因,太菜。美团其实问的并不过分,自己有很多东西没有复习到,之前一直想着TCP/IP是肯定要被问的,http只是了解了一下没有仔细琢磨,http就翻车了,问到…

美团移动端主页+订单界面

外卖订单界面 美团移动端界面 房事不利得找老中医 html代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"width, initial-scale1.0"><meta http…

美团外卖开放平台对接经验总结(一)

美团外卖开放平台对接经验总结&#xff08;一&#xff09; 2017-06-21 司想君 司想君 两个月的时间&#xff0c;在除官方文档之外的资源极其匮乏的条件下&#xff0c;项目组群策群力完成了美团和饿了么的外卖开放平台对接&#xff0c;在这里对团队成员表示感谢&#xff0c;也…

美团外卖API接入(一)

前言&#xff1a;文档用于记录美团外卖api的接入过程&#xff0c;美团外卖提供给第三方软件商的接入地址如下&#xff0c;如果是单独的餐饮企业是可以直接接入美团外卖比较成熟的api的。此文是针对第三方软件商想接入美团外卖可以看看。本人接入的时间大概是2016年12月份&#…

uniapp-美团外卖微信小程序开发

美团外卖微信小程序开发 P1 成果展示P2外卖小程序后端&#xff0c;学习给小程序写http接口P3 主界面配置P4 首页组件拆分P13 外卖列表布局筛选组件商家 布局测试数据创建样式 请求商家外卖数据封装请求并发请求 uni-app框架调用https接口 开发小程序 提高vue技术 前端技术 课程…

美团 mtgsig 1.0 版本

本次逆向的是 mtgsig 1.0 版本 mtgsig 加密入口位置&#xff1a; 请求参数 signData 里是要请求接口的 url method 等&#xff0c;美团每个网站加密参数是不一样的 进入以后到这里 fj 函数执行完&#xff0c;返回 mtgsig a6 需要执行 init

最赚钱编程语言Zig登顶,开发者爱ChatGPT远超必应|Stack Overflow报告

丰色 发自 凹非寺量子位 | 公众号 QbitAI 一年一度的Stack Overflow开发者大调查又双叒叕来了&#xff01; 今年&#xff0c;一共约9万人参与问卷&#xff0c;最大的变化是加入了ChatGPT相关的内容—— 程序员是否比大家想象地更能接受AI工具呢&#xff1f; 结果显示&#xff1…

“GPT+医疗健康”:给予医疗领域新机遇

现如今&#xff0c;GPT十分火热。随着人们对健康医疗的关注越来越热切&#xff0c;GPT已逐渐成为健康医疗领域的重要角色之一。GPT可以用于许多医疗语境中&#xff0c;如医学咨询、病症诊断、健康建议、在线问诊、患者教育、健康数据跟踪等。 GPT是一种基于深度学习的自然语言处…

活动报名丨ChatDoctor:基于LLaMA在医学领域知识上微调的医学对话模型

2023年04月06日&#xff08;星期四&#xff09;11:00-12:00&#xff0c;由智源社区主办的「智源LIVE 第36期线上活动&#xff1a;ChatDoctor&#xff1a;基于LLaMA在医学领域知识上微调的医学对话模型。本期活动将在线举办&#xff0c;「阅读原文」报名即可参加。 李云响 李云响…

Excel VBA高级编程-微信群发(支持发送文件)

关注工作&#xff0c;更关注生活&#xff0c;我是小虾&#xff0c;目前专注于外贸B2B领域。喜欢用自动化工具代理日常重复性的工作&#xff0c;喜欢的可以关注我的微信公众号&#xff1a;万能的Excel 和3000小伙伴一起学习&#xff01; 我们的微信群发模板很早就发布了&…

热点解读:大模型的突现能力和ChatGPT引爆的范式转变

来源&#xff1a;机器之心 作者&#xff1a;符尧、Tushar Khot、彭昊、李如寐等 符尧&#xff08;yao.fued.ac.uk&#xff09;&#xff0c;爱丁堡大学 (University of Edinburgh) 博士生&#xff0c;本科毕业于北京大学。他与 Tushar Khot、彭昊在艾伦人工智能研究院 (Allen In…

雅思写作范文(持续更新)

文章目录 1. Writing Task 11.1. Rates of smoking in Someland1.2. number of tourists visiting a particular Caribbean island1.3. The chart shows peoples coffee and tea buying and drinking habits in five Australian cities. 1. Writing Task 1 1.1. Rates of smok…

计算雅思成绩C语言,雅思考试总成绩计算查分表

很多同学表示&#xff0c;雅思总分算起来&#xff0c;出现0.375和0.625等小数时&#xff0c;进位退位经常傻傻分不清楚&#xff0c;附上官方算分方式以及获得不同分数可能对应的各种情况&#xff0c;大家也可以根据这个算分表&#xff0c;提前“谋划”如何让自己获得合格的总分…

雅思小作文 饼图

原文改写The charts compare two countries with their units of electricity production by fuel source in 1980 and 2000.The charts compare two countries in terms of the electricity produced by different fuels in 1980 and 2000.With regard to Australia,the coal …