【Python数据分析】——药品销售数据分析(完整项目实战)

一、前言

这篇文章找来了有关药品销售数据进行案例分析练习,利用适当的统计方法对相关数据进行月均消费次数、月均消费金额、客单价和消费趋势等几个业务指标进行分析。

分析过程为:数据获取、数据清洗、建模分析、可视化

二、数据获取

(文末有数据获取方式)

这是我们的原始数据,xlsx格式

导入相关的包并读取数据,读取的时候用object读取,防止有些数据读取不了。

接着可以查看数据的相关信息

从上图中我们可以看到该数据集一共有6578行数据,其中第一行是标题,有7列。“购药时间”和“社保卡号”有6576条数据,而其余的有6577条,说明数据中存在这缺失值。“购药时间”和“社保卡号”各缺失一行数据,在这里我们要对数据进行缺失值等进一步处理。

三、数据清洗

数据清洗的过程包括:选择子集、列名重命名、缺失值处理、数据类型转换、异常值处理以及数据排序。

3.1选择子集。

在数据分析的过程中,有可能数据量会非常大,但并不是每一列都有分析的价值,这时候就要从这些数据中选择有用的子集进行分析,这样才能提高分析的价值和效率。但是本例子中暂不需要选择子集,可以忽略这一步。

3.2列名重命名。

在数据分析的过程中,有些列名和数据容易混淆或者让人产生歧义。比如说本数据集的第一列是“购药时间”,然而我们做数据分析的时候应该是站在商家的角度来看,因此将列名改为“销售时间”就会更清晰明了。在这里可以采用rename函数来实现:

3.3缺失值处理。

获取的数据中很可能存在这缺失值,这会对分析的结果造成影响。我们经过查看数据集基本的信息,发现“购药时间”和“社保卡号”各缺失一行数据。在这里可以使用dropna函数进行删除缺失值:

3.4数据类型的转换。

在导入数据的时候为了防止导入不进来,python会强制转换为object类型,然是这样的数据类型在分析的过程中不利于运算和分析。比如“销售数量”、“实收金额”等应该是浮点型。

在“销售时间”这一列数据中存在星期这样的数据,但在数据分析过程中不需要用到,因此要把销售时间列中日期和星期使用split函数进行分割,分割后的时间,返回的是Series数据类型:

接着把切割后的日期转为时间格式,方便后面的数据统计,并且可以用astype()函数对其它数据进行类型转换:

3.5异常值处理。

到这一步,我们可以利用describe()函数查看数据是否还存在异常:

我们可以看出最小值min出现了负数,这些都是异常值,这里要去掉异常值,排除异常值造成影响。
我们可以创建一个掩模,来筛选出正常的数据,也就是大于0的值,排除“销售数量”这一列中的负值:

接下来可以利用drop_duplicates()函数删除重复的数据:

3.6数据排序。

此时的数据还是比较混乱,没有按照一定的顺序进行排序。按照习惯,我们可以根据时间的顺序对数据进行排序:

这一步也要重新设置索引index了

到这里,我们的数据清洗工作顺利完成。

四、建模分析

对数据进行处理之后,需要利用数据构建模型,计算相关的业务指标并用可视化的方式呈现结果。

4.1月均消费次数

月均消费次数 = 总消费次数 / 月份数

4.2月均消费金额

月均消费金额 = 总消费金额 / 月份数

4.3客单价

客单价 = 总消费金额 / 总消费次数

五、可视化

5.1消费趋势

消费趋势图呈现出每天销售药品的情况。

首先导入相关的包:

接着画图:

从结果可以看出,每天消费总额差异较大,除了个别天出现比较大笔的消费,大部分人消费情况维持在500元以内。

5.2每月消费金额

结果显示,7月消费金额最少,这是因为7月份的数据不完整,所以不具参考价值。
1月、4月、5月和6月的月消费金额差异不大,2月和3月的消费金额迅速降低,这可能是2月和3月处于春节期间,大部分人都回家过年的原因。

5.3药品销售情况

对“商品名称”和“销售数量”这两列数据进行聚合为Series形式,方便后面统计,并按降序排序:

截取销售数量最多的前十种药品,并用条形图展示结果:

最后画图展示:

得到销售数量最多的前十种药品信息,这些信息将会有助于加强医院对药房的管理。

获取数据集:扫码关注微信公众号“价值智生”,回复“药品销售数据”即可获得。

 

数据来源于网络,仅供学习使用,请勿用于其它用途。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50885.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

奇瑞汽车回应要求员工周六上班:本意不是压榨员工;Google发布史上最大通才模型PaLM-E;Chrome 111发布|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…

ChatGPT和知识图谱视频笔记

目录 Prompt tuing Instruction-tuning 知识图谱 prompting tuning未对模型参数进行更新, Fine tuning和Instruction tuning都对模型参数进行了更新 Prompt tuing prompt简单理解就是提问的问题 Instruction-tuning 知识图谱

新浪股票接口获取历史数据

这两天做了一个调用新浪股票接口获取实时以及历史股票数据的应用,因为新浪没有公开关于其接口的官方文档,所以通过各种百度差了很多关于新浪股票接口的使用,不过大家基本都是转载或者直接复制,对于实时数据的获取讲的很详细&#…

ChatGPT爆火之下,最有料如何赋能企业数字化升级

随着数字技术的飞速发展,人们的生活逐渐被数字技术所渗透。从智能家居到智能手机,从智能交通到智能医疗,数字技术已经成为了我们生活中不可或缺的一部分。最近火爆的ChatGPT就是一个很好的例子,作为新兴的数字技术,不仅…

硬件预算最高直降46倍!低成本上手AIGC和千亿大模型,一行代码自动并行,Colossal-AI再升级

最近,AI大模型连续火爆出圈,人工智能生成模型(AIGC)的热度尚未褪去,聊天机器人ChatGPT便引发全网热议,两周吸引百万用户。还有卷趴一半程序员的AlphaCode,生成全新蛋白质的ESM2等,不…

chatgpt赋能python:用Python优化电气工程

用Python优化电气工程 电气工程是现代世界的基础,在我们的日常生活中随处可见电气设备和电子系统的影响。Python是一种流行的编程语言,能够优化电气工程的许多方面。本文将介绍如何使用Python来增强电气工程的效率和准确性。 数据分析 Python是一种强…

chatgpt赋能python:Python模拟电路:实现更快,更高效的电路设计

Python模拟电路:实现更快,更高效的电路设计 当涉及到电路设计和模拟时,Python已经成为了工程师们首选的编程语言之一。无论是进行数字电路还是模拟电路设计,Python都表现出了它的可靠性和灵活性。 在这篇文章中,我们…

AI-领航-人生第一节-AI课,30位AI领域极客 汇集1000小时Al心得

保姆级教学 从入门到精通,0基础新手小白都能学 142课程体系 AI先导课-认识Al 四大领域技能-干货学习 GPT智能写作 GPT营销与策划] AI图像与视频 AI职场提效 复盘课程升级 A使用1000小时的高阶心得|高阶课程展示 课程大纲: 一、先导课 什么是G…

【免费AI教程大合集】做一个不轻易被割的韭菜

说明:本篇分享的内容不含任何商业推广,也不会收取任何费用,并且属于网络上各路大咖整理的资源文档,完全免费!!! 前言: 在当今数字化和智能化的时代,人工智能已然成为一种…

外贸开发信 html,外贸开发信怎么写,外贸客户开发信写作技巧及注意事项(附范文模板)...

外贸开发信的7大写作技巧 1、开发信开头称呼要恰当 有些人写外贸开发信不喜欢加称呼,甚至连简单的“你好”都忽略,直接开始正文内容。孰不知就像在传统的信件上一样,写上称呼是一种礼貌的象征。 2、内容言简意赅 外贸开发信标题要足够清晰明确…

openai(chatgpt)+python详细使用方法

网络上很多直接就是上这么串代码的 ​ import openai#获取api-key openai.api_key "你的apikey"response openai.Completion.create(model"text-davinci-003",prompt"请用python语言生成一个二分法查找算法",max_tokens256, ) messagerespons…

善于发现自己的优势,他与好友合伙创业,年销售做到近15亿

1965年,吴长江出生在重庆铜梁的一个矿工家庭。在他的记忆中,整个小学,都是光着脚上学,但常常给父母拿回来的是满分的试卷。 高中毕业后,吴长江考入西北工业大学,学的是飞机制造。毕业后进入陕西汉中一家国…

创业者应远离20个创业趋势:限时折扣 签到 交友

条条大路通罗马,非要在独木桥上论成败,那不是自寻烦恼吗? 导语:条条大路通罗马,非要在独木桥上论成败,那不是自寻烦恼吗?美国科技博客网站BusinessInsider周二就评选出20个创业者应该远离的创业趋势&#…

二次创业成功人士的19个经验与教训

二次创业成功人士的19个经验与教训 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:创业维艰。在创业路上,创业者也走过不少弯路,从中也获取了不少经验…

“我创业成功的十大秘诀”

【CSDN 编者按】对于创业者来说,很容易因为经验不足而失败,所以吸取别人创业的前车之鉴,学习别人成功案例是创业成功路上的垫脚石。本文作者讲述了他在创业生涯中的十条经验,如果你想要创业或者正要创业,不妨来看看他的…

Chatopera 张凯:创业的信念,为了小家和大家

目录 背景第一步 准备第二步 起航第三步 归来总结本文作者 背景 时光飞逝,创业两年,流金岁月,2020年7月份我在网上偶然听到一个故事。有个高三学生在高考最后几个月差点放弃高考,但是最终又重回高考队伍,还考上了比较…

创业之初的小团队

前段时间有机会与创新工场的合伙人-汪华,聊了聊针对移动互联网mobile app market和手机二维码相关业务,虽然他的很多观点在我看来是太过于以精英主义和投资眼光去评价,但是说话不紧不慢的他,每句话都透露出他对行业的理解、把握以…

作为一名投资人,我经常会问创业者 8 个问题

[转] http://36kr.com/p/5096956.html Li Jiang是一名天使投资人,也是一名关注高增长创业公司的VC,最近他写了一篇文章,谈到投资者经常会问创业者的8个问题。从表面上看,这些问题很容易回答,实际很难。 小时候&#x…

全民创业时代,程序员这样创业获得成功!

扫码观看精彩回播 整理 | 王晓曼、伍杏玲 出品 | CSDN(ID:CSDNnews) 2020年初我们遇到一些变化,大家积极地去面对这些变化:有人重新思考自己的工作方式,有人重新思考自己的职业方向。在全民创业时代&#x…

用python写的足球预测程序,预测正确率达到70%

因为平时喜欢研究研究足彩的数据,最早的时候,是通过手动复制或下载足球网站的数据到本地,放到excel表格中,然后编写公式,做一些简单的数据分析,其效率可想而知是有多低下。自从知道了python以及python做数据…