python数据分析及可视化(十四)数据分析可视化练习-上市公司可视化数据分析、黑色星期五案例分析

上市公司数据分析

从中商情报网下载的数据,表格中会存在很多的问题,查看数据的信息有无缺失,然后做数据的清晰,有无重复值,异常数据,省份和城市的列名称和数据是不对照的,删除掉一些不需要的数据,省份不完整的数据,然后进行数据分析以及可视化,如上市公司中的行业Top5,用饼图绘制;绘制哪些城市的上市公司数量最多Top10,用柱形图绘制;北上深上市公司数量占比,绘制饼图或者水球图;根据上市年份画出上市公司数量;上市公司的分布,集中在一线城市辐射范围内,也跟地域有关;把所有的子图全部布局到一起,生成网页文件,在网页文件中可以拖拽图表进行重新布局,布局完成后点击网页上的‘save config’按钮,会生成chart_config.json文件,把文件 复制粘贴到代码的同级目录下,然后使用Page的保存格式进行保存。

1.导入数据

在这里插入图片描述
在这里插入图片描述

2.数据清洗

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.数据分析及可视化

3.0 上市公司中行业Top5

在这里插入图片描述
在这里插入图片描述

3.1 哪些城市的上市公司数量最多(Top10)

在这里插入图片描述
在这里插入图片描述

3.2 北上深上市公司数量占比

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.3 上市公司数量(按上市年份)

在这里插入图片描述
在这里插入图片描述

3.4 上市公司分布

在这里插入图片描述
在这里插入图片描述

3.5 做可视化的大屏

根据以上制作的图表,制作可视化的大屏。
在这里插入图片描述
打开生成的html文件,图表带虚线框,可以调整大小和位置,拖动鼠标进行图形的摆放
在这里插入图片描述
摆放完成后,点击左上角save config,把得到的json文件保存到代码的同级目录下,运行以下代码。
在这里插入图片描述
得到最终可视化大屏的图表。
在这里插入图片描述

PPT中插入可视化图表

在PPt中插入浏览器的图片的渲染效果。

  1. 需要先进行注册表的设置
    将该注册表中(打开CMD命令输入regedit)

定位到:HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft\Internet Explorer\ActiveX Compatibility{8856F961-340A-11D0-A96B-00C04FD705A2}

将右侧 Compatibility Flags值21改为十六位0

定位到:\HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft\Internet Explorer\ActiveX Compatibility{8856F961-340A-11D0-A96B-00C04FD705A2}

将右侧 Compatibility Flags值21改为十六位0

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office\ClickToRun\REGISTRY\MACHINE\Software\Microsoft\Office\16.0\Common\COM Compatibility{8856F961-340A-11D0-A96B-00C04FD705A2}

将右侧 Compatibility Flags值400改为十六位0

2.PowerPoint2003以上的版本,文件—>选项—>自定义功能区中添加开发工具选项卡,添加Web browser控件。

在这里插入图片描述
3.开发工具---->控件----->其他控件
在这里插入图片描述
选择 Microsoft Web Browser,单击确定。
在这里插入图片描述
4.在PPt上 画出 图表显示的范围,调整矩形框的大小。然后在控件组中选择命令按钮,进入放在ppt上,双击命令按钮进入代码编写模式,如图所示添加第二行代码,括号内为生成图表的位置及名称。
在这里插入图片描述
5.关闭代码框,进入ppt放映状态,单击命令按钮,允许ActiveX控件运行就可以了
在这里插入图片描述
6.单击"是",允许文件运行活动内容。
在这里插入图片描述
7.保存文件为 启用宏的PowerPoint演示文稿。
遇到的问题:
在这里插入图片描述
百度搜索bootCDN,搜索echarts,找到合适的链接复制下来,用记事本打开html文件替换掉图表的scr
在这里插入图片描述

在这里插入图片描述

案例分析-黑色星期五

数据背景

了解以下数据是关于什么内容的,从哪来的,可靠性如何。美国黑色星期五的数据集,类似于美国版的双11。大多数的商品进行打折促销,很多人去采购各种商品,

分析方向

根据分析需求进行分析操作,假想从以下几个角度进行设想分析,实际的分析还要基于问题进行,以后遇到销售问题可以进行参考。

1.销售画像

作为销售数据,要进行销售画像,对销售情况做简单的了解,如破案时对犯罪嫌疑人的心理活动进行画像,主要从销售总览、用户情况、商品情况进行分析;

2.用户画像

只要从性别分布和消费情况、年龄分布和消费情况、不同城市的用户和消费情况。

3.商品画像

主要从最喜欢的商品分布和消费情况、不同年龄段喜欢商品分布和消费情况、男女喜欢的商品和消费情况

数据分析及可视化

了解完数据背景和分析方向后,就要对数据进行分析及可视化。

一、原始数据

在这里插入图片描述
查看数据信息为 数据行和列的个数,数据的个数、数据的类型以及缺失情况。对数据分析有影响的就要填充缺失值,没有影响的话就直接删除或者不进行操作。
User_ID,购物者的ID;Product_ID,商品的ID;Gender,购物者的性别;Age,购物者的年龄范围;Occupation,购物者的行业、职位;City_Category,购物者的城市;Stay_In_Current_City_Years,购物者在城市待的年份;Marital_Status ,结婚状态;Product_Category_1,商品的类别,1,2,3类;Purchase,花费的金额。
在这里插入图片描述

二、数据清洗

缺失值的处理,分为删除和填充操作,查看缺失值在数据中的比值。缺失的数据对数据分析没有影响,可以不做处理。
在这里插入图片描述

三、数据分析及可视化

EDA,探索性的数据分析,不涉及统计学的知识,做数据的清洗和画图,从图中得到结论。

3.1销售画像

消费者一共消费的总额、用户总人数、人均消费金额、消费商品的总类等。
在这里插入图片描述

3.2用户画像

性别分布对消费情况的影响
在这里插入图片描述
在这里插入图片描述
用pyecharts绘制图表
在这里插入图片描述
男女消费金额的比例
在这里插入图片描述
%在这里插入图片描述
女生消费人数占28%,但是消费额占到四分之一左右。
婚姻状况对消费的影响
在这里插入图片描述
在这里插入图片描述
男性女性已婚未婚的比例
在这里插入图片描述
已婚,未婚消费的情况
在这里插入图片描述
在这里插入图片描述
年龄分布对销售情况的影响,主要的消费人群是在哪个年龄段。
在这里插入图片描述
不同年龄段消费的金额,26-35岁之间消费的金额最多。
在这里插入图片描述
用户所在的城市对消费的影响,B城市的购买力最大,人数少消费占比大。
在这里插入图片描述
在这里插入图片描述
每个城市花费支出的金额,购买消费能力
在这里插入图片描述
每个城市不同年龄段人数的分析
在这里插入图片描述
每个城市居住年份人数的比例
在这里插入图片描述
居住年份对消费的影响,第1年刚到一个城市消费能力低,游客到外地消费力大,2年的时候准备定居,消费能力比较大,3-4年的时候东西已经有了不会再买大件物品,基本的用品已经购齐了。
在这里插入图片描述
职业分类的人数
在这里插入图片描述
职业分类对消费金额的影响
在这里插入图片描述

四、结论

1.未婚比已婚人群多,商品定位要照顾年轻人
2.集中在18-35年龄范围,购买力大,商品定位在18-35岁之间
3.B城市购买力最大
4.购买人群随着居住年份增加而相应的减少, 居住两年的人群消费能力比较大,住的越久,消费能力越差
5.不同职业差异比较大,重心放在这些购买力大的人群
通过例子了解数据分析的流程,数据清洗过程比较繁琐,可视化比较消耗时间,从图表中发现结论,结论的获得要有依据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/71794.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一款开源的数据可视化分析平台,提供多种大屏模板,非常炫酷

点击关注公众号,实用技术文章及时了解 DataGear是一款开源的数据可视化分析平台,可自由制作任何您想要的数据可视化看板,支持接入SQL、CSV、Excel、HTTP接口、JSON等多种数据源。系统主要功能包括:数据管理、SQL工作台、数据导入/…

大数据可视化,可视化大屏,可视化报表,报表工具,BI - Rocket

大数据可视化,可视化大屏,可视化报表,报表工具,BI - Rocket ROCKET 零代码玩转数据可视化 Rocket 致力于使数据友好并且充满活力。 简单!简单!简单! 重要的事情说三遍。 图形化操作,布局灵活,所见即所得。 通过拖、…

【手把手教你】股票可视化分析之Pyecharts(一)

Pyecharts简介 Echarts 是百度基于JavaScript 开源的可视化图表库,而 Pyecharts 相当于是 Pythonecharts,即使用 Python 语言调用 echarts 的开源库,可以制作非常精美的图表。实际上 Python 可视化库有很多,包括 Matplotlib、Seab…

4.5k star,一款开源的数据可视化分析平台,提供多种大屏模板,非常炫酷

点击关注公众号,实用技术文章及时了解 DataGear是一款开源的数据可视化分析平台,可自由制作任何您想要的数据可视化看板,支持接入SQL、CSV、Excel、HTTP接口、JSON等多种数据源。系统主要功能包括:数据管理、SQL工作台、数据导入/…

干货: 如何避免让人一眼就看出来你的内容是ChatGPT写的?

人们对chatGPT的众多抱怨之一是它无法为每个用户提供想要内容。主要体现在其回答的内容乏味、机械,以至于如何让人很容易就看出来这是由ChaGPT写的。 试试这种方式解决这个问题吧(下文【】内文字需要自己根据自己想要生成的内容,找到合适的自…

《聊天机器人观后感》

第七章 人工智能 智力是一种适应变化的能力 ---------史蒂芬 霍金 什么是人工智能(AI) 但是我不予苟同,我想说的是:一句名言解释什么是人工智能。 指测试者与被测试者(一个人和一台机器)隔开的情况下&a…

这几十部电影,我看以后都写了观后感

没有对比就没有伤害,发现近3年来的观影频率出现了较大的波动。2016年忙得昏天暗地,竟然还抽空看了11部电影。如果片子还可以,我一般都会写篇影评。2017年影评写得少了,而且发现影评越来越难写了,一方面是自己有一个心理…

“硅谷之父”传奇:拯救斯坦福大学、培养大批高科技人才、指导创立惠普

作者 | 年素清 责编 | 王晓曼 出品 | 程序人生 (ID:coder _life) 有人说,当今硅谷之中99%的电子工业都与一个叫做弗雷德•特曼(Frederick Emmons Terman)有关。 弗雷德•特曼曾担任美国斯坦福大学校长&…

专栏 | 香侬科技独家对话斯坦福大学计算机学院教授Dan Jurafsky

专栏介绍:《香侬说》为香侬科技打造的一款以机器学习与自然语言处理为专题的访谈节目。由斯坦福大学,麻省理工学院, 卡耐基梅隆大学,剑桥大学等知名大学计算机系博士生组成的“香侬智囊”撰写问题,采访顶尖科研机构(斯…

chatgpt赋能python:Python强解WiFi密码:一种简单而有效的方式

Python强解WiFi密码:一种简单而有效的方式 无线网络连接是我们生活中的常见需求,但是忘记WiFi密码是一个让人感到很困扰的问题。幸运的是,Python可以让我们更容易地找回WiFi密码。本文将介绍如何使用Python强解WiFi密码。 什么是Python&…

有主题的图文内容创作 | AIGC实践

话说,昨天我发布了第一篇,内容由ChatGPT和Midjourney协助完成的文章:胡同与侏罗纪公园的时空交错 | 胡同幻想 在这篇文章中,大约70%图文内容由ChatGPT和Midjourney输出。我个人参与的部分,主要是提出指令(P…

【文本分析】基于粤港澳大湾区博物馆访客评价的文本分析

此文是2021年初在深圳大学文化产业研究院黄老师的指导下,与吴同学合作完成的,且于2021年4月发表于《文化深圳》杂志第一期。 文章目录 1 背景2 研究思路3 数据来源4 数据基本情况4.1 粤港澳大湾区的博物馆数据统计4.2 粤港澳大湾区各城市博物馆的平均得分…

维达东南亚新总部正式投入运营;西门子能源在粤港澳大湾区持续深化务实合作 | 美通企业日报...

美通社要闻摘要: 维达东南亚新总部正式投入运营。西门子能源在粤港澳大湾区持续深化务实合作。三星电子首款12纳米级DDR5 DRAM开发成功。日赛谷丽思卡尔顿隐世酒店将在2023年第二季度于四川九寨沟启幕。苏州AC酒店正式启幕。2023年君澜预计开业20家酒店。阿迪达斯和…

洲际酒店集团加码粤港澳大湾区和海南自贸港,三亚逸衡酒店、金普顿酒店将面世...

上海2021年7月29日 /美通社/ -- 作为最早进驻中国市场的国际酒店管理集团之一,洲际酒店集团在华37年来紧跟国家战略和区域政策发展,始终秉承践行“在中国为中国”的承诺。近年来,洲际酒店集团更是持续聚焦施力于包括粤港澳大湾区、海南自贸港…

开源网安亮相粤港澳大湾区CIO高峰论坛,保障企业数字化安全转型

近日,由深圳市工业化与信息化局、深圳市科学技术协会指导,深圳市CIO协会主办的“2023中国(深圳)数字化转型大会暨粤港澳大湾区CIO高峰论坛”圆满完成。开源网安作为拥有软件安全领域全链条产品的厂商,携多年来打造的国产化软件安全替代方案&a…

《区块链助力粤港澳大湾区一体化发展报告(2022)》发布

7月19日,中国(深圳)综合开发研究院主办的《数“链”大湾区——区块链助力粤港澳大湾区一体化发展报告(2022)》发布会在深圳举行。 报告提出,以区块链为代表的数字技术在破解粤港澳大湾区制度差异坚冰、支撑…

重磅!首届粤港澳大湾区新能源智能汽车大数据创新竞赛启动

赛事介绍 为推动汽车电动化、智能化、网联化、共享化发展,聚力建设“智车之城”、“超充之都”和新能源智能汽车解决方案的策源地、生产地,促进科技成果转化、高层次人才的引进与培养、培育,壮大新产业、新业态、新模式,基于广州市…

数字引领未来,第七届粤港澳大湾区跨界融合产业创新交流会圆满举行

据《中国数字经济发展报告(2022年)》显示,2021年,我国数字经济规模达到45.5万亿元,占GDP比重达到39.8%,数字经济在国民经济中的地位更加稳固、支撑作用更加明显,产业数字化转型对国家经济和企业…

我为什么鼓励你读博士?

点击上方“码农突围”,马上关注 这里是码农充电第一站,回复“666”,获取一份专属大礼包 真爱,请设置“星标”或点个“在看” 看过《水浒传》的朋友都知道,梁山的一百单八将因为各种理由加入了水寨,走上了劫…

滑动验证码破解

背景 最近由于需要爬取一些数据,但是这个数据必须在登陆状态下才能得到,调研了很多爬虫的反爬技术的攻防,发现采用一些比较底层的爬虫框架虽然速度更快扩展性更好,但是成本比较高,目标网站任何改动都可以让整个爬虫崩…