利用Python从数据分析的角度告诉你NBA2018-2019常规赛季为什么字母哥比哈登强?

目录

基于NBA2018-2019赛季常规赛球员数据进行数据挖掘

1. 挖掘背景与目标

1.1 挖掘背景

1.2 挖掘目标

2. 分析方法与过程

2.1 分析方法(主成分分析)

2.1 分析过程

3. 获取数据

4. 数据探索性分析与预处理

4.1探索性分析

4.1.1 条形图分析

4.1.2 散点图分析

4.2 数据预处理

4.2.1 数据清洗

4.2.2 属性规约

4.2.3 数据变换

5. 构建主成分分析模型与结果分析

5.1 构建建模数据

5.2 构建模型与结果分析

5.2.1 导入数据

5.2.2 计算相关系数矩阵

5.2.3 PCA综合信息

5.2.4 确定主成分个数

5.2.5 主成分散点图分析

5.2.6 主成分得分

6. 总结

附录

1. 爬虫代码如下

2. 数据探索性分析及预处理代码如下

3. 主成分分析R语言代码如下


基于NBA2018-2019赛季常规赛球员数据进行数据挖掘

1. 挖掘背景与目标

1.1 挖掘背景

        美国职业篮球联赛(National Basketball Association),简称NBA,于1946年6月6日在纽约成立,是由北美三十支队伍组成的男子职业篮球联盟,汇集了世界上最顶级的球员,是美国四大职业体育联盟之一。诞生了:迈克尔·乔丹,比尔·拉塞尔,卡里姆·阿布杜尔-贾巴尔,威尔特·张伯伦,埃尔文·约翰逊,拉里·伯德,奥斯卡·罗伯特森,约翰·哈弗利切克,里克·巴里,约翰·斯托克顿,卡尔·马龙,埃尔金·贝勒,大卫-罗宾逊,朱利叶斯·欧文,查尔斯·巴克利,哈基姆·奥拉朱旺,沙奎尔·奥尼尔,阿伦·艾弗森,德克·诺维茨基,蒂姆·邓肯,马努·吉诺比利,科比·布莱恩特,文斯·卡特,特雷西·麦克格雷迪,勒布朗·詹姆斯,凯文·杜兰特 ,斯蒂芬·库里,凯里·欧文,莱昂纳德,姚明,韦德,拉塞尔·威斯布鲁克,扬尼斯·阿德托昆博,詹姆斯·哈登等著名球员,是世界水平最高篮球赛事。

       近年来,NBA联盟出现了很多“垃圾”合同,也就是球员自身实力与球队给予的工资不相符合。因此如何判断一个球员是否具有相应工资的实力成为了众多NBA球队的难题。为此,针对NBA球员数据特点,利用数据挖掘技术研究球员所具有的实际价值有着重要的意义

1.2 挖掘目标

       根据NBA2018-2019赛季常规赛球员数据情况,构建主成分分析模型,进行数据挖掘和分析,最后由加权法计算出各个球员的主成分综合得分,然后根据综合得分进行排名,从而确定球员的实际价值。

2. 分析方法与过程

2.1 分析方法(主成分分析)

        本文采用主成分分析方法进行数据挖掘分析,是因为NBA各球员的数据特征值很多,不知道依据什么来判定一个球员的好坏与实际价值,虽然大多数人可能都认为得分能力是很好的依据,这是不可否定的,但还是想进一步的探索球员数据的内在价值,所以才采用了主成分分析方法。在此说明,本文不介绍主成分分析方法的思想和步骤,不明白的可自己查阅相关资料。

2.1 分析过程

本次数据挖掘的流程如图2-1所示,主要包括以下步骤:

图2-1 主成分分析流程图

1)从NBA中国官方网站获取原始数据;2)对样本数据进行探索性分析,剔除与球员实际价值没有关联的数据特征;3)对样本数据进行预处理,包括数据清洗、属性规约和数据变换;4)构建建模样本集;5)构建主成分分析模型;6)根据模型输出的结果进行分析。

3. 获取数据

利用网络爬虫技术从NBA官方网站爬取球员得分在前50名的各项数据,原始数据包括的球员的得分排名、姓名、所在球队、位置、出场数、首发场数、场均篮板、场均助攻、上场时间、效率值、2分命中率、3分命中率、进攻、防守、场均盖帽、场均抢断、场均失误、场均犯规、场均得分等19项数据。爬虫代码见附录。部分数据如图3-1可见。

图3-1 NBA球员部分数据

4. 数据探索性分析与预处理

4.1探索性分析

数据的探索性分析是对数据进行初步研究,发现数据的内在规律特征,有助于选择合适的数据预处理和数据分析技术。本文主要采用条形图分析得分在前20名的球员的得分能力,以及上场时间与场均得分的散点图探索二者之间是否具有正相关关系。

4.1.1 条形图分析

    如图2-2可以看出,2018-2019常规赛球员詹姆士哈登的得分能力明显高于其他球员,在之后的球员得分能力出现断崖式现象,其他球员差距不是很大,属于循序渐进的减少,由此可见詹姆士哈登得分能力属于第一档,其他球员无法相比较,要是以得分能力来判断一个球员的价值,那么毫无疑问,詹姆士哈登的价值最高。代码见附录。

 

图2-2 球员得分条形图

4.1.2 散点图分析

如图2-3,绘制的是得分能力前20名球员的上场时间与场均得分的散点图。由图可以看出,上场时间与场均得分并无正相关关系,以我们正常的思维,可能会认为上场时间与场均的会是正相关,随着上场时间的增加,得分也会随之增加,但是NBA是全世界最好的篮球比赛联盟,得分前20的球员也就是意味着他们是世界上得分能力最好的20个人,他们单位时间内得分能力爆炸,即使用很少的时间也能得很多的分,另一反面,如果他们上场时间多但是得分依旧没有变化,那可能是因为他们在帮助队友得分,自己在做那个球队的串联者。如果将所有普通球员的上场时间与场均得分画散点图,那可能就是正相关关系。代码见附录。

 

图2-3 散点图

4.2 数据预处理

4.2.1 数据清洗

数据清洗的目的是从建模的相关需要方面考虑,筛选出需要的数据。由于原始数据中并不是所有的数据都需要进行分析,因此需要在数据处理时,将多余的数据进行过滤。本文中主要进行如下操作。

  1. 考虑到受伤和轮休球员的原因,将上场场次过滤掉。
  2. 由于得分能力在前50的球员基本都是首发登场,所以过滤掉首发场次。
  3. 球员的犯规次数与球员的实际价值没有太多关联,因此过滤掉。
  4. 由于是主成分分析建模找出最高实际价值球员,那么只需要考虑场均得分前20的球员,其他球员过滤掉。

4.2.2 属性规约

由于本文采用的是主成分分析,所以需要将非数值型数据属性过滤掉。

4.2.3 数据变换

看待一个球员的控球和传球能力,不是只看他的助攻,还要看其失误的次数,如果一个球员一场比赛有5个助攻,但他的失误也有5个,而另一名球员一场比赛助攻4个,但失误只有2个,那么可以认为后一名球员的控球与传球能力要好于前一名球员。由于原始数据没有直接给出此类指标,因此,我们通过原始数据进行构造这一指标—助攻失误比,计算方式如下:

助攻失误比 = 场均助攻 / 场均失误

有了助攻失误比这一指标,就可以将助攻与失误这两个指标删除。以上所有的数据预处理使用Python编程语言实现,代码见附录。

5. 构建主成分分析模型与结果分析

5.1 构建建模数据

由于本文采用主成分分析,所以需要将前一阶段已经处理好的数据进行标准化处理,才能形成建模数据。标准化过后的部分数据如图5-1所示。

 

图5-1 标准化后数据

5.2 构建模型与结果分析

本文先利用Python语言进行数据预处理后,再利用R语言对标准化过后的数据进行建立主成分分析模型,由于R语言读入数据的问题,需要将数据的第一列的第一行球员标签删除,为了方便起见,采用手动删除并保存数据,之后的数据可以进行建模。R语言建模代码见附录。

5.2.1 导入数据

如图5-2所示,将处理过后的数据进行导入,利用ls与dim函数查看数据的变量个数和维度。

图5-2 数据导入与显示

5.2.2 计算相关系数矩阵

如图5-3相关系数矩阵可知,场均篮板与防守的相关性很高,高达0.9875,说明了防守好的人在篮板球的控制上是非常好的;三分命中率和罚球命中率有一定的正相关性但与防守是负相关,这可能说明三分命中率高的人可能防守不好;场均得分与效率的相关性是0.58,说明得分高的人可能效率值也会很高;另一方面,助攻失误比和场均抢断与其他变量的相关性都不是很高,说明这两个变量对于得分前20名的球员的波动性很小。

图5-3 相关系数

5.2.3 PCA综合信息

如图5-4所示,建立主成分分析模型,并输出模型的一些综合信息。其中有各主成分的标准差大小,方差占比大小,累计贡献率大小,可以看出,第一主成分解释了原始数据的44.55%的数据信息量,说明第一主成分拟合的很好,且前五个主成分可以解释原始数据的89.7%信息量。由图中载荷矩阵可以看书,第一主成分在场均篮板、防守、场均盖帽、效率以及进攻上的载荷值较大,可以视为进攻防守型上的主成分;第二主成分在场均时间、场均抢断以及场均得分上的载荷值较大,可以视为单位时间的得分能力上的主成分;第三主成分在三分命中率、罚球命中率以及场均得分的载荷值较大,可以视为命中率及得分上的主成分;第四主成分在两分命中率和助攻失误比上的载荷值较大,第五主成分在三分命中率、场均抢断的载荷值较大。

图5-4 主成分模型综合信息

5.2.4 确定主成分个数

由图5-5可知各个主成分的特征值大小,以及前五个主成分的累计贡献率。再有图5-6的碎石图可以确定主成分的个数应该定为5个,因为需要解释原始数据85%以上的信息量

 

图5-5 特征值及方差贡献率

 

图5-6 碎石图

5.2.5 主成分散点图分析

由图5-7可以看出扬尼斯安特托昆博、乔尔恩比德、安东尼戴维斯在第一主成分上的得分较高,说明他们是进攻防守型球员,既能进攻得分又能在防守端表现的很好;詹姆斯哈登、保罗乔治在第二主成分上的得分很高,说明他们是单位时间内的得分能力很高,且他们的场均抢断也很不错;图的左下方说明有很多球员在罚球命中率上很高;图中中心是科怀伦纳德,说明这名球员是一名综合型选手,在各个方面得分都不是很高,但都是正常水平。

 

图5-7 主成分散点图

5.2.6 主成分得分

由图5-8可知前五个主成分的得分情况,由图5-9可以看到各个球员的综合得分以及排名情况。排名第一的是扬尼斯安特托昆博,可以说明扬尼斯安特托昆博这名球员在本文中的主成分分析模型中得分最高,也是具有最高实际价值的球员,从实际方面来看,扬尼斯安特托昆博也是今年的常规赛MVP最佳候选人,前不久又与雄鹿队队续约,薪资高达每年5000多万美元,由此说明雄鹿队管理层也是看上了扬尼斯安特托昆博的实际价值。排在扬尼斯安特托昆博后两名球员分别是乔尔恩比德和安东尼戴维斯,在主成分散点图中就可以看出他们三个的第一主成分得分很高,从而在综合得分上影响很大。由综合排名情况可以给球队管理层作为一个球员实际价值的参考,以此来考虑签约相关问题。

图5-8 前五个主成分得分

图5-9 综合得分

6. 总结

本文对NBA球员得分在前20名的球员数据进行数据挖掘,因为数据变量过多,无法确定球员的实际价值,所以采用主成分分析方法将多个数据变量转化为少数几个综合变量,最后计算各个球员在综合变量上的总得分情况,从而来确定一个球员的实际价值,结合事实分析得出,NBA2018-2019赛季常规赛最具有实际价值的球员是扬尼斯安特托昆博。此外,在本此数据挖掘中,交叉使用了Python与R两种语言,在使用中感受到两种语言各有所长和所短,可以交叉使用,取其长补其所短。

本文不足之处很多,在此只说以下几点不足之处:

  1. 只采用了单一的方法进行建模,没有与之比较的方法。
  2. 数据预处理过于简单,不够深入,可能无法真正的体现数据的内在价值。
  3. 本文虽然得出的最具有实际价值的球员,但从最后的综合得分可以看出,本文所用数据建立的模型对于锋线球员有利,对于后卫线球员不利,库里是NBA联盟最近几年表现很好的球员,可此模型没有体现出库里这名球员的价值。所以模型有待改进。

附录

1. 爬虫代码如下

# -*- coding: utf-8 -*-
"""
作者:赵修锐
日期:2020/4/27
作用:爬取NBA TOP 50 球员的数据并写入CSV或JSON文件
"""import json
import csv
import requestsurl = 'https://china.nba.com/static/data/league/playerstats_All_All_All_0_All_false_2018_2_All_Team_points_All_perGame.json'
header = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1)'
+ ' AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.124 Safari/537.36'}
def get_page(url):try:r = requests.get(url, headers=header)if r.status_code == 200:print(r.json())return r.json()except requests.ConnectionError as e:print('Error', e.args)
def parse_page(json):if json:items = json.get('payload').get('players')for item in items:it = item['playerProfile']its = item['teamProfile']stat = item['statAverage']player={}player['排名'] = item['rank']player['球员']=it['displayName']player['球队'] = its['name']player['位置'] = it['position']player['场数'] = stat['games']player['先发'] = stat['gamesStarted']player['场均篮板'] = stat['rebsPg']player['场均助攻'] = stat['assistsPg']player['分钟'] = stat['minsPg']player['效率'] = stat['efficiency']player['2分命中率%'] = stat['fgpct']player['3分命中率%'] = stat['tppct']player['罚球命中率%'] = stat['ftpct']player['进攻'] = stat['offRebsPg']player['防守'] = stat['defRebsPg']player['场均抢断'] = stat['stealsPg']player['场均盖帽'] = stat['blocksPg']player['失误'] = stat['turnoversPg']player['犯规'] = stat['foulsPg']player['场均得分'] = stat['pointsPg']yield playerdef write_tofile():fieldnames = ['排名', '球员', '球队', '位置', '场数', '先发', '场均篮板','场均助攻', '分钟', '效率', '2分命中率%', '3分命中率%', '罚球命中率%','进攻', '防守', '场均抢断', '场均盖帽', '失误', '犯规', '场均得分']with open('NBA_TOP50球员数据.csv', 'a', encoding='utf_8') as f:writer = csv.writer(f)writer.writerow(fieldnames)for result in parse_page(get_page(url)):# 输出json文件# with open('NBA_TOP50球员数据.json', 'a', encoding='utf-8') as f:#     f.write(json.dumps(result, indent=1, ensure_ascii=False))# 输出csv文件with open('NBA_TOP50球员数据.csv', 'a', encoding='utf-8') as f:fieldnames = ['排名', '球员', '球队', '位置', '场数', '先发', '场均篮板','场均助攻', '分钟', '效率', '2分命中率%', '3分命中率%', '罚球命中率%','进攻', '防守', '场均抢断', '场均盖帽', '失误', '犯规', '场均得分']writer = csv.DictWriter(f, fieldnames=fieldnames)writer.writerow(result)def main():write_tofile()if __name__ == '__main__':main()

2. 数据探索性分析及预处理代码如下

import pandas as pd# 参数初始化
inputfile = 'NBA_TOP50球员数据.csv'
outputfile = 'zscoredfile1.csv' #标准化后的数据data = pd.read_csv(inputfile, index_col='球员', engine='python', encoding='utf-8')
# 读入数据并以球员姓名作为行标签
# print(data.columns)  # 查看列名
# print(data.head())  # 查看数据前几行数据信息
data = data.iloc[:20]  # 获取前20行数据
# data.columns = ['X1', 'X2', 'X3', 'X4', 'X5', 'X6', 'X7', 'X8', 'X9', 'X10', 'X11', 'X12', 'X13', 'X14', 'X15']
data = data[['场均篮板', '场均助攻', '分钟', '效率', '2分命中率%', '3分命中率%','罚球命中率%', '进攻', '防守', '场均抢断', '场均盖帽', '失误', '犯规', '场均得分']]new = data['场均助攻']/data['失误']  # 助攻失误比
new = pd.DataFrame(new)  # 转换成DataFrame结构数据
data = pd.concat([data, new], axis=1)  # 与之前的数据连接
data = data[['场均篮板', '分钟', '效率', '2分命中率%', '3分命中率%','罚球命中率%', '进攻', '防守', '场均抢断', '场均盖帽', '场均得分', 0]]
data.columns = ['场均篮板', '时间', '效率', '两分命中率', '三分命中率','罚球命中率', '进攻', '防守', '场均抢断', '场均盖帽', '场均得分', '助攻失误比']
print(data)import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号data['场均得分'].plot(kind='bar')
plt.ylabel('场均得分')
plt.xlabel('球员')
plt.title('TOP_20得分条形图')
plt.savefig('df.png')
plt.scatter(data['时间'], data['场均得分'])
plt.ylabel('场均得分')
plt.xlabel('上场时间')
plt.title('TOP_20散点图')
plt.show()

3. 主成分分析R语言代码如下

 

data = read.table("C:/R语言/zscoredfile1.csv", sep=",",header=T) #数据的导入
ls(data) #ls()函数列出所有变量
dim(data) #维度
rownames(data)=data[[1]] #数组各行名字定义为数据文件的的第一列
data = data[,2:13]
data
class(data) #查看数据类型
cor(data) #相关系数矩阵
pca=princomp(data,cor=TRUE) #主成分分析
summary(pca,loadings=TRUE) #列出结果,包含特征向量
y=eigen(cor(data)) #求出cor(data)的特征值和特征向量
y$values #输出特征值
sum(y$values[1:5])/sum(y$values) #求前5个主成分的累计方差贡献率
pca$loadings[,1:5] #输出前5个主成分的载荷矩阵
screeplot(pca,type='lines') #画出碎石图
biplot(pca) #画出主成分散点图
s=pca$scores[,1:5] #输出前5个主成分的得分
s
scores=0.0
for (i in 1:5)scores=(y$values[i]*s[,i])/(sum(y$values[1:5]))+scores
sort=cbind(s,scores) #输出综合得分信息
class(sort)
paiming=sort[order(sort[,6],decreasing=T),] #按最后一列降序排序
rank=c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20)
rank=cbind(paiming,rank)
rank[,c(6,7)] #获取综合得分最终排名

写在最后

纯个人原创,转载或者其他目的使用请告知,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/63363.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI篮球裁判火了,走步算得特别准,就问哈登慌不慌

Alex 发自 凹非寺量子位 | 公众号 QbitAI 打篮球的友友们应该知道,走步是比赛中最常见的违规之一。 为了更好地监测篮球比赛中球员是否出现走步行为,一位网名叫Ayush Pai的小哥(我们就叫他AP哥吧)搞出了一个AI裁判。 如你所见&…

预测2019-2020赛季常规赛MVP

受新冠肺炎影响,2019-2020赛季NBA已经处于停摆状态,是否以及何时能复赛还不清楚。相关的各项评选如常规赛MVP、最佳阵容、最佳防守等也由于疫情暂停了。按照往年的赛程节奏,此时也应该进入常规赛收官阶段了。本文利用历史数据和本赛季常规赛已…

今天nba预测分析_焰神体育【NBA】赛事推荐预测分析:1月15日《开拓者》vs《步行者》...

波特兰开拓者(主) VS 印第安纳步行者 比赛时间:2021 1月15日 11:00 印第安纳步行者队 周四的大新闻是詹姆斯哈登在连续几周表现不佳后终于如愿以获,被交易到布鲁克林篮网队。 印第安纳步行者队用奥拉迪波交换莱弗里特到火箭。 凯文-普理查德可以说是今天…

前端图片显示不出来

原来的代码是 <img src"Release/warn.png">给路径加上 / 就可以了 <img src"/Release/warn.png"> 然后就正常显示了

页面加载微信聊天记录图片不显示问题

今天在做微信客服功能的时候页面通过异步请求微信的聊天记录&#xff0c;并把获取的结果appendchild页面中&#xff0c;发现微信的图片无权加载。如下图&#xff1a; 经过查阅资料得知&#xff0c;因为微信加载图片是通过一个地址请求然后返回的真是的图片地址&#xff0c;在请…

为什么计算机没有桌面显示不出来,​为什么电脑图片显示不出来

我们日常使用的电脑中&#xff0c;往往会有一些图片保存下来&#xff0c;用户想要打开自己需要的图片时&#xff0c;也可以通过显示的缩略图来查找&#xff0c;然而最近有用户的电脑桌面上的图片总是不显示出来&#xff0c;这让我们需要一张一张的进行查看&#xff0c;那么为什…

为什么html中图片显示不出来,网页图片不能显示 网页图片显示不出来的解决办法...

很多朋友上网遇到这样一种情况在浏览网页的时候发现网页中德图片不显示&#xff0c;(电脑百事网)一般现象是要门图像位置是空白&#xff0c;要么图像位置显示一个红叉&#xff0c;如下图所示&#xff0c;一般来说网页图片不显示主要影响页面美观&#xff0c;对我们影响相对不大…

在html中图片不显示不出来,网页图片显示不出来

很多小伙伴在打开网页的时候&#xff0c;发现网页的图片加载不出来&#xff0c;显示一个的标志&#xff0c;这是怎么一回事呢?可能是你的网速过低&#xff0c;等待一会就可以了&#xff0c;也可能是设置里面没有把显示图片打勾&#xff0c;具体的解决方法下面一起来看看吧。 显…

为什么html中图片显示不出来,网页图片显示不出来是什么原因?

原标题&#xff1a;网页图片显示不出来是什么原因&#xff1f; 在平时生活上网的过程&#xff0c;我们常常会遇到网页虽然是正常打开了&#xff0c;但网页上的图片却无法显示出来&#xff0c;无论怎么刷新也无法显示呢&#xff1f;一个网页打开正常与否&#xff0c;其实由很多因…

html浏览器图片不显示图片,教你网页图片显示不出来怎么办

网页是构成网站的基本元素&#xff0c;是一个包含HTML标签的纯文本文件&#xff0c;而文字与图片是构成一个网页的最基本的元素。今天&#xff0c;小编就给大家介绍一下网页图片显示不出来的解决方法&#xff0c;有需要就来了解一下吧 在查看网页的时候最重要的就是图片&#x…

流利阅读 2019.2.27 How sky-high rents forced people into imaginative alternatives

下载 笔记版/无笔记版 pdf资料&#xff1a; GitHub - zhbink/LiuLiYueDu: 流利阅读pdf汇总 本文内容全部来源于流利阅读。流利阅读对每期内容均有很好的文章讲解&#xff0c;向您推荐。 您可以关注微信公众号&#xff1a;流利阅读 了解详情。 How sky-high rents forced people…

V-Net 《Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification》阅读理解笔记

V-Net 《Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification》 这篇文章是发表在2018年ACL上的&#xff0c;是抽取式的。在微软发布的MS MARCO数据集和百度发布的中文数据集DuReader上得到了SOTA效果。 分以下四部分介绍&#xff1a; Mot…

掌握这15个可视化图表,小白也能轻松玩转数据分析

大数据时代&#xff0c;数据驱动决策。处理不好庞大、复杂的数据&#xff0c;其价值将大打折扣。 那如何缩短数据与用户的距离&#xff1f;让用户一眼Get到重点&#xff1f;让老板为你的汇报方案鼓掌&#xff1f; 本文通过连环15关&#xff0c;层层深入&#xff0c;传你数据匹…

几种可视化数据分析图表的使用

图表简洁大方、一目了然&#xff0c;利用图表工具就能轻松实现&#xff0c;是数据分析中常采用的方式。今天利用在雀书无代码平台搭建的图表来介绍几种常见数据分析图表的使用。 1. 柱状图 柱状图可以显示一段时间内的数据变化或显示各项之间的比较情况&#xff0c;主要使用颜…

数据分析——可视化图表

1、柱状图 展示多个分类的数据变化和同类别各变量之间的比较情况。 适用&#xff1a;对比分类数据&#xff08;比较不同的数值&#xff09;。 局限&#xff1a;分类过多则无法展示数据特点。 相似图表&#xff1a; 1&#xff09;堆积柱状图。比较同类别各变量和不同类别变量…

掌握这6个可视化图表,小白也能轻松玩转数据分析

今天我们来说一说数据可视化&#xff0c;想必很多人在入门数据分析之后&#xff0c;就会经常进行可视化的工作&#xff0c;所谓一图胜千言&#xff0c;图表用的好&#xff0c;真的是会事半功倍的。但现实情况下&#xff0c;很多人遇到的问题是&#xff1a; 你做的图表太丑了&am…

excel数据分析 - 13个图表可视化技巧

目录 一、对比分析类图表 1 漏斗图 2 指标完成度 3 完成度对比图 4 滑珠图 5 仪表盘 6 跑道图 二、分布分析类图表 1 旭日图 2 瀑布图 3 气泡图 4 箱形图 5 旋风图 三、图表优化 1 添加底部数据表 2 更改条形图的样式 ① 操作说明 ② 应用-五星级图制作 一、…

数据分析--Excel数据可视化(图表)

Excel组成元素 Excel图表类型与用途 饼状图(个体占总比的时候选择使用) 案例1&#xff1a;地区/销售额---》饼状图 方案&#xff1a;&#xff08;1&#xff09;生成图表&#xff1a;选中---》插入---》二维饼图&#xff08;2&#xff09;数据显示&#xff1a;➕---》数据标签--…

数据分析利用pyechart套模版制作图片,解决数据轻松出图!

pyechart 官网地址&#xff1a;pyecharts - A Python Echarts Plotting Library built with love. 柱状图&#xff1a; from pyecharts.charts import Bar from pyecharts import options as opts # 内置主题类型可查看 pyecharts.globals.ThemeType from pyecharts.globa…

Excel数据分析(八)图表

一&#xff0c;图表的理论基础 1&#xff0c;什么情况下需要用到图表 1&#xff09;为了揭示数据规律时&#xff0c;可以用图表&#xff0c;比纯数据的文本更形象。 2&#xff09;需要用数据说服他人 3&#xff09;为了展示专业素养&#xff0c;可以参照一些国际知名出版社…