分析谁是2020欧洲杯的最佳球员

问题

欧洲杯刚刚结束,就像看看有没有欧洲杯的数,分析下谁是本次欧洲杯表现最好的球员。于是我就上网找了一组数据。

网盘地址(提取码:hc9s)

【1】文件结构

【2】数据空处理

import numpy as np 
import pandas as pd 
import warnings
warnings.filterwarnings("ignore")
import matplotlib.pyplot as plt
import seaborn as snsdf = pd.read_csv("./data/euro2020.csv")
print(df.head(10))summary = pd.DataFrame(df.dtypes, columns=["datatype"])
summary["isnull"] = df.isnull().sum() 
summary["unique"] = df.nunique()
summary["first"] = df.loc[0]
summary["second"] = df.loc[1]
summary["third"] = df.loc[2]
print(summary)print(len(df))
train_df = df.drop("Blocks", axis = 1)train_df = train_df.fillna(axis = 0, value = 0)print(train_df.columns)

输出数据列

Index(['Player', 'Country', 'Position', 'Match played', 'Goals','Right foot goals', 'Left foot goals', 'Header goals', 'Assists','Total attempts', 'On target', 'Off target', 'Woodwork', 'Shot blocks','Avg gpg', 'Fouls suffered', 'Fouls committed', 'Top speed','Passing accuracy', 'Distance covered', 'Clearence attempted','Balls recovered', 'Tackels', 'Yellow cards', 'Red cards','Minutes played'],dtype='object')

字段分析下

# Player :球员
# Country :国家
# Position :所处位置
# Match played :出场场次
# Goals :进球数
# Right foot goals :右脚进球数
# Left foot goals :左脚进球数
# Header goals :头球进球数
# Assists :助攻数
# Total attempts :总射门数
# On target :球门内
# Off target :球门外
# Woodwork :球门框上
# Shot blocks :拦截
# Avg gpg :场均得分
# Fouls suffered :被犯规数
# Fouls committed :犯规数
# Top speed :最高速度
# Passing accuracy :传球准确度
# Distance covered :奔跑距离
# Balls recovered :抢断
# Tackles :铲球
# Yellow cards :黄牌数
# Red cards :红牌数
# Minutes played :上场时长

【3】整体数据集分布

fig, ax = plt.subplots(13,2, figsize=(100,300))
for idx, col in enumerate(train_df.columns.to_list()):row_idx = idx//2col_idx = idx%2sns.countplot(data=train_df, x = col,  color = "red", ax = ax[row_idx, col_idx])
plt.show()

【4】处理自己需要的数据

top_players = train_df.sort_values(["Goals"], ascending=False).iloc[:10]
train_df["gpa"] = train_df["Goals"]/train_df["Total attempts"]
attempts = train_df.sort_values(["gpa"], ascending=False).iloc[:10]
agp = train_df.sort_values(["Avg gpg"], ascending=False).iloc[:10]
passing_accuracy = train_df.sort_values(["Passing accuracy"], ascending=False).iloc[:10]
header = train_df.sort_values(["Header goals"], ascending=False).iloc[:10]

 【5】总进球数

# 进球数排名top10
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = top_players, y = "Goals", palette = "Greys", hue = "Position")
plt.title("Top players on the basis of max goals")
plt.show()

# 场均进球排名top10
fig, ax = plt.subplots(2, 1,figsize=(20,10))
sns.barplot(x = "Player", data = agp, y = "Avg gpg", palette = "Greys", ax = ax[0])
sns.barplot(x = "Country", data = agp, y = "Avg gpg", palette = "Greens", ax = ax[1])
plt.show()

这个就奇怪了,直观的感受好像,意大利对获得了冠军,为啥场均进球数这么少。。意大利的比赛是多难看。。

然后其他数据就当做参考吧。

【6】其他

# 传球
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = passing_accuracy, y = "Passing accuracy", palette = "Blues")
plt.title("Top players on the basis of passing accuracy")
plt.show()# 头球
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = header, y = "Header goals", palette = "Reds", hue = "Goals")
plt.title("Top players on the basis header goals")
plt.show()# 速度
speedy = train_df.sort_values(["Top speed"], ascending=False).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = speedy, y = "Top speed", palette = "Greens")
plt.title("Top playerson the basis of their speed")
plt.show()# 黄牌数
yelloww = train_df.sort_values(["Yellow cards"], ascending=False).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = yelloww, y = "Yellow cards", palette = "Greens")
plt.title("Yellow card receivers")
plt.show()# 抢断
blockers = train_df.sort_values(["Shot blocks"], ascending=False).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = blockers, y = "Shot blocks", palette = "Blues")
plt.title("Shot Blockers")
plt.show()# 出场场次
blockers = train_df.sort_values(["Match played"], ascending=False).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = blockers, y = "Match played", palette = "Oranges")
plt.title("Matches Played")
plt.show()# 助攻
Assisters = train_df.sort_values(["Assists"], ascending=False).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = Assisters, y = "Assists", palette = "Greens")
plt.title("Matches Played")
plt.show()# 传球不好的
Worst_passers = train_df.sort_values(["Passing accuracy"], ascending=True).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = Worst_passers, y = "Passing accuracy", palette = "Greens")
plt.title("Not good Passers")
plt.show()# 被犯规数
Foulers = train_df.sort_values(["Fouls suffered"], ascending=False).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = Foulers, y = "Fouls suffered", palette = "Greens")
plt.title("Foul sufferers")
plt.show()# 犯规数
Foulers = train_df.sort_values(["Fouls committed"], ascending=False).iloc[:10]
plt.figure(figsize=(20,5))
sns.barplot(x = "Player", data = Foulers, y = "Fouls committed", palette = "Greens")
plt.title("Foul makers")
plt.show()

【7】总结

最后去看了下,最后欧洲杯的最佳球员是谁,有点意料之外的,尽然是意大利的守门员。。如果是这样。守门员的数据需要单独拿出来比较。这样也说明了,意大利对真的是看守门员的。。哈哈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/34594.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

世界杯杂谈之有趣的数据纪录

目录 (一)前言 (二)正文 1. 关于出场 (1)出场次数 (2)出场时间最长球员 (3)连续出场决赛场次最多 (4)世界杯出场时间最短的人 …

【数据分析干货】世界杯4强出炉!冠军将花落谁家?看看历年数据!

北京时间12月11日凌晨结束的两场1/4决赛中,摩洛哥队1比0击败葡萄牙队,晋级世界杯四强,他们也成为历史上首支打进世界杯四强的非洲球队。法国队2比1战胜英格兰队,晋级四强。至此,2022卡塔尔世界杯四强全部产生&#xff…

基于2018年世界杯赛事法国队夺冠进球数据分析

基于2018年世界杯赛事法国队夺冠进球数据分析 本文章仅用于个人学习,如有错漏还请指出,谢谢~ 1.摘要 大部分的足球俱乐部都在使用Wyscout的比赛分析以及球探平台来帮助球队招募队员,并分析对手以及自己的球队。”Wyscout美国以及英国的总监…

阿根廷夺冠!梅西圆梦!历届世界杯还有哪些数据看点?

从1930年到2022年,世界杯已走过92年的光辉岁月,从马拉多纳的“上帝之手”、贝利的“四两拨千斤”、罗纳尔迪尼奥的“诡异吊射”、范佩西的“鱼跃冲顶”再到姆巴佩上演“帽子戏法”刷新记录,世界杯为球迷朋友们带来了无数个惊心动魄的精彩瞬间…

世界杯数据可视化分析

目录 1.数据来源 2.字段解释 世界杯成绩信息表:WorldCupsSummary 世界杯比赛比分汇总表:WorldCupMatches.csv 世界杯球员信息表:WorldCupPlayers.csv 3.数据分析及可视化 世界杯已经告一段落,作为一个学习大数据的学生&…

【地产大数据案例】中指讯博:城市地图与投资决策

【数据猿导读】 城市地图这样的互联网地图产品,在业务使用过程中具有很好的便利性,但在实际开发中却存在很大难题,会面临诸多共性问题。最终,这款极大地优化了项目的数据流通性,自动生成PPT报告的功能,也大…

八项指标对比ChatGPT和文心一言

文章目录 前言特定指标对比:实际运用对比:一、算力二、训练时间三、算法复杂度四、模型结构五、应用场景六、性能指标七、可解释性八、迁移能力 ✍创作者:全栈弄潮儿 🏡 个人主页: 全栈弄潮儿的个人主页 🏙…

文华财经指标公式 拿大趋势吃大利润公式指标软件,多空买卖点趋势加密WH6破解wh7随身行

MA(C,55),COLOR0080FF; TYP:(HIGHLOWCLOSE)/3; cci:(TYP-MA(TYP,13))/(0.015*AVEDEV(TYP,13)); DRAWTEXT(crOSS(CCI,-200) AND CCI>REF(CCI,1),L,平空),COLORGREEN; DRAWTEXT(CROSS(200,CCI) AND CCI<REF(CCI,1),H,平多),COLORYELLOW; DRAWTEXT(CROSS(CCI,100) AND CCI&g…

文华财经彩波均线主图指标公式(指标公式源码)破解加密

我们做短线的&#xff0c;就是发现机会&#xff0c;参与机会。 不会去考虑这个行情启动时什么原因&#xff0c;不要站在发起者的角度去考虑&#xff0c;我们做追随者。 炒股就是炒心态&#xff0c;不急躁&#xff0c;不恐惧&#xff0c;无侥幸&#xff0c;这是我总结十年的经验…

文华财经指标公式博易大师软件指标公式

HH:HHV(HIGH,10);//VAR1:COST(89)-COST(11); LL:LLV(LOW,10);//VAR2:COST(99.900002)-COST(0.1); HH1:BARSLAST((HH>REF(HH,1)));//单峰:(1-VAR1/VAR2)*100; LL1:BARSLAST((LL < REF(LL,1)));//高密:(COST(40)-COST(1))/VAR2*100; DRAWTEXT(CROSS(HH1,LL1),90,众);//赢利…

资管软件源码|信管家软件源码|通达信陪资|博易大师软件

资管软件源码|大宗商品交易|信管家软件源码&#xff0c;另外有股piao配资系统&#xff0c;等。 1.系统含前端APP&#xff08;安卓和IOS&#xff09;、代理商后台、总后台 2.行情智能切换、目前已对接实盘和第三方的数据源&#xff01;申请账号添加至后台可以直接使用&#xf…

楼盘数据可视化与预测分析

项目功能&#xff1a; 1 首页 新盘 2 广州楼盘 热门楼盘 全部楼盘 价格预测 3 数据图表 各区楼盘数量 楼盘户型占比 所有楼盘面积 各区楼盘均价 楼盘价格预测 4 更多 设置 关于我们 功能简述&#xff1a; 首页的新盘功能展示广州新的楼盘图片和信息&#xff1b; 广州楼盘…

文华财经指标公式博易大师软件指标公式指南针多空资金指标,最精准买卖点提示指标wh6赢顺云随身行指标

量创新高:V>HHV(V,0); 对昨日涨幅:(C/DYNAINFO(3)-1)*100<2.50;{涨幅控制2个点以内} 每日一点:量两步 AND 价两步 AND 价上岗量破5 AND 量起爆 AND 价创新高 AND 量创新高 AND 对昨日涨幅; TA:BArslAST(TIME100000); TC:REF(HHV(C,0),TA1); TV:REF(HHV(V,0),TA1); ZF:C/D…

博易大师期货程序化交易软件,期货买卖点提示量化分析系统幅图指标公式,期货波段进场点信号

期货指标公式不是交易的圣杯&#xff0c;也不是期货亏损后的救命稻草。请理性运用指标公式&#xff0c;独立决策&#xff0c;盈亏自负。期货市场具有不确定性和不可预测性的&#xff0c;请正常对待和使用指标公式! 期货指标公式是通过数学逻辑角度计算而来&#xff0c;仅是期货…

同花顺趋势抄底逃顶线指标公式源码 逢低关注逢高派发

使用说明&#xff1a; 曲线可以作假&#xff0c;但趋势不可逆&#xff0c;相信趋势的力量&#xff0c;不只是金钱的回报&#xff01; 效果图&#xff1a; 直接复制以下源代码&#xff0c;在公式管理器中新建指标公式&#xff0c;复制进去就可以用了&#xff08;仅供参考&#…

文华财经指标公式博易大师软件指标公式期货多空买卖指标图,文华加密破解二次加密

天:ma(CLOSE,25)MA(CLOSE,25)*20/100,COLORRED,LINETHICK2; 强势线:MA(CLOSE,25)MA(CLOSE,25)*6/100,COLORYELLOW,LINETHICK2; 天2:MA(CLOSE,18)MA(CLOSE,18)*20/100,COLORFFFFFF,LINETHICK1; stICKLINE(C>强势线,H,L,0,1),COLORFFFFFF; STICKLINE(C>强势线,C,O,2,1),COL…

大数据下的竞彩足球胜平负分析技巧2

上期内容&#xff1a; 大数据下的竞彩足球胜平负分析技巧1_sundayhost的博客-CSDN博客 上期内容分析、证明了竞彩官方终赔时&#xff0c;当主队让1球同时又满足&#xff1a;让负赔率>平负均值赔率的情况出现了6胜3平1负&#xff0c;说明了竞彩官方给出的让负过大条件下并不…

如何使用Kaggle免费算力微调ChatGLM

最近在参加&#xff1a;2023AIWIN——中文网页自动导航挑战赛DataWhale的大佬们提供了baseline的讲解&#xff1a;如何手把手打一场世界人工智能大赛下面就来记录一下使用Kaggle上提供的30小时15G免费GPU算力的运行情况。 数据集预处理 数据下载及配置 首先从比赛官网上下载…

GPT-4最强竞品迎来重磅升级:一次10万token,百页资料一分钟总结完毕

夕小瑶科技说 分享 来源 | 量子位 作者 | 丰色 萧箫 号称ChatGPT“最强竞争对手”的Claude&#xff0c;今天迎来史诗级更新—— 模型记忆力原地起飞&#xff0c;现在1分钟看完一本数万字的小说&#xff0c;已经不在话下。 消息一出&#xff0c;评论区直接炸了&#xff0c;网…

总结下软件架构的10个质量属性

一般地&#xff0c;对于软件系统的需求而言&#xff0c;分为两类&#xff1a;功能性需求和非功能性需求。软件系统的架构设计既要满足软件的功能性需求&#xff0c;还要满足软件的非功能性需求。特别地&#xff0c; 系统架构对软件非功能性需求的支撑成为架构的质量属性。本文描…