通过whoscored网站对转会球员的评分来比较五大联赛水平高低

我是一个八年级的学生,上学期学习了Python和包括标准差在内的数据统计方法。参考“怕砍不留名”在soccer.hupu.com上的帖子,并且在爸爸的指导下我尝试对欧洲五大足球联赛(英超、德甲、西甲、意甲、法甲)水平高低做一个比较。

五大联赛之间水平孰高孰低,一直众说纷纭,没有定论。有人通过欧战积分 (https://www.uefa.com/memberassociations/uefarankings/country/ )对其进行评估,但这种方式也有其局限,每个联赛中实际参加欧冠和欧联比赛的队伍都是在该联赛中排名靠前的球队,并不能覆盖大部分无法参加欧战队伍中下游球队。而一种比较方法如果不能覆盖联赛中的大部分球队,那么这种比较方法也就难说公平。

whoscored.com(https://www.whoscored.com/)是一个会对包括五大联赛在内的主要足球比赛球员表现进行评分,排名,提供数据分析数据的网站,虽然whoscored的评分也存在一定的争议,但是它基于同一算法进行数据统计足够客观。在比较当中我以西甲为基准,统计西甲和英超,德甲,意甲,法甲之间的相互转会球员数据,我假设转会球员前后在不同联赛的两个赛季水平没有变化,那么我计算出球员评分和赛季平均分标准差之间的关系,然后根据前后两个不同联赛的不同结果来判断英超,德甲,意甲,法甲相对于西甲的水平高低。

捕获4

以在2010~2011赛季从西甲转到英超的David Silva为例。在whoscored.com上有David Silva09/10赛季在西甲和10/11赛季在英超的评分,我先计算出09/10赛季西甲主要球员(总出场次数大于该联赛平均出场次数的球员,以下皆同)的平均分和标准差分别为6.88(满分为10,以下皆同)和0.33,再计算出10/11赛季英超主要球员的平均分和标准差为6.88和0.30。将David Silva 09/10赛季在西甲的评分7.34减去09/10赛季西甲主要球员的平均分6.88再除以标准差0.33得出David Silva在09/10赛季比平均分高出了1.40个标准差。接着再用同样的方法,将David Silva 10/11赛季在英超的评分7.15减去10/11赛季英超主要球员的平均分6.88再除以标准差0.30得出David Silva在10/11赛季比英超平均分高出了0.90个标准差。两者个标准差相减(西甲标准差减英超标准差),若得出结果为正数则说明英超的水平比西甲高,如果为负则说明西甲的水平高。以David Silva为例,这一结果为0.5则说明他在英超相对其他球员水平没有在西甲那么突出,所以假设球员水平没有变化,那么我们可以推出英超球员平均水平高出西甲。在转会球员样本足够大的情况下取平均数则足够准确。


具体实施过程:

首先,我需要将whoscored.com上09/10~16/17赛季五大联赛主要球员(总出场次数大于该联赛平均出场次数的球员)的评分都抓取下来。由于whoscored.com采用了incapsula机制,所以我无法用python中类似urllib的库进行网页抓取。我转而采用AutoHotkey模拟键盘操作,将每一网页内容保存到txt文件里 。代码如下:

#Persistent

global fileName := "whoscored.txt"
global pages := 29

*Space::
     file := FileOpen(fileName, "w")
     loop, 30
     {
         Send ^a
         Sleep, 500   
         Send ^c
         Sleep, 500
         file.Write(clipboard)
         Send {Click}
         Sleep, 5000
     }
     file.Close
Return

然后,用python读取这些txt文件并用正则表达式抓取其中的球员评分,将其写入若干份csv文件。

接着,用python读取csv文件中的球员评分,进而算出各联赛在各赛季的平均分和标准差。

最后,以上文说明过的原理,通过excel表格对09/10~16/17赛季五大联赛中转会的球员进行数据分析。我以La Liga(西甲)为基准,通过对从La Liga 转到别的联赛(或从别的联赛转到La Liga )的球员进行数据分析。

python代码,csv文件和分析的excel文件见附件


结论:


捕获1捕2

从两图可以看出来,西甲(La Liga)历年来是当之无愧的第一名,其次分别是德甲(Bund)、英超(EPL)、法甲(Ligue 1)、意甲(Serie A)

左图:2至8行分别表示了当赛季西甲与另外四大联赛之间的水平差距(数字为正,则水平高于西甲,数字为负则相反)。那么从最下面一行可以看出,这四大联赛的平均水平分别比西甲低0.12、0.13、0.20、0.34个标准差。右图的意思是,以西甲(La Liga)为基准,分数在基准线以下的联赛,该联赛在那一赛季的水平没有西甲的水平高。分数在基准线以上的联赛则相反。


我的统计结果与欧战积分 (https://www.uefa.com/memberassociations/uefarankings/country/ )上的结果有出入

捕获3

欧战积分。西甲仍是第一,但意甲和法甲与我的统计有较大出入。

出入产生的原因可能在于,12/13赛季法甲与西甲之间相互转会人数只有两人,16/17赛季德甲与西甲之间相互转会人数也只有两人。因此,从折线统计图上观察到的12/13、16/17赛季的极值,不能证明德甲和法甲的真实水平。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26781.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

看卡塔尔世界杯,diff一下足球比赛与软件开发

diff一下足球比赛与软件开发 吐槽世界杯E组!类比软件开发与足球比赛教练与架构师的作用 新技术——半自动越位技术世界杯冠军 吐槽世界杯E组! 最近博主看了多场世界杯比赛,看的我心力交瘁,欲哭无泪。 从日本与哥斯达黎加那场比赛开…

一个值得关注的技术公众号「腾讯云开发者」

今天向大家推荐的是腾讯云技术社区的公众号,是腾讯官方推出的技术知识分享阵地,每周公开腾讯最新的技术工程方案(如微信、健康码、王者荣耀等知名业务的技术架构)、ChatGPT 等行业前沿热点解读、研发经验和工作方法等干货&#xf…

踩坑小总结

本来想总结一下自己工作到现在踩过的坑,实在是太多了,自己之前也年轻不懂事,没有记录的习惯,想到多少写多少吧。 1.前、后端分离框架:刚进入工作的时候采用的是easyuissh的框架,前后端一体,后来…

如何调教一个定制化的ChatGPT私人助理,接入自家知识库

大家好,欢迎来到 Crossin的编程教室 ! 我在之前的文章里介绍过,如何利用 OpenAI 开放的 API,将 ChatGPT 接入自己开发的程序: 把 ChatGPT 加到你自己的程序里 当时开放的模型还是 text-davinci-003。 文章发布后没多久…

ROS (roslaunch turtle_tf turtle_tf_demo.launch)报错-已解决(利用CHAT-GPT修bug)

在使用古月居的ROS入门21讲时,使用turtle_tf包学习tf功能时出现报错,网上的报错都是由于python版本的问题,修改后而无法解决。最后利用CHAT-GPT的修bug提示,最后发现是ros缓存导致报错。在文章的最后还会提供修改python版本的链接…

chatgpt赋能python:Python代码扫描:如何编写高质量的代码

Python 代码扫描:如何编写高质量的代码 如果你是一位有着10年的 Python 编程经验的工程师,你一定知道写出高质量的 Python 代码是多么的重要。但是,即使你是一名经验丰富的 Python 开发者,你的代码仍然可能存在一些隐藏的漏洞和低…

福成股份很忙:实控人李福成被罚8万,新董事长李良则要打官司

最近,福成股份(SH:600965)比较忙。 7月6日,河北福成五丰食品股份有限公司(下称“福成股份”)发布公告称,其近日收到证监会河北监管局(下称“河北证监局”)的《行政处罚决…

数据结构实验代码 1.单链表;2树的递归遍历

1.单链表 1.1算法描述 1.2代码 #include <stdio.h> #include<malloc.h> typedef char elemtype; typedef struct lnode { elemtype data; struct lnode *next; }linklist; void initlist (linklist *&L)//创建一个表 { L(linklist *)malloc(sizeof(linkli…

数据结构实验课考试 1.单链表;2树的递归遍历

1.单链表 1.1算法描述 1.2代码 1.3代码运行结果 2.树的递归遍历 2.1算法描述 2.2代码 2.3代码运行结果

vue+uview实现仿微信通讯录(提醒谁看功能)

实现功能如下图&#xff1a;(索引列表加头像和选择框&#xff0c;选择好的好友在顶部展示出来) 首先引入uview里面的索引列表组件&#xff1a;(用于展示好友列表) <view class"" style"width: 700rpx;margin: 0 auto;"> <u-index-lis…

day03_顺丰快递分拣小程序

目录 一、又见str1.1 字符串定义1.2 字符串常用操作1.2.1 str.center(width[, fillchar])1.2.2 str.count(sub, start 0,endlen(string))1.2.3 str.encode(encodingUTF-8,errorsstrict)1.2.4 str.endswith(suffix[, start[, end]])1.2.5 str.find(str, beg0, endlen(string))1.…

PYTHON 顺丰快递分拣小程序-极简9行代码实现分拣

给定一组打乱的快递信息数据&#xff0c;将快递按省份进行分类&#xff0c;最终实现如下格式效果&#xff1a; 数据源如下&#xff1a; [[王*龙, 北京市海淀区苏州街大恒科技大厦南座4层],[庞*飞, 北京市昌平区汇德商厦四楼403],[顾*锐, 江苏省扬州市三垛镇工业集中区扬州市立…

python快递分拣小程

需求 &#xff1a; 分拣出同一省份的信息 格式 省份 : 名字 地址 ...... 完整 代码 noe_list [[王*龙, 北京市海淀区苏州街大恒科技大厦南座4层],[庞*飞, 北京市昌平区汇德商厦四楼403],[顾*锐, 江苏省扬州市三垛镇工业集中区扬州市立华畜禽有限公司],[王*飞, 上海市徐汇区上…

重磅!2020国家科学技术奖全名单公布!

来源&#xff1a;软科 2021年11月3日&#xff0c;2020年度国家科学技术奖励大会在人民大会堂正式召开。 备受关注的国家最高科学技术奖&#xff0c;授予了中国航空工业集团有限公司顾诵芬院士和清华大学王大中院士。国家最高科学技术奖自2000年正式设立&#xff0c;是中国科技…

谷歌又闹大乌龙!Jeff Dean参与的新模型竟搞错Hinton生日

【导读】最近&#xff0c;谷歌研究员发布了关于指令微调的最新工作&#xff01;然而却宣传图中出现了可笑的乌龙。 几个小时之前&#xff0c;谷歌大脑的研究员们非常开心地晒出了自己最新的研究成果&#xff1a; 「我们新开源的语言模型Flan-T5&#xff0c;在对1,800多种语言…

汽车电子的AI时刻

来源&#xff1a;《中国电子商情》 感谢Imagination汽车产品业务发展和市场总监陈竹女士、芯擎科技业务拓展经理邵楠女士、中汽中心工程院网联与线控底盘室主任郭蓬女士和国创中心电子电子电气部部长李秋霞女士对本文的贡献与支持&#xff0c;本文观点均来自上述四位行业人士对…

DriveGPT、车企订单背后,为什么毫末每年都能搞出新东西?

作者 | 祥威 编辑 | 德新 4月11日&#xff0c;毫末智行正式发布自动驾驶生成式大模型 DriveGPT&#xff0c;中文名 雪湖海若&#xff0c;可以提升自动驾驶认知能力&#xff0c;最终提升规控效率。 雪湖海若的核心&#xff0c;是将各种驾驶场景作为Token输入到模型中&…

ChatGPT火到汽车圈,毫末智行、集度纷纷进场

作者 | 白日梦想家 编辑 | 于婷 ChatGPT的火爆&#xff0c;已经席卷到了汽车领域。 众多相关企业宣布纷纷布局&#xff0c;车企也争相宣布将搭载类似产品。 2月初&#xff0c;百度宣布将在今年3月完成类似ChatGPT的项目“文心一言”的内部测试。据悉&#xff0c;该产品是基于…

MOSS 真的要来了吗?——ChatGPT

最近在网络上在疯传各种 ChatGPT 的新闻消息和视频&#xff0c;大家把 ChatGPT 传得神乎其神的&#xff0c;今天我们就来聊一聊最近爆火的 ChatGPT 究竟是什么来头。 ChatGPT 是什么 ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型&#xff0c;它能够通过…

四面八方WP

四面八方 四方门主东方青木看着四面八方涌过来的极客&#xff0c;非常震惊&#xff0c;转头便进入了祖祠中的地下室&#xff0c;发现这丫传自唐朝的密室还设计了英文密码。旁边的石头上&#xff08;附件中有拓本&#xff09;刻着密码和密文&#xff0c;大家快帮助门主解出密码…