利物浦7比0狂胜曼联,这个锅不能再让C罗背了吧。预测足球比分有什么好方法吗?
微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩
探索足球结果和赔率的 Python 项目。
随着数据建模成为处理随机性的强大资源,数据解决方案已经出现在整个社会的多项任务中。在本系列文章中,我们的目标是构建一个解决方案,用于根据通过网络收集的数据预测足球比赛结果。
主要目标
首先,我们需要设定我们项目的主要目标,这将是我们工作的核心。因此,正如我所写的那样,国际足联世界杯临近,人们通常会聚集在一起为比赛和锦标赛的结果下注,希望赢得一些奖品或只是为了好玩。这种行为是一种全球现象,体育博彩是一个亿万富翁的行业,吸引了数百万寻求赔率的人。
在这种情况下出现了该项目的主要目标,即构建一种工具,可以帮助我们通过足球博彩市场的博彩策略获利。然后,根据我们的目标集,我们可以开始构建引导我们实现目标的步骤。
项目设置
好的,我们的最终目标已经确定,但现在它是一个模糊而遥远的目标。做一些逆向工程可能是清理我们道路的好主意。我想到的第一件事是构建一个应用程序,它允许我们根据某种预测来模拟投注策略。因此,正如您所想象的那样,我们预测结果的框架将是一个机器或深度学习模型,因为我们希望使用过去的信息来预测未来事件。话虽如此,我们需要收集网络中某处输入的数据,顺便说一下,这是第一篇文章的主题。
在进一步研究网络抓取之前,让我们总结一下刚才描述的步骤。
-
收集数据
-
特征工程与建模
-
构建投注策略模拟器 最后,这个项目在我写的时候还在开发中,它的主要目的是作为我的学习报告,所以你应该这样面对它,可以自由地对我的工作提出任何建议或评论。您可以在此处访问代码库。就是这样。让我们深入了解数据收集。
数据源
我在网上查看时发现了一些不同的数据源,并且每个数据源都是针对特定目的而选择的。我将介绍并解释它们及其特点。我们要构建的第一个数据集是我们用来为我们的模型提供足球比赛过去统计数据和事件的数据集。我们从中抓取的来源是fbref ,您可以在我们的repo中的文件 sample.pkl 中预览我们的抓取结果。看一下fbref主页结构:
FBRef 主页
继续,我们的目标是获得一个时间序列数据集,其中包含此页面、几个日期中可用的信息,以及比赛报告链接中包含的信息,其中包含有关比赛的更多具体统计信息。下图中还有一个匹配报告示例。
Fbref 匹配报告
然后,通过查看网站及其结构,很明显我们不需要处理 JavaScript 代码,这会使我们的抓取任务稍微复杂一些,所以我们从现在开始使用BeautifulSoup 。我们现在应该根据我们需要的信息来规划我们的抓取结构,因为抓取器线性工作以捕获我们想要的信息。该代码嵌入在类“scrapper”中,并且在其中实现了它的功能。
class scrapper:"""Class used to scrap football data:param path: The chrome driver path in your computer. Only used to get today matches information.:def getMatches(): Gets past matches information from the leagues chosen in a certain period.Uses beautifulSoup framework:def getMatchesToday(): Gets predicted lineups and odds about matches to be played today.Uses selenium framework"""def __init__(self, path='D:/chromedriver_win32/chromedriver.exe'):self.originLink = 'https://fbref.com'self.path=pathself.baseFolder = os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))self.dataFolder = os.path.join(self.baseFolder, 'data')self.scoresHome = []self.scoresAway = []self.homeTeams = []self.awayTeams = []self.scoresHome = []self.scoresAway = []self.dates = []self.homeXG = []self.awayXG = []
推荐书单
《Python从入门到精通(第2版)》
《Python从入门到精通(第2版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行程序开发应该掌握的各方面技术。全书共分23章,包括初识Python、Python语言基础、运算符与表达式、流程控制语句、列表和元组、字典和集合、字符串、Python中使用正则表达式、函数、面向对象程序设计、模块、异常处理及程序调试、文件及目录操作、操作数据库、GUI界面编程、Pygame游戏编程、网络爬虫开发、使用进程和线程、网络编程、Web编程、Flask框架、e起去旅行网站、AI图像识别工具等内容。所有知识都结合具体实例进行介绍,涉及的程序代码都给出了详细的注释,读者可轻松领会Python程序开发的精髓,快速提升开发技能。除此之外,该书还附配了243集高清教学微视频及PPT电子教案。
《Python从入门到精通(第2版)》【摘要 书评 试读】- 京东图书京东JD.COM图书频道为您提供《Python从入门到精通(第2版)》在线选购,本书作者:明日科技,出版社:清华大学出版社。买图书,到京东。网购图书,享受最低优惠折扣!https://item.jd.com/13284890.html
精彩回顾
ChatGPT教你如何用Python和Matplotlib绘图(上)
ChatGPT教你如何用Python和Matplotlib绘图(下)
《事半功倍,使用ChatGPT编写Python函数》
超快速,使用ChatGPT编写回归和分类算法
《如虎添翼,将ChatGPT和Python结合起来!》
《ChatGPT优化Python代码的小技巧》
《使用ChatGPT提升Python编程效率》
微信搜索关注《Python学研大本营》
访问【IT今日热榜】,发现每日技术热点