足球预测_预测足球热

足球预测

By Aditya Pethe

通过阿蒂亚·皮特(Aditya Pethe)

From September to January every year, football takes over America. Games dominate TV Sunday and Monday nights, and my brother tears his hair out each week over his consistently underperforming fantasy teams. The hype seems to reach an unbearable level by the time the playoffs roll around.

每年的9月至1月,足球席卷美国。 游戏在星期日和星期一晚上占据着电视台的主导地位,而我的兄弟每周都在表现不佳的幻想队中大放异彩。 季后赛到来之时,炒作似乎已经到了难以忍受的地步。

But is there a way to measure and forecast that hype? I decided to use one of my favorite NFL players, Peyton Manning, in order to explore seasonality in Deephaven’s Jupyter Notebooks. Using a dataset of Manning’s Wikipedia search frequencies taken over an 8 year period from 2008 to 2016, my goal was to break down how football hype evolved throughout the season.

但是,有没有一种方法可以衡量和预测这种炒作? 我决定使用我最喜欢的NFL球员之一Peyton Manning来探索Deephaven的Jupyter笔记本的季节性。 使用从2008年到2016年的8年期间内Manning的Wikipedia搜索频率的数据集 ,我的目标是弄清整个赛季足球宣传的演变。

To do this, I decided to take two approaches to analyzing seasonality. The first was the traditional ARIMA model, and the second was the newer Fbprophet library. I would use both these methods to fit, predict, and validate models to see which was better at understanding NFL hype.

为此,我决定采用两种方法来分析季节性。 第一个是传统的ARIMA模型,第二个是较新的Fbprophet库。 我将使用这两种方法来拟合,预测和验证模型,以查看哪种方法更适合理解NFL宣传。

我们的数据 (OUR DATA)

We can plot our data in Deephaven with the following code:

我们可以使用以下代码在Deephaven中绘制数据:

At a top-level glance, our data is log-transformed Wikipedia page views for Peyton Manning taken each day for about 8 years. The data appears to exhibit some strong seasonal trends that we can look into.

从最高层次看,我们的数据是对Peyton Manning进行日志转换的Wikipedia页面视图,大约每天进行8年。 数据似乎显示出一些我们可以研究的强烈季节性趋势。

Image for post

Additionally, before we begin breaking down our data, we want a consistent way to visualize our forecasts. We can produce a function that takes our training, testing, and any forecast data and plots it with Deephaven. This allows us to combine analysis from multiple libraries and methods with Deephaven’s powerful and interactive plotting.

此外,在开始分解数据之前,我们需要一种一致的方式来可视化我们的预测。 我们可以产生一个函数,将我们的训练,测试和所有预测数据都用Deephaven进行绘制。 这使我们能够将来自多个库和方法的分析与Deephaven强大而交互式的绘图相结合。

有马 (ARIMA)

The ARIMA model stands for autoregressive, integrated moving average model.

ARIMA模型代表自回归,集成移动平均模型。

The Autoregressive, or AR component of the model, is a linear combination of the previous N seasonal lags. For our Peyton Manning model, this means some linear combination of the previous N weeks, months, or years.

模型的自回归或AR分量是前N个季节滞后的线性组合。 对于我们的Peyton Manning模型,这意味着前N周,几个月或几年的线性组合。

Image for post

The moving average component of the model is a linear combination of the error terms for the previous N seasonal lags, like so:

模型的移动平均成分是前N个季节滞后的误差项的线性组合,如下所示:

Image for post

The ARIMA model will estimate the coefficients for both these linear combinations, given three parameters as input:

给定三个参数作为输入,ARIMA模型将估算这两个线性组合的系数:

  • p: The order of the autoregressive model (the number of lagged terms), described in the AR equation above.

    p:自回归模型的顺序(滞后项的数量),在上面的AR方程中描述。

  • q: The order of the moving average model (the number of lagged terms), described in the MA equation above.

    q:移动平均模型的阶数(滞后项的数量),如上面的MA方程所述。

  • d: The number of differences required to make the time series stationary. A stationary time series is essentially a time series without a time-dependent trend, excluding the seasonality.

    d:使时间序列固定所需的差数。 固定时间序列本质上是没有季节性相关趋势的时间序列,不包括季节性。

In the example below, the blue time series would be considered stationary, while the red would be nonstationary, even though both may exhibit seasonal patterns.

在下面的示例中,蓝色时间序列将被认为是平稳的,而红色时间序列将被视为非平稳的,即使这两个时间序列都可能呈现季节性变化。

Now that we know what parameters we need to find, we can analyze our Peyton Manning data. At first glance, our data seems stationary. There doesn’t appear to be a time-dependent trend outside seasonal fluctuations, but we can test for this using the Augmented Dickey-Fuller Test.

既然我们知道需要找到什么参数,就可以分析Peyton Manning数据。 乍一看,我们的数据似乎稳定。 除季节性波动外,似乎没有随时间变化的趋势,但是我们可以使用增强Dickey-Fuller检验进行检验。

Image for post

Our test returns a p-value well below the significance level, so we can confirm that our model is indeed stationary. Our parameter value for d is zero.

我们的测试返回的p值远低于显着性水平,因此我们可以确认我们的模型确实是平稳的。 d的参数值为零。

Now we need to find the parameter values of P and Q. In order to do this, I used autocorrelation plots. Autocorrelation and partial autocorrelation plots can tell how strongly lagged terms correlated with a given observation. While partial autocorrelation plots tell the correlation with the lag term independent of other lags, autocorrelation plots factor in the “inertia” from other lags. Because of this, we can use partial autocorrelation to estimate our parameter for P, and autocorrelation to estimate our parameter for Q.

现在我们需要找到P和Q的参数值。为此,我使用了自相关图。 自相关图和局部自相关图可以说明滞后项与给定观察值的相关程度。 尽管部分自相关图告诉了与滞后项的相关性,而与其他滞后无关,但自相关图将其他滞后的“惯性”作为因素。 因此,我们可以使用偏自相关来估计P的参数,并使用自相关来估计Q的参数。

Image for post
Image for post

Both plots show a periodic behavior in the lags, each around 7 days in length. This makes sense — Peyton Manning search frequency probably increases on game nights, when football is being played. In fact, these autocorrelation plots even show a slight 6-day correlation, which is likely due to Sunday night football. But since the lags of 7 days have the highest correlation with the observed value, we can estimate both P and Q to be 7.

这两个图都显示了滞后的周期性行为,每个周期的长度约为7天。 这是有道理的-在踢足球的比赛之夜,佩顿·曼宁的搜索频率可能会增加。 实际上,这些自相关图甚至显示了轻微的6天相关性,这很可能是由于周日晚上的足球比赛所致。 但是由于7天的滞后与观测值具有最高的相关性,因此我们可以估计P和Q均为7。

I should note that these autocorrelation plots presented a problem. The ARIMA parameters did not allow for lag inputs of over ~10, which meant that looking at annual (365) or monthly (30) seasonality would be very difficult.

我应该注意,这些自相关图存在问题。 ARIMA参数不允许滞后输入超过〜10,这意味着查看年度(365)或每月(30)的季节性非常困难。

Now that we have our parameters, we can produce our ARIMA model.

现在我们有了参数,我们可以生成ARIMA模型。

Before we make our forecasts, we can check our model assumptions for variance and normality with a residual plot and density plot.

在进行预测之前,我们可以使用残差图和密度图检查模型假设的方差和正态性。

Image for post

Since the residuals appear to be randomly distributed, and the kernel probability density plot appears normal, our model assumptions check out.

由于残差似乎是随机分布的,并且核概率密度图似乎是正态的,因此我们的模型假设得到了检验。

Plotting our model yields the following:

绘制模型将得出以下结果:

Image for post

As we can see, not having access to the other scales of seasonality hurts this model’s viability. Not being able to capture multiple seasonal trends means that ARIMA is limited by one seasonality at a time. Regardless, we can return some error estimators to validate our model.

如我们所见,无法使用其他季节性尺度会损害该模型的生存能力。 无法捕获多个季节趋势意味着ARIMA一次只能受到一个季节的限制。 无论如何,我们可以返回一些误差估计量来验证我们的模型。

  • MSE (mean squared error): 0.8916776825661407

    MSE (均方误差):0.8916776825661407

  • MAPE (mean absolute percentage error): 0.10230290573107942

    MAPE (平均绝对百分比误差):0.10230290573107942

萨里玛 (SARIMA)

We can actually validate our ARIMA model using the auto-SARIMA model from pmdarima. The auto-SARIMA model estimates the parameter values for p, q, and d for us so there is no need for the prelude above. In addition, SARIMA takes m, the period of seasonality, as a parameter. Unfortunately, the model parameter limitations again constrain us to m < 10, so we may only look at weekly seasonality.

实际上,我们可以使用pmdarima的auto-SARIMA模型验证ARIMA模型。 auto-SARIMA模型为我们估计pqd的参数值,因此不需要上面的前奏。 另外,SARIMA将季节周期m用作参数。 不幸的是,模型参数限制再次将我们限制为m <10 ,因此我们可能只查看每周的季节性。

Fitting and plotting our model gives us the following:

拟合和绘制模型可以得到以下结果:

Image for post

Lastly, we can validate our model with error metrics:

最后,我们可以使用错误指标来验证我们的模型:

  • MSE (mean squared error): 0.8916776825661407

    MSE (均方误差):0.8916776825661407

  • MAPE (mean absolute percentage error): 0.10789283997956421

    MAPE (平均绝对百分比误差):0.10789283997956421

We see that our SARIMA model performed nearly identically to our ARIMA model, and in fact our ARIMA model gave a slightly lower mean absolute percentage error than SARIMA. We can be happy that we picked optimal parameters to fit our ARIMA model with.

我们看到,SARIMA模型的性能几乎与ARIMA模型相同,并且实际上,ARIMA模型的平均绝对百分比误差略低于SARIMA。 我们很高兴选择了适合ARIMA模型的最佳参数。

预言家 (PROPHET)

For our final model, we will be using Fbprophet.

对于我们的最终模型,我们将使用Fbprophet。

Fbprophet is a library from Facebook intended to handle seasonal time-series datasets. Prophet implements a procedure for forecasting time series data based on an additive model where non-linear trends are fit with yearly, weekly, and daily seasonality, plus holiday effects. In general, using Prophet requires much less hands-on work than our ARIMA model, and for the most part, we can feed our data directly into prophet like so:

Fbprophet是Facebook的一个库,用于处理季节性时间序列数据集。 先知实现了一种基于加性模型的时间序列数据预测程序,其中非线性趋势与年,周和日的季节性以及假期效应相吻合。 通常,与我们的ARIMA模型相比,使用Prophet所需的动手工作少得多,并且在大多数情况下,我们可以像这样将数据直接输入到先知中:

This allows us to forecast one year ahead, and compare actual data with expected values and their boundaries.

这使我们可以预测一年,并将实际数据与期望值及其界限进行比较。

Image for post

In addition, Prophet allows us to break down this data into seasonal components:

此外,先知使我们可以将这些数据分解为季节性成分:

Image for post

Manning’s page views peaked in 2012–2013, his MVP year. Unsurprisingly, Monday night football is when most fans look Manning up, and the monthly seasonal breakdown shows the crazy highs of December and March in stark contrast to the great drought of the summer.

曼宁的网页浏览量在他的MVP年度(2012-2013)达到顶峰。 毫不奇怪,周一晚上的足球比赛是大多数球迷抬头看曼宁的时候,每月的季节性故障显示出12月和3月的疯狂高点,与夏季的干旱形成鲜明对比。

Prophet can do even more, and add changepoints to the data, where the trend is most likely to shift.

先知可以做更多的事情,并且可以向数据添加变化点,而趋势最有可能在此变化。

Image for post

With this feature, Prophet roughly estimates the start and end of the season, especially capturing the window of the playoffs.

通过此功能,先知大致估计了赛季的开始和结束,尤其是捕获了季后赛的窗口。

By the eye test alone, our prophet models look much better and coherent than ARIMA. But we can again validate the model predictions using MSE and MAPE.

仅凭眼睛测试,我们的先知模型看上去比ARIMA更好,更连贯。 但是我们可以再次使用MSE和MAPE验证模型预测。

  • MSE (mean squared error): 0.35800021765342394

    MSE (均方误差):0.35800021765342394

  • MAPE (mean absolute percentage error): 0.059460265364126956

    MAPE (平均绝对百分比误差):0.059460265364126956

结论 (CONCLUSION)

Both error estimators clearly point to Prophet as the more accurate model. For large time-series data with multiple seasonalities, ARIMA has many shortcomings. Simply using regression on previous lags to estimate future values won’t cut it in predicting more complex time-series datasets. ARIMA may be useful for more limited datasets with simpler seasonal effects, but particularly for things like sensor data, page views, or energy consumption, complex nonlinear models like Prophet are required to make predictions.

两种误差估计器都明确指出先知是更准确的模型。 对于具有多个季节性的大型时间序列数据,ARIMA有许多缺点。 只需对先前的滞后使用回归来估计未来值,就无法预测更复杂的时间序列数据集。 ARIMA可能对于季节效应较为简单的有限数据集很有用,但是对于传感器数据,页面浏览量或能源消耗之类的东西尤其如此,需要使用诸如Prophet之类的复杂非线性模型进行预测。

Deephaven’s integration with Jupyter Notebooks allows for users to have unique, library-specific plotting methods and operations side by side with Deephaven features. Deephaven’s plotting in particular provides user-friendly visualization options in interactive plots when used in conjunction with new, cutting edge libraries like fbprophet.

Deephaven与Jupyter Notebooks的集成使用户可以与Deephaven功能并排使用独特的,特定于库的绘图方法和操作。 当与新的尖端库(例如fbprophet)结合使用时,Deephaven的绘图在交互式绘图中尤其提供了用户友好的可视化选项。

翻译自: https://medium.com/dev-genius/forecasting-football-fever-fe46fa779b69

足球预测

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30175.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谷歌暂缓在欧盟推出Bard;笔神作文指控学而思AI大模型盗取其数据;亚马逊正在考虑使用AMD新AI芯片丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 AMD发布最强AI芯片&#xff0c;挑战英伟达霸主地位 6月13日&#xff0c;芯片制造商AMD发布了其目前为止最先进的人工智能图形处理器(GPU) MI300X&#xff0c;将在今年晚些时候开始向部分客户发货。MI300X的发布…

【AI】AI 工具合集

![在这里插入图片描述](https://img-blog.csdnimg.cn/904914fd26b440ec8adb5f8e6246dd90.png &#x1f4dd;AI文本 ChatGPT&#xff1a; https://chat.openai.com/ NotionAI&#xff1a; https://www.notion.so/product/ai A.I. Data Sidekick&#xff1a;AI工具编写 SQL、文档…

HTC VIVE丨11. 使用VRTK实现与物体的交互

要点 1、可实现的效果&#xff1a;攀爬、双手持握、缩放物体等 2、VRTK中与物体交互的三种类型&#xff1a;Touch、Grab、Use Touch&#xff1a;手柄悬停在物体上面&#xff0c;跟物体进行碰撞或接触 Grab&#xff1a;按动某一定义的按键&#xff0c;抓取物体 Use&#xff1a;通…

用 Unity 和 HTC Vive 实现高级 VR 机制(1)

原文&#xff1a;Advanced VR Mechanics With Unity and the HTC Vive Part 1 作者&#xff1a;Eric Van de Kerckhove 译者&#xff1a;kmyhy VR 从来没有这样时髦过&#xff0c;但是游戏不是那么好做的。为了提供真实的沉浸式体验&#xff0c;游戏内部机制和物理必须让人觉…

2020中国VR大会(虚拟现实中的真实行走漫游+WebVR+SLAM for AR+VR仿真+VR智能)

2020中国VR大会 一、虚拟现实中的真实行走漫游1、Problem&#xff08;1&#xff09; Immersive virtual reality 沉浸式虚拟现实&#xff08;2&#xff09;Potential solutions&#xff08;3&#xff09;Challenges 2、Existing methods walking&#xff08;1&#xff09;Redir…

HTC VIVE丨12. VRTK抓取机制——(VR交互机制2-Grab)

设置物体被抓取的位置及朝向 Grab Attach Mechanic Script&#xff1a;抓取机制的设置 Precision Grap&#xff1a;是否采用精确抓取。如果不勾选&#xff0c;抓取物体和手柄保持一致。选取后&#xff0c;抓取时会在碰撞点抓取&#xff0c;和下条配合使用 Right / Left Snao Ha…

移动端vr技术探索之VrPanoramaView

VR技术的热度每年都在增长&#xff0c;在购物、旅游等方面运用度很高。该项目引用了Google的vr:sdk-panowidget依赖库&#xff0c;通过VrPanoramaView&#xff0c;简单实现在手机上查看全景照片&#xff0c;下面是项目介绍。 google官网开发指南 支持模式&#xff1a;支持vr和…

VRTK杂谈(网络篇)(Yanlz+VIVE+Oculus+)

《VRTK杂谈》 版本 作者 参与者 完成日期 备注 VRTK_Overview_V01_1.0 严立钻 2018.09.09 ##《VRTK杂谈》发布说明&#xff1a; “VRTK杂谈”是对VRTK的一个探索&#xff0c;这是一个最初级探索&#xff1b; “VRTK杂谈”&#xff1a;定义在一…

VR技术分享交流

VR技术分享交流 虚拟现实(virtual reality,简称VR)是利用电脑模拟产生一个三维空间的虚拟世界&#xff0c;提供用户关于视觉等感官的模拟&#xff0c;让用户感觉仿佛身历其境&#xff0c;可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时&#xff0c;电脑可以立…

苹果Meta都在冲的Pancake技术,中国VR团队YVR竟抢先交出产品答卷

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 你听说过Pancake吗&#xff1f; 不是最新的蛋糕品类&#xff0c;而是时下VR行业最受关注和期待的光学技术&#xff0c;甚至被称为“划时代的方案”。 据了解&#xff0c;Pancake光学方案的应用&#xff0c;能够给VR带来画面清晰度和产品…

VR多人协同(Photon Server Pun2 VRIF)

VR多人协同&#xff08;多人游戏本地服务器&#xff09;&#xff08;Photon Server & Pun2 & VRIF) 内容介绍&#xff1a; 采用Photon Server作为本地服务器&#xff0c;然后使用Pun2连接本地服务进行VR多人交互 Photon Server部署 1、下载并解压&#xff1a; photon…

从《头号玩家》说起,聊聊当前的 VR 技术到底差在哪?

《头号玩家》口碑炸裂&#xff0c;给似乎已进入低谷期的 VR 产业带来了新一轮的热度。VR 技术因其充分的沉浸性、高真实性和高交互性等特点&#xff0c;在 2016 年曾受到广泛关注&#xff0c;并被寄予厚望。但由于一些老生常谈的问题&#xff0c;如成本过高、内容质量低、技术瓶…

unity 通过使用 photon networking Pun 实现 HTC Vive VR的多人联网。进阶版 《三》

啊哈&#xff0c;开始还是些闲话来引出思绪哈。之前以为没有人看我写的就停更了。今天偶然想起进来一看&#xff0c;发现回复私信希望可以继续讲的&#xff0c;很开心。瞬间就有了动力&#xff0c;哈哈。从我自己身上就看到了反馈的重要性&#xff0c;为何微博&#xff0c;微信…

unity 通过使用 photon networking Pun 实现 HTC Vive VR的多人联网

正文&#xff1a; 基于photon networking 来实现 VR 的多人联网。我之前文章将的是如何使用unity 自带的网络组件来实现VR多人联网。但是unet 他的问题是只能实现局域网联网。广域网的话貌似也可以&#xff0c;但是应该还是需要一个服务器人员。而且unet 比较蛋疼的一点是&…

Unity CEO:玩家不在乎AR还是VR,他们只想要优质内容

近期&#xff0c;Unity CEO John Riccitiello在接受英国金融时报采访时&#xff0c;透露了自己对于游戏的前生今世&#xff0c;以及AR/VR和未来的看法。他认为&#xff0c;打造一个新平台需要大量优质内容&#xff0c;创意对于新平台很重要&#xff0c;不管AR和VR技术有什么区别…

【话题讨论】-浅谈VR与AR

一、引言 随着ICT基础技术的发展&#xff0c;我们现在社会中的基础ict设施已经逐步完善&#xff0c;从而我们的社会也开始出现科幻片中才会有的场景&#xff0c;比如&#xff1a;我们可以构件一个虚拟3D沙盘。 还有我们熟悉的各类智能眼镜&#xff0c;已经进入到千家万户&…

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

动手点关注 干货不迷路 近日&#xff0c;CVPR Workshop 下属的 NTIRE2023大赛公布比赛结果&#xff0c;在双目超分双三次插值保真赛道和 360 全景图像超分赛道上&#xff0c;火山引擎多媒体实验室凭借自主研发的算法获得了双料冠军&#xff0c;技术能力达到行业领先水平。 NTIR…

GPT-4进行数据分析的成本不到人类分析师的1%;北京将新增算力建设项目;迈富时赴港上市丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 网易云音乐前CEO朱一闻进入AI教育领域创业 近日&#xff0c;据报道&#xff0c;网易云音乐前CEO朱一闻已在AI教育领域创业。朱一闻已在杭州完成团队搭建&#xff0c;核心成员包括网易云音乐早期创始员工、海康威…

施一公:我直到博士毕业,对研究也没兴趣,很迷茫,不知道将来干什么

来源 | 学术志 作者 | 施一公 我从来没有机会来北大做学术讲座&#xff0c;或是跟同学们在一块聊聊天&#xff0c;因此我非常珍惜这个机会。借这个机会我想把我的经历分享一下&#xff0c;推心置腹&#xff0c;毫无保留地分享。我之所以愿意把我的一些经历讲出来&#xff0c;是…

CSDN接入AIGC辅助创作,对此你怎么看?

catalogue &#x1f31f; 写在前面&#x1f31f; GitChat&#x1f31f; 百万粉丝计划&#x1f31f; CSDN接入AIGC&#xff1f;&#x1f31f; 写在最后 &#x1f31f; 写在前面 哈喽&#xff0c;大家好&#xff0c;我是几何心凉&#xff0c;这是一份全新的专栏&#xff0c;得到…