2025年美赛C题:奥运奖牌榜模型 解析及Python代码实现

2025年美赛C题:奥运奖牌榜模型 解析及Python代码实现

在这里插入图片描述

1 题目

2025 MCM问题C:奥运奖 牌榜模型在最近的2024年巴黎夏季奥运会期间, 粉丝们除了观看个人项目外, 还关注每个 国家的整体 “ 奖牌榜 ”。 最终的结果(表1) 显示 , 美国获得的奖牌总数最多 (126枚) , 中国和美国并列金牌榜第一名(40枚)。东道主法国在金牌榜上排名 第五(16枚) , 但在总奖牌榜上排名第四, 而大不列颠以14枚金牌排名第七, 在 总奖牌榜上排名第三。

在这里插入图片描述

奖牌榜上的排名总是受到密切关注, 但其他国家的奖牌榜通常也同样受到重视。例 如, 阿尔巴尼亚(2枚奖牌)、佛得角、 多米尼加和圣卢西亚(2枚奖牌)在巴黎奥 运会上获得了各自国家的第一枚奥运奖牌。 多米尼加和圣卢西亚也各获一枚金牌。 还有60多个国家尚未赢得奥运会奖牌。通常会对最终奖牌数进行预测, 但通常不是基于历史奖牌数, 而是在即将到来的 奥运会开始时, 当已知当前计划参加比赛的运动员时(例如:https://www.nielsen. com/newscenter/2024/virtualmedaltableforecast/)。

附件提供了所有夏季奥运会的奖牌榜、主办国的数据, 以及所有夏季奥运会按运动项目分 列的每届奥运会的奥运会项目数量。此外, 还提供了所有奥运选手的个人数据, 包括 他们的项目和成绩(奖牌类型, 或没有奖牌)。您的模型和数据分析必须仅使用所提 供的数据集。你可以使用额外的资源来提供背景和上下文, 或者帮助解释结果(一定 要记录来源)。具体来说, 使用提供的数据来:

  • 为每个国家的奖牌数建立一个模型(至少是金牌和总奖牌数)。包括对模型预 测的不确定性/精度的估计, 以及模型执行情况的衡量标准。
    • 根据你的模型, 你对2028年美国洛杉矶夏季奥运会奖牌榜的预测是什么? 包括所有结果的预测区间。你认为哪些国家最有可能改善? 哪些国 家的情况会比2024年更糟?
    • 你的模型应该包括尚未获得奖牌的国家;你预计有多少国家会在下一届 奥运会上获得第一枚奖牌?你认为这个估计的赔率是多少?
    • 你的模型还应该考虑某届奥运会的项目(数量和类型)。探索项目和国家 获得奖牌数之间的关系。 哪些运动项目对各个国家来说最重要?为什
      么?主办国选择的项目如何影响比赛结果?
  • 运动员可能代表不同的国家参赛, 但由于国籍要求而改变对他们来说并不是一 件简单的事情。然而, 教练可以很容易地从一个国家转移到另一个国家, 因为 他们不需要成为公民来执教。 因此, 有可能产生“伟大的教练”效应。两个可 能的例子包括郎平, 他曾带领美国和中国的排球队获得冠军, 以及有时备受争 议的体操教练b美国女子体操队的教练b美国女子体操队的教练b美国女子体操队 取得了巨大的成功。检查数据, 寻找可能由于“伟大教练”效应而导致的变化 的证据。你估计这种效应对奖牌数的贡献有多大?选择三个国家, 并确定他们 应该考虑投资一位“伟大”教练的体育项目, 并估计其影响。
  • 你的模型还揭示了哪些关于奥运奖牌数的原创见解?解释这些见解如何为 国家奥委会提供信息。

2 数据介绍

summerOly_medal_counts.csv

这个表格包含了各个国家在每届夏季奥运会上的奖牌统计信息。每一行代表一个国家在某一年的奥运会上的奖牌数。

  • Rank: 国家在奖牌总数上的排名
  • NOC: 国家名称(以该届奥运会的记录为准)
  • Gold: 获得的金牌数量
  • Silver: 获得的银牌数量
  • Bronze: 获得的铜牌数量
  • Total: 获得的奖牌总数
  • Year: 奥运会年份

summerOly_hosts.csv

这个表格列出了每届夏季奥运会的举办地。

  • Year: 奥运会年份
  • Host: 举办城市和国家

summerOly_programs.csv

这个表格包含了夏季奥运会的项目和学科信息,包括当前和已停办的项目。

  • Sport: 运动类别
  • Discipline: 运动类别中的具体项目
  • Code: 项目的代码
  • Year: 每年的项目数量

summerOly_athletes.csv

这个表格包含了参加夏季奥运会的运动员信息。

  • Name: 运动员姓名
  • Sex: 运动员性别
  • Team: 运动员所属国家
  • NOC: 国家代码
  • Year: 奥运会年份
  • Season: 奥运会类型(夏季)
  • City: 举办城市
  • Sport: 运动类别
  • Event: 具体项目
  • Medal: 获得的奖牌(如果有)

data_dictionary.csv

这个表格是数据字典,解释了其他表格中的变量和示例。

  • summerOly_medal_counts.csv:
    • Rank: 国家在奖牌总数上的排名
    • NOC: 国家名称(以该届奥运会的记录为准)
    • Gold: 获得的金牌数量
    • Silver: 获得的银牌数量
    • Bronze: 获得的铜牌数量
    • Total: 获得的奖牌总数
    • Year: 奥运会年份
  • summerOly_hosts.csv:
    • Year: 奥运会年份
    • Host: 举办城市和国家
  • summerOly_programs.csv:
    • Sport: 运动类别
    • Discipline: 运动类别中的具体项目
    • Code: 项目的代码
    • Year: 每年的项目数量
  • summerOly_athletes.csv:
    • Name: 运动员姓名
    • Sex: 运动员性别
    • Team: 运动员所属国家
    • NOC: 国家代码
    • Year: 奥运会年份
    • Season: 奥运会类型(夏季)
    • City: 举办城市
    • Sport: 运动类别
    • Event: 具体项目
    • Medal: 获得的奖牌(如果有)

3 问题分析

3.1 问题一:建立奖牌数模型

目标:创建一个模型来预测每个国家的奖牌数(金牌和总奖牌)。

  1. 数据预处理

—对数据进行清理和预处理,处理缺失值和异常。

对数据进行规范化,以解释事件数量随时间的变化。

  1. 特性工程

根据历史表现,事件数量,东道国影响等创建功能。

包括社会经济因素(国内生产总值、人口)。

  1. 模式选择

选择合适的统计或机器学习模型(例如,线性回归,随机森林,XGBoost)。

使用历史数据训练模型并验证其性能。

  1. 不确定度和精度:

使用自举抽样等技术来估计预测中的不确定性。

提供奖牌数的预测间隔。

  1. 2028年预测:

使用训练好的模型预测2028年洛杉矶奥运会的奖牌数。

确定与2024年相比可能有所改善或表现更差的国家。

预测将获得第一枚奖牌的国家数量。

  1. 事件影响分析:

分析项目数量和类型与奖牌数之间的关系。

确定不同国家的主要体育项目以及本国赛事的影响。

预测模型可参考代码:https://github.com/hrugved06/OlympicsMedalPrediction

https://github.com/acdick/tokyo_2020_olympic_champions/blob/master/src/04_Linear_Regression_Model.ipynb

Name of the ModelAccuracy
Logistic Regression85.357825
MultinomialNB85.367968
Decision Tree84.095457
Random Forest88.779773
Gradient Boosting88.514205
Neural Network87.904691

3.2 问题二:伟大的教练效应

目的:调查“伟大教练”对奖牌数的影响。

  1. 数据分析

找出著名教练改变国家的例子。

分析教练任期前后奖牌数的变化。

  1. 模拟效果

创建一个模型来量化一个伟大教练对奖牌数的影响。

估计教练对总奖牌数的贡献。

  1. 建议:

找出三个国家和体育项目,在这些国家和体育项目中,投资一位优秀的教练可能会产生重大影响。

估计这些国家和体育项目奖牌数的潜在增长。

3.3 问题三:原始的见解

目的:揭示该模型对奥运奖牌数的其他启示。

  1. 探索性数据分析(EDA)

执行EDA以发现数据中的模式和趋势。

确定对奖牌数量有重大影响的因素。

数据分析可参考代码:https://github.com/thexinyu/OlympicMedalPrediction/blob/main/Olympic_Medal_Prediction.ipynb

  1. 洞察力产出

使用模型输出为国家奥委会提供可操作的见解。

突出显示数据中任何意外的发现或关系。

3 数学模型

4 Python代码

4.1 相关项目

  • predictolympicmedals
  • tokyo_2020_olympic_champions
  • PredictingMedals
  • OlympicsDataAnalyzerandMedalPredictor
  • OlympicsMedalsPredictionModel
  • tokyo_2020_olympic_champions
  • OlympicsMedalPrediction
  • OlympicMedalPrediction
  • OlympicsMedalPredictionMachineLearningModel
  • olympic_medal_prediction
  • OlympicsPrediction
  • MedalsPrediction
  • MedalPredictions
  • MedalsPredictions
  • MedalsOlympics_Prediction

4.2 主要代码

见github:https://github.com/cityu-lm/2025_MCM_Problem_C/blob/main/README.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7080.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt 5.14.2 学习记录 —— 십칠 窗口和菜单

文章目录 1、Qt窗口2、菜单栏设置快捷键添加子菜单添加分割线和菜单图标 3、工具栏 QToolBar4、状态栏 QStatusBar5、浮动窗口 QDockWidget 1、Qt窗口 QWidget,即控件,是窗口的一部分。在界面中创建控件组成界面时,Qt自动生成了窗口&#xf…

Spring Boot 邂逅Netty:构建高性能网络应用的奇妙之旅

一、引言 在当今数字化时代,构建高效、可靠的网络应用是开发者面临的重要挑战。Spring Boot 作为一款强大的 Java 开发框架,以其快速开发、简洁配置和丰富的生态支持,深受广大开发者喜爱。而 Netty 作为高性能、异步的网络通信框架&#xff…

Windows中本地组策略编辑器gpedit.msc打不开/微软远程桌面无法复制粘贴

目录 背景 解决gpedit.msc打不开 解决复制粘贴 剪贴板的问题 启用远程桌面剪贴板与驱动器 重启RDP剪贴板监视程序 以上都不行?可能是操作被Win11系统阻止 最后 背景 远程桌面无法复制粘贴,需要查看下主机策略组设置,结果按WinR输入…

深圳大学-智能网络与计算-实验一:RFID原理与读写操作

实验目的与要求 掌握超高频RFID标签的寻卡操作。掌握超高频RFID标签的读写操作。掌握超高频RFID标签多张卡读取时的防冲突机制。 方法,步骤 软硬件的连接与设置超高频RFID寻卡操作超高频RFID防冲突机制超高频RFID读写卡操作 实验过程及内容 一.软硬…

快门:凝固瞬间与塑造动感的魔法开关

目录 一、快门的基本概念 二、快门速度的分类及效果 (一)高速快门 (二)低速快门 (三)安全快门 三、快门优先模式:掌控拍摄节奏的利器 四、快门与其他摄影要素的关系 (一&…

2025发文新方向:AI+量化 人工智能与金融完美融合!

2025深度学习发论文&模型涨点之——AI量化 人工智能的融入,使量化交易实现了质的突破。借助机器学习、深度学习等先进技术,人工智能可高效处理并剖析海量市场数据,挖掘出数据背后错综复杂的模式与趋势,从而不仅提升了数据分析…

单链表算法实战:解锁数据结构核心谜题——链表的回文结构

题目如下: 解题过程如下: 回文结构举例: 回文数字:12521、12321、1221…… 回文字符串:“abcba”、“abba”…… 并不是所有的循环嵌套的时间复杂度都是O(n^2) 可以用C写C程序: C里可以直接使用ListNode…

golang网络编程

socket编程 socket图解 Socket是BSD UNIX的进程通信机制,通常也称作”套接字”,用于描述IP地址和端口,是一个通信链的句柄。Socket可以理解为TCP/IP网络的API,它定义了许多函数或例程,程序员可以用它们来开发TCP/IP网…

「 机器人 」仿生扑翼飞行器中的“被动旋转机制”概述

前言 在仿生扑翼飞行器的机翼设计中,模仿昆虫翼的被动旋转机制是一项关键技术。其核心思想在于:机翼旋转角度(攻角)并非完全通过主动伺服来控制,而是利用空气动力和惯性力的作用,自然地实现被动调节。以下对这种设计的背景、原理与优势进行详细说明。 1. 背景:昆虫的被动…

git远程仓库如何修改

1.需要做的事情:把git的远程仓库修改掉,在git创建一个自己的仓库 如果你是私有化的话,可以生成一个自己token令牌也可以。到时候push的时候会让你登录你就可以输入你的token令牌和用户名。 2.查看当前仓库的远程地址是不是自己的 &#xff…

罗氏线圈的学习【一】

TI的罗氏线圈介绍,讲解的非常好: 具有低功耗低成本性能的PCB罗氏线圈与积分电路设计 罗氏线圈(Rogowski Coil)是一种常见的电流测量装置,广泛用于高精度和非接触式的电流测量场景,尤其是在测量交流电流、…

计算机视觉-卷积

卷积-图像去噪 一、图像 二进制 灰度 彩色 1.1二进制图像 0 1 一个点可以用一个bit(0/1)来表示 1.2灰度图像 0-255 一个点可以用一个byte来表示 1.3彩色图像 RGB 表达一个彩色图像先说它的分辨率p/w(宽)和q/h(高…

Ansys Thermal Desktop 概述

介绍 Thermal Desktop 是一种用于热分析和流体分析的通用工具。它可用于组件或系统级分析。 来源:CRTech 历史 Thermal Desktop 由 C&R Technologies (CR Tech) 开发。它采用了 SINDA/FLUINT 求解器。SINDA/FLUINT 最初由 CR Tech 的创始人为 NASA 的约翰逊航…

32、【OS】【Nuttx】OSTest分析(1):stdio测试(二)

背景 接上篇wiki 31、【OS】【Nuttx】OSTest分析(1):stdio测试(一) 继续stdio测试的分析,上篇讲到标准IO端口初始化,单从测试内容来说其实很简单,没啥可分析的,但这几篇…

WPF基础 | 初探 WPF:理解其核心架构与开发环境搭建

WPF基础 | 初探 WPF:理解其核心架构与开发环境搭建 一、前言二、WPF 核心架构2.1 核心组件2.2 布局系统2.3 数据绑定机制2.4 事件处理机制 三、WPF 开发环境搭建3.1 安装 Visual Studio3.2 创建第一个 WPF 应用程序 结束语优质源码分享 WPF基础 | 初探 WPF&#xff…

(算法竞赛)使用广度优先搜索(BFS)解决迷宫最短路径问题

在这个充满奇思妙想的世界里,每一次探索都像是打开了一扇通往新世界的大门。今天,我们将踏上一段特别的旅程,去揭开那些隐藏在代码、算法、数学谜题或生活智慧背后的秘密。🎉😊 所以,系好安全带&#xff0…

总线、UART、IIC、SPI

一图流 总线 概念 连接多个部件的信息传输线,是各部件共享的传输介质 类型 片内总线:连接处理器内核和外设的总线,在芯片内部 片外总线:连接芯片和其他芯片或者模块的总线 总线的通信 总线通信的方式 串行通信 数据按位顺序传…

CLion开发Qt桌面

IDE:CLion Qt Qt版本:5.12 学习正点原子的嵌入式Linux开发板时,使用Qt Creator写代码不是很方便,遂尝试使用CLion搭建Qt开发环境。 一、CLion的Qt环境搭建 1,配置工具链 找到Qt的安装目录,此处为E:\Tools\…

一部手机如何配置内网电脑同时访问内外网

做过运维的朋友都知道,最麻烦的是运维电脑不能远程,每次都得现场进行维护,明明客户那边有可以访问内网的电脑,怎么操作能将这台电脑能访问跟到外网呢,这样不就能通过远程软件远程了吗?嘿嘿。按以下步骤试试…

【深度学习】搭建PyTorch神经网络进行气温预测

第一步 数据加载与观察 ①导包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import torch import torch.optim as optim import warnings warnings.filterwarnings("ignore") %matplotlib inline ②加载数据 features pd.read_csv(…