问题一
第一个问题是开发国家奖牌总数模型,包括以下几个具体要求:
- 开发一个预测各国奖牌数(至少包括金牌和总奖牌数)的模型,并包括模型预测结果的不确定性/精度估计及模型性能的衡量指标。
- 根据模型,预测2028年洛杉矶夏季奥运会的奖牌榜,包括所有结果的预测区间,并分析哪些国家可能在奖牌榜上有所提升,哪些国家表现可能不如2024年。
- 模型应包括尚未获得奖牌的国家,预测下届奥运会中有多少国家可能赢得他们的首枚奖牌,并估算这种预测的可能性。
- 模型还应考虑特定奥运会的赛事数量(包括类型),并探索赛事数量与国家奖牌数的关系,分析对不同国家最重要的运动项目及其原因,以及东道主选择的赛事如何影响结果。
1. 国家奖牌总数模型的开发
1.1 数据准备与特征选择
首先,针对我们模型的开发,我们需要选择合适的特征。主要特征如下:
- 历届奥运会的奖牌数(金牌、银牌、铜牌、总奖牌数)
- 每个国家的参赛人数
- 国家在不同年奥运会中的主办情况
- 比赛项目的数量和类型
- 国家之前的奖牌表现趋势
通过分析summerOly_medal_counts.csv和summerOly_programs.csv的数据集,我们可以提取出各国家在历届