请问 352 个城市中所有 35200 个景点评分的最高分(Best Score,简称 BS)是多少?全国有多少个景点获评了这个最高评分(BS)?获评了这个最高评分(BS)景点最多的城市有哪些?依据拥有最高评分(BS)景点数量的多少排序,列出前 10 个城市。
:数据准备
解题步骤
读取所有城市的景点评分数据:
我们需要将所有城市的 CSV 文件合并到一个 DataFrame 中。
计算最高评分(BS):
从合并后的 DataFrame 中找出所有景点评分的最高分。
统计获得最高评分的景点数量:
统计每个城市中获得最高评分的景点数量,并找出这些城市中获得最多的前 10 个城市。
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as pltdef generate_mock_data(num_cities=352, num_sights_per_city=100):data = []for city_id in range(1, num_cities + 1):for sight_id in range(1, num_sights_per_city + 1):data.append({'city_id': city_id,'sight_name': f'Sight_{city_id}_{sight_id}','score': np.random.randint(60, 101) # 评分在60到100之间})return pd.DataFrame(data)mock_data = generate_mock_data()# 找到每个城市评分最高的景点
city_best_scores = mock_data.loc[mock_data.groupby('city_id')['score'].idxmax()]# 找到所有景点的最高评分(BS)
best_score = city_best_scores['score'].max()# 统计全国有多少个景点获得了这个最高评分(BS)
num_best_sights = (mock_data['score'] == best_score).sum()# 统计每个城市有多少个景点获得了这个最高评分(BS)
city_best_sight_counts = mock_data[mock_data['score'] == best_score]['city_id'].value_counts().head(10)# 创建一个DataFrame用于可视化
visual_data = city_best_sight_counts.reset_index()
visual_data.columns = ['city_id', 'count']# 使用Seaborn进行增强样式的条形图可视化
plt.figure(figsize=(14, 10))
sns.barplot(x='city_id', y='count', data=visual_data, palette='viridis')# 添加标题和标签
plt.title(f'Top 10 Cities with the Most Best Scored Sights (BS = {best_score})', fontsize=16)
plt.xlabel('City ID', fontsize=14)
plt.ylabel('Number of Best Scored Sights', fontsize=14)# 显示图表
plt.show()# 打印结果
print(f'最高评分(BS):{best_score}')
print(f'获得最高评分(BS)的景点数量:{num_best_sights}')
print(f'拥有最多最高评分(BS)景点的前10个城市:')
print(city_best_sight_counts)
这不是完整代码。
要解决这个问题,我们需要分析一个包含352个城市和每个城市100个景点评分的旅游景点数据集。目标是找出所有景点评分中的最高分,以及获得最高评分景点最多的城市。以下是解题和建模过程:
数据预处理
读取数据:读取每个城市的csv文件,提取每个景点的信息。
提取评分信息:从每个景点的信息中提取评分,并记录每个景点的名称和评分。
找出最高评分(Best Score,BS)
找出最高评分:遍历所有景点,找出最高评分。
找出获得最高评分(BS)的景点数量
统计最高评分景点:统计每个城市中获得最高评分的景点数量。
找出拥有最多最高评分(BS)景点的城市
排序城市:根据每个城市中最高评分景点的数量进行排序,找出前10个城市。
老外游中国—重要
【文档】2024 华数杯C题老外游中国解题文档
https://docs.qq.com/doc/DU1RBWG9aUXVUYUhF
截图:
压缩包包含以下内容:
● 解题代码(已打包,可运行)
● 代码解析
● 解题思路
● 完整解题文章(37页)
预览图如下: