python爬虫-下载高德地图区域(省,市,区)

python爬虫,用于下载:https://datav.aliyun.com/portal/school/atlas/area_selector 的中国地图及其下钻省市区的json文件。在echarts或者leaflet展示。
可能会少几个市区的full.json数据,api的xml调不通,可以手动去 https://datav.aliyun.com/portal/school/atlas/area_selector下载
在这里插入图片描述

  1. 下载并解析all.json文件。

  2. 遍历all.json中的JSON数组,获取每个adcode:

  3. 检查dist目录下是否已经存在adcode.json文件,如果不存在,则下载并保存。

  4. 如果adcode的最后两位不为00,检查dist目录下是否已经存在adcode_full.json文件,如果不存在,则下载并保存。(有些市最后两位可能为00,即没有下属区 则不理它,如东莞市)

  5. 如果有失败的下载,尝试重新下载失败的文件。

  6. 输出下载结果和跳过的文件列表。

  7. 文件压缩,去掉多余空格

当前文章python代码地址

原项目github代码(node版)

目录

在这里插入图片描述

直接就能用

import os
import json
import requests
from tqdm import tqdm# 下载文件的函数
def download_file(url, filepath):try:response = requests.get(url, timeout=10)response.raise_for_status()with open(filepath, 'w', encoding='utf-8') as file:json.dump(response.json(), file, ensure_ascii=False, indent=4)return Trueexcept Exception as e:print(f"Failed to download {os.path.basename(filepath)}: {e}")return False# 第一步:下载并解析 all.json
def first_step():url = 'https://geo.datav.aliyun.com/areas_v3/bound/all.json'print('Downloading all.json...')try:response = requests.get(url, timeout=10)response.raise_for_status()print('Downloaded all.json successfully')return response.json()except Exception as e:print(f"Failed to download all.json: {e}")exit(1)# 第二步:遍历 JSON 数组,下载每个 adcode 对应的 JSON
def second_step(json_array):failed_downloads = []skipped_downloads = []# 确保 dist 目录存在dist_path = os.path.join(os.getcwd(), 'dist')os.makedirs(dist_path, exist_ok=True)# 逐个下载for item in tqdm(json_array, desc="Downloading files"):adcode = str(item['adcode'])is_special_code = adcode.endswith('00')# 构建下载链接和文件名normal_file_name = f"{adcode}.json"full_file_name = f"{adcode}_full.json"normal_file_path = os.path.join(dist_path, normal_file_name)full_file_path = os.path.join(dist_path, full_file_name)# 检查并下载普通文件if not os.path.exists(normal_file_path):url = f"https://geo.datav.aliyun.com/areas_v3/bound/{adcode}.json"success = download_file(url, normal_file_path)if not success:failed_downloads.append(adcode)else:skipped_downloads.append(normal_file_name)# 如果是特殊代码,检查并下载 _full 文件if is_special_code:if not os.path.exists(full_file_path):url = f"https://geo.datav.aliyun.com/areas_v3/bound/{adcode}_full.json"success = download_file(url, full_file_path)if not success:failed_downloads.append(adcode)else:skipped_downloads.append(full_file_name)# 返回失败的下载列表和跳过的下载列表return failed_downloads, skipped_downloads# 主函数
def main():json_array = first_step()failed_downloads, skipped_downloads = second_step(json_array)# 输出跳过的下载if skipped_downloads:print(f"Skipped downloads: {', '.join(skipped_downloads)}")# 如果有失败的下载,尝试重新下载if failed_downloads:print(f"Retrying failed downloads: {', '.join(failed_downloads)}")retry_result, _ = second_step([{'adcode': adcode} for adcode in failed_downloads])if retry_result:print(f"Failed downloads after retry: {', '.join(retry_result)}")else:print("All failed downloads were successful on retry")else:print("All downloads completed successfully")if __name__ == "__main__":main()

调用本地的all。json文件下载(这个文件是从https://geo.datav.aliyun.com/areas_v3/bound/all.json拷贝下来的)

import os
import json
import requests
import time
from tqdm import tqdm# 下载文件的函数(带进度条)
def download_file_with_progress(url, filepath, delay=1):try:# 启用流模式response = requests.get(url, stream=True, timeout=10)response.raise_for_status()# 获取文件大小total_size = int(response.headers.get('content-length', 0))chunk_size = 1024  # 每次读取 1KB# 打开文件准备写入with open(filepath, 'wb') as file:with tqdm(total=total_size, unit='B', unit_scale=True, desc=os.path.basename(filepath)) as progress_bar:for chunk in response.iter_content(chunk_size=chunk_size):file.write(chunk)progress_bar.update(len(chunk))time.sleep(delay)  # 增加下载间隔return Trueexcept Exception as e:print(f"Failed to download {os.path.basename(filepath)}: {e}")return False# 第一步:读取本地的 all.json 文件
def first_step():local_path = './all.json'print('Reading all.json...')try:with open(local_path, 'r', encoding='utf-8') as file:data = json.load(file)print('Read all.json successfully')return dataexcept Exception as e:print(f"Failed to read all.json: {e}")exit(1)# 第二步:遍历 JSON 数组,下载每个 adcode 对应的 JSON
def second_step(json_array):failed_downloads = []skipped_downloads = []# 确保 dist 目录存在dist_path = os.path.join(os.getcwd(), 'dist')os.makedirs(dist_path, exist_ok=True)# 逐个下载for item in json_array:adcode = str(item['adcode'])is_special_code = adcode.endswith('00')# 构建下载链接和文件名normal_file_name = f"{adcode}.json"full_file_name = f"{adcode}_full.json"normal_file_path = os.path.join(dist_path, normal_file_name)full_file_path = os.path.join(dist_path, full_file_name)# 检查并下载普通文件if not os.path.exists(normal_file_path):url = f"https://geo.datav.aliyun.com/areas_v3/bound/{adcode}.json"success = download_file_with_progress(url, normal_file_path, delay=1)if not success:failed_downloads.append(adcode)else:print(f"Skipped: {normal_file_name}")skipped_downloads.append(normal_file_name)# 如果是特殊代码,检查并下载 _full 文件if is_special_code:if not os.path.exists(full_file_path):url = f"https://geo.datav.aliyun.com/areas_v3/bound/{adcode}_full.json"success = download_file_with_progress(url, full_file_path, delay=1)if not success:failed_downloads.append(adcode)else:print(f"Skipped: {full_file_name}")skipped_downloads.append(full_file_name)# 返回失败的下载列表和跳过的下载列表return failed_downloads, skipped_downloads# 主函数
def main():json_array = first_step()failed_downloads, skipped_downloads = second_step(json_array)# 输出跳过的下载if skipped_downloads:print(f"Skipped downloads: {', '.join(skipped_downloads)}")# 如果有失败的下载,尝试重新下载if failed_downloads:print(f"Retrying failed downloads: {', '.join(failed_downloads)}")retry_result, _ = second_step([{'adcode': adcode} for adcode in failed_downloads])if retry_result:print(f"Failed downloads after retry: {', '.join(retry_result)}")else:print("All failed downloads were successful on retry")else:print("All downloads completed successfully")if __name__ == "__main__":main()

文件压缩一下,要么太占地方了

import os
import json# 压缩 JSON 文件的函数
def compress_json_file(input_filepath, output_dir):try:# 读取 JSON 数据with open(input_filepath, 'r', encoding='utf-8') as file:data = json.load(file)# 确保输出目录存在os.makedirs(output_dir, exist_ok=True)# 构建输出文件路径filename = os.path.basename(input_filepath)output_filepath = os.path.join(output_dir, filename)# 写入压缩后的 JSON 数据with open(output_filepath, 'w', encoding='utf-8') as file:json.dump(data, file, ensure_ascii=False, separators=(',', ':'))print(f"Compressed: {filename} -> {output_filepath}")except Exception as e:print(f"Failed to compress {input_filepath}: {e}")# 遍历 dist 文件夹中的 JSON 文件并压缩
def compress_all_json_files(input_dir, output_dir):if not os.path.exists(input_dir):print(f"Input directory {input_dir} does not exist.")return# 遍历 dist 文件夹中的所有 JSON 文件for root, _, files in os.walk(input_dir):for file in files:if file.endswith('.json'):input_filepath = os.path.join(root, file)compress_json_file(input_filepath, output_dir)# 主函数
def main():input_dir = './dist'  # 原始 JSON 文件所在目录output_dir = './compressed'  # 压缩后文件保存目录compress_all_json_files(input_dir, output_dir)print(f"All JSON files from {input_dir} have been compressed into {output_dir}")if __name__ == "__main__":main()

vue 调用本地地图

    getGeoJson(adcode,selectName = "",selectLevel = "",fromName = "",toName = "") {let that = this;// 定义加载 JSON 数据的方法const loadJson = (filePath, callback, failCallback) => {$.getJSON(filePath).done(data => {console.log(`Loaded ${filePath}`);callback(data);}).fail(() => {console.error(`Failed to load ${filePath}`);if (typeof failCallback === "function") failCallback();});};// 定义加载逻辑,优先加载 full 文件const tryLoadMapData = adcode => {const fullFilePath = `@/../static/plugins/chinese-map/static/Amapfor2024/${adcode}_full.json`;const normalFilePath = `@/../static/plugins/chinese-map/static/Amapfor2024/${adcode}.json`;// 先尝试加载 full 文件loadJson(fullFilePath,data => {// 如果加载 full 文件成功,直接使用数据console.log(`Loaded ${adcode}_full.json`);that.geoJson.features = that.validateFeatures(data.features || []);that.populateCityList(that.geoJson.features, selectLevel);},() => {// 如果加载 full 文件失败,尝试加载普通文件loadJson(normalFilePath, data => {console.log(`Loaded ${adcode}.json`);that.geoJson.features = that.validateFeatures(data.features || []);that.populateCityList(that.geoJson.features, selectLevel);});});};tryLoadMapData(adcode);// 加载不同地图数据的逻辑// if (adcode === "100000") {//   // 如果是全国地图,直接加载 100000_full.json//   tryLoadMapData("100000");// } else {//   // 对于其他地区,尝试加载 full 文件,否则加载普通文件//   tryLoadMapData(adcode);// }// 获取当前地图数据值that.getMyData(selectLevel, selectName, fromName, toName).then(res => {that.outLineData = res.outLineData; // 每个年份下迁出线的数据that.migrationOut = res.migrationOut; // 表格部分--热点迁出that.outTimeTitle = res.outTimeTitle; // 迁出时间标签setTimeout(() => {// 对表格进度条的样式$(".el-progress-bar__outer").css({"background-color": "rgba(5, 43, 79, 0.3)",border: "1px solid #177DE5","border-radius": "2px"});$(".el-progress-bar__inner").css({"border-radius": "2px",margin: "1px",height: "83%"});}, 0);that.getMapData();});},

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/476934.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uni-app 修改复选框checkbox选中后背景和字体颜色

编写css(注意:这个样式必须写在App.vue里) /* 复选框 */ /* 复选框-圆角 */ checkbox.checkbox-round .wx-checkbox-input, checkbox.checkbox-round .uni-checkbox-input {border-radius: 100rpx; } /* 复选框-背景颜色 */ checkbox.checkb…

MacOS下的Opencv3.4.16的编译

前言 MacOS下编译opencv还是有点麻烦的。 1、Opencv3.4.16的下载 注意,我们使用的是Mac,所以ios pack并不能使用。 如何嫌官网上下载比较慢的话,可以考虑在csdn网站上下载,应该也是可以找到的。 2、cmake的下载 官网的链接&…

内外网交换过程中可能遇到的安全风险有哪些?

在数字化时代,企业内外网之间的数据交换变得日益频繁。然而,这一过程中的安全风险和效率问题也日益凸显。我们将探讨内外网交换可能遇到的安全风险,并介绍镭速内外网交换系统如何有效应对这些挑战。 内外网交换过程中的五大安全风险 数据泄露…

Redis的过期删除策略和内存淘汰机制以及如何保证双写的一致性

Redis的过期删除策略和内存淘汰机制以及如何保证双写的一致性 过期删除策略内存淘汰机制怎么保证redis双写的一致性?更新策略先删除缓存后更新数据库先更新数据库后删除缓存如何选择?如何保证先更新数据库后删除缓存的线程安全问题? 过期删除策略 为了…

GESP2023年9月认证C++四级( 第三部分编程题(1-2))

编程题1&#xff08;string&#xff09;参考程序&#xff1a; #include <iostream> using namespace std; long long hex10(string num,int b) {//int i;long long res0;for(i0;i<num.size();i) if(num[i]>0&&num[i]<9)resres*bnum[i]-0;else //如果nu…

VSCode汉化教程【简洁易懂】

我们安装完成后默认是英文界面。 找到插件选项卡&#xff0c;搜索“Chinese”&#xff0c;找到简体&#xff08;更具你的需要&#xff09;&#xff08;Microsoft提供&#xff09;Install。 安装完成后选择Change Language and Restart。

java学习-集合

为什么有集合&#xff1f; 自动扩容 数组&#xff1a;长度固定&#xff0c;可以存基本数据类型和引用数据类型 集合&#xff1a;长度可变&#xff0c;可以存引用数据类型&#xff0c;基本数据类型的话需要包装类 ArrayList public class studentTest {public static void m…

MATLAB GUI设计(基础)

一、目的和要求 1、熟悉和掌握MATLAB GUI的基本控件的使用及属性设置。 2、熟悉和掌握通过GUIDE创建MATLAB GUI的方法。 3、熟悉和掌握MATLAB GUI的菜单、对话框及文件管理框的设计。 4、熟悉和掌握MATLAB GUI的M文件编写。 5、了解通过程序创建MATLAB GUI的方法。 二、内…

【工具变量】中国省级及地级市保障性住房数据集(2010-2023年)

一、测算方式&#xff1a;参考顶刊《世界经济》蔡庆丰&#xff08;2024&#xff09;老师的研究&#xff0c;具体而言&#xff0c;本文将土地用途为经济适用住房用地、廉租住房用地、公共租赁住房用地、共有产权住房用 地等类型的土地定义为具有保障性住房用途的土地。根据具有保…

第T8周:Tensorflow实现猫狗识别(1)

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 具体实现 &#xff08;一&#xff09;环境 语言环境&#xff1a;Python 3.10 编 译 器: PyCharm 框 架: &#xff08;二&#xff09;具体步骤 from absl.l…

Day 18

修建二叉搜索树 link&#xff1a;669. 修剪二叉搜索树 - 力扣&#xff08;LeetCode&#xff09; 思路分析 注意修剪的时候要考虑到全部的节点&#xff0c;即搜到到限定区间小于左值或者大于右值时还需要检查当前不符合区间大小节点的右子树/左子树&#xff0c;不能直接返回n…

核间通信-Linux下RPMsg使用与源码框架分析

目录 1 文档目的 2 相关概念 2.1 术语 2.2 RPMsg相关概念 3 RPMsg核间通信软硬件模块框架 3.1 硬件原理 3.2 软件框架 4 使用RPMsg进行核间通信 4.1 RPMsg通信建立 4.1.1 使用名称服务建立通信 4.1.2 不用名称服务 4.2 RPMsg应用过程 4.3 应用层示例 5 RPMsg内核…

常用Adb 命令

# 连接设备 adb connect 192.168.10.125# 断开连接 adb disconnect 192.168.10.125# 查看已连接的设备 adb devices# 安装webview adb install -r "D:\webview\com.google.android.webview_103.0.5060.129-506012903_minAPI23(arm64-v8a,armeabi-v7a)(nodpi)_apkmirror.co…

高质量代理池go_Proxy_Pool

高质量代理池go_Proxy_Pool 声明&#xff01; 学习视频来自B站up主 ​泷羽sec​​ 有兴趣的师傅可以关注一下&#xff0c;如涉及侵权马上删除文章 笔记只是方便各位师傅的学习和探讨&#xff0c;文章所提到的网站以及内容&#xff0c;只做学习交流&#xff0c;其他均与本人以…

有关博客博客系统的测试报告 --- 初次进行项目测试篇

文章目录 前言一、博客系统的项目背景二、博客系统的项目简介1.后端功能1.1 用户管理1.2 博客管理1.3 权限管理 2.前端功能2.1 用户界面 测试计划测试工具、环境设计的测试动作功能测试访问博客登录页面博客首页测试博客详情页博客编辑页 自动化测试自动化测试用例自动化测试脚…

物业管理系统的设计和实现

一、项目背景 物业管理系统在现代城市化进程中起着至关重要的作用。 随着居民生活水平的提高和信息技术的迅猛发展&#xff0c;传统的物业管理模式已不能满足业主和管理者的需求。 为了提高管理效率、降低运营成本、提升服务质量&#xff0c;设计并实现一个集成化、智能化的物业…

JDBC编程---Java

目录 一、数据库编程的前置 二、Java的数据库编程----JDBC 1.概念 2.JDBC编程的优点 三.导入MySQL驱动包 四、JDBC编程的实战 1.创造数据源&#xff0c;并设置数据库所在的位置&#xff0c;三条固定写法 2.建立和数据库服务器之间的连接&#xff0c;连接好了后&#xff…

快速图像识别:落叶植物叶片分类

1.背景意义 研究背景与意义 随着全球生态环境的变化&#xff0c;植物的多样性及其在生态系统中的重要性日益受到关注。植物叶片的分类不仅是植物学研究的基础&#xff0c;也是生态监测、农业管理和生物多样性保护的重要环节。传统的植物分类方法依赖于人工观察和专家知识&…

数字化那点事:一文读懂物联网

一、物联网是什么&#xff1f; 物联网&#xff08;Internet of Things&#xff0c;简称IoT&#xff09;是指通过网络将各种物理设备连接起来&#xff0c;使它们可以互相通信并进行数据交换的技术系统。通过在物理对象中嵌入传感器、处理器、通信模块等硬件&#xff0c;IoT将“…

IntelliJ+SpringBoot项目实战(十)--常量类、自定义错误页、全局异常处理

一、常量类 在项目开发中&#xff0c;经常需要约定一些常量&#xff0c;比如接口返回响应请求指定状态码、异常类型、默认页数等&#xff0c;为了增加代码的可阅读性以及开发团队中规范一些常量的使用&#xff0c;可开发一些常量类。下面有3个常量类示例&#xff0c;代码位于op…