百度热力图数据获取,原理,处理及论文应用5

目录

  • 0、数据简介
  • 0、示例数据
  • 1、百度热力图数据日期如何选择
    • 1.1、其他实验数据的时间
    • 1.2、看日历
    • 1.3、看天气
  • 2、百度热力图几天够研究?部分文章统计
  • 3、数据原理
    • 3.1.1 ==** 这个比较重要,后面还会再次出现。核密度的值怎么理解?**==
    • 3.1.2 Csv->shp->tif是常规的数据处理流程,可以不这么处理吗?
    • 3.1.3 Bd09mc即百度墨卡托投影坐标系200单位的距离是可以自己设置的吗?
    • 3.1.4 实际采样点是什么样?
    • 3.1.5 有些地方没有采样点是什么原因?
  • 4、csv文件字段说明
  • 4、Arcgis,QGIS软件数据处理教程(最近太忙后续更新)
    • 4.1、Arcgis篇操作
    • 4.2、QGIS篇操作
  • 5、Arcgis PRO 百度热力图数据处理流程!!!
    • (1)csv数据可视化!!!
    • (2)为什么要投影?
    • (3)UTM投影的选择(地区->投影带)
    • (4)投影,转投影坐标系
    • (5)核密度分析
  • 6、核密度分析的数学原理
  • 7、是否需要根据研究区进行裁剪?
  • 8、核密度输出栅格大小,搜索距离怎么选?
  • 9、常见应用
    • 9.1 用途(空间结构研究,城区职住关系,人群聚集时空分析,XX活力测度)
    • 9.2 求周中平均/周末平均/周平均/日平均活力强度
    • 9.3 时间序列
  • 10、活力计算/相关论文
    • 2024 黄志强 基于多源大数据的街道空间品质测度及其对街道 活力的影响*——以广州历史城区为例
    • 2021 司睿 基于街景数据的建成环境与街道活力时空分析 —以深圳福田区为例
    • xxx。
  • 11、其他数据处理/程序/指导!!!


0、数据简介

数据来源:百度慧眼
数据形式:含坐标的csv点数据;shp数据(含csv点数据);TIF栅格数据(含csv,shp数据);PNG可视化图片。多种数据形式可选。
价格:市为单位,每天有24个时间点。也可提供shp格式,核密度/反距离tif格式,数据格式不同价格不同。
直接选TIF的好处:不用手动从csv转shp,不用考虑投影带,不用手动核密度,我可以确保数据一定符合你的研究,会跟你确定栅格大小和研究区,根据研究区裁剪数据。
用途:城市/街道活力,人口统计,选址分析,商圈分析,活力分析等等。

优势:全网最全最细!
1、有论文支撑!!!《地理科学》。
2、定量数据!
3、从数据原理到应用给你讲清楚。
4、专注于城市研究。

邮箱:邮箱已设置自动回复!!!随意发送邮件即可获得联系方式。437969428@qq.com


0、示例数据

CSDN资源

百度热力图定量数据csv,shp,tif 深圳市20221114日12点
百度热力图定量数据csv,shp,tif 北京市20201018日12点
百度热力图定量数据csv,shp,tif 成都市20240805日22点
百度热力图定量数据csv,shp,tif 重庆市20240805日20点
百度热力图定量数据csv,shp,tif 长沙市20240916日12点
百度热力图定量数据csv,shp,tif 沈阳市20240713日12点
百度热力图定量数据csv,shp,tif 济南市20240910日12点

数据介绍:百度慧眼百度热力图数据处理,可直接用于论文

1、百度热力图数据日期如何选择

根据研究内容定,一般如果研究城市活力的话,通常会写“非重大节假日,非重大活动,非极端天气等”。南方晴天不多,有小雨或者中雨都可认为没有影响,要不然在南方很难找到完全一周没有下雨的天气。

1.1、其他实验数据的时间

尽量保持在同一年,不能做到1年的话,也没问题,有的论文中会解释为什么不在一年也没事,具体理由记不清了,maybe like 对研究影响很小这种理由。

1.2、看日历

浏览器搜日历
在这里插入图片描述

1.3、看天气

深圳历史天气查询_历史天气预报查询_2345天气预报
在这里插入图片描述

历史天气检索

在这里插入图片描述

深圳的某一周,非重大节假日,非重大活动,天气 晴朗

2、百度热力图几天够研究?部分文章统计

有的甚至都不是定量数据,更不要提精准度了我的数据是定量数据,用于论文完全没有问题。看好的文章,非必要不看老文章/期刊一般的文章,百度热力图的研究很多,好期刊的文章够大家参考了。

参考文献研究区域天数表征活力
2023 王梓蒙等.基于多源数据的城市活力与建成环境非线性关系研究——以双休日武汉市主城区为例[J]. 地理科学进展, 2023, 42(4): 716-729.武汉-TAZ小区2019.11的2个双休日,天数:2,时间点:96个城市活力
2023 汪成刚等.城市活力与建成环境的非线性关系和阈值效应研究——以广州市中心城区为例[J].地理科学进展,2023,42(01):79-88.广州广州中心城区(包括荔湾、越秀、天河和海珠区) -300m格网2021.3.22 ~ 2021.3.26,5个工作7:00~23:00,天数:5,时间点:85个城市活力
2021 司睿等.基于街景数据的建成环境与街道活力时空分析——以深圳福田区为例[J].地理科学,2021,41(09):1536-1545.深圳福田2020.8 .22 ~2020.8.23 天数:2 时间点:48个 爬取的为图片,参照官方图例进行了重分类 共截取热力图 48 张街道活力
2022 Lv, Geyu, et al. “Exploring the relationship between the built environment and block vitality based on multi-source big data: An analysis in Shenzhen, China.” Geomatics, Natural Hazards and Risk 13.1 (2022): 1593-1613.深圳2644个街区2020.7.2日-2020.7.8日,天数:7,时间点:168个城市活力
2021 Fan Z, et al. How did built environment affect urban vitality in urban waterfronts? A case study in Nanjing Reach of Yangtze River[J]. ISPRS International Journal of Geo-Information, 2021, 10(9): 611.南京2020.10.14星期三和2020.10.17日星期六,6:00至22:00,天数:2,时间点:34城市活力
2021 肖龙珠等. Nonlinear and synergistic effects of TOD on urban vibrancy: Applying local explanations for gradient boosting decision tree深圳166个地铁车站2018.6.11~2018.6.17 上午7点至晚上11点,天数:7天,时间点:119个城市活力

自己再多看看同方向研究,一般来说都是5天或7天即一周的数据,要不然审稿人可能会质疑你数据的代表性。

3、数据原理

百度慧眼人口位置数据使用说明
这我朋友的博文,我们的数据一样。为了博文的完整性,我会把部分内容引用过来。

百度慧眼人口位置数据(以下简称“慧眼数据”)主要数据来源于对调用百度地图定位SDK终端定位数据的统计值。首先,百度地图按照百度墨卡托坐标系(bdmc09)将全国划分成200*200的渔网(如下图蓝色实线所示),对某时段内(平台内置为1个小时)调用过定位SDK的终端数量进行统计。如下图黄色区域内,假定该时段内共有7个终端定位数据,那么将该区域的热力值(value)赋值给质心点。
在这里插入图片描述

3.1.1 ** 这个比较重要,后面还会再次出现。核密度的值怎么理解?**

在这里插入图片描述
比如我这个是图核密度按照输出栅格10m,搜索距离300m的出来的数值。
这里某个栅格核密度的值是3478,你能说这个3478表示这个小时的真实人数?
xxx,详细内容见说明文档。
这个值能代表真实的这个小时内街道的人数吗?
xxx,详细内容见说明文档。
你就看你同类型研究是不是用的都是百度热力图数据,如果是,你就也用。如果不是,你能低价买到别的数据吗?能就买别的数据,不能就百度热力图。不要没有别的数据还挑挑拣拣。
你如果做相关性/影响机制的研究,核密度值完全没问题,他确实能反映聚类中心,热力中心。
建议大家在出图的时候,xxx,如下面这些文章。

没空复制

论文中怎么写这个值,建议看下论文,常见的写法
xxx,详细内容见说明文档。

3.1.2 Csv->shp->tif是常规的数据处理流程,可以不这么处理吗?

xxx,详细内容见说明文档。

3.1.3 Bd09mc即百度墨卡托投影坐标系200单位的距离是可以自己设置的吗?

系统内置的是200米,这个没法调整的,官方就是这样设置的200单位

3.1.4 实际采样点是什么样?

实际的采样点是全覆盖,像下图,非常密集。
在这里插入图片描述

全采样点示例
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/bd6c8002e47047eab17607b439dafe00.png#pic_center =500x)
放大后,采样点及采样点间距离
在WGS84坐标系中,两个采样点的实际距离约为185m,半径约92.5m。即92.5m x 92.5m围成的方格内每小时定位的总和汇总到采样点。

3.1.5 有些地方没有采样点是什么原因?

在这里插入图片描述

以某一时刻深圳数据为例,csv转shp后,为什么有空白?
是因为这个采样点value为0,没有存储,要不然会造成文件冗余。

4、csv文件字段说明

在这里插入图片描述
转化关系:bd09mc->bd09->wgs84。怎么转不重要,直接用wgs84就行了。

原始数据样式如下:
bd09mc_X,bd09mc_Y:百度墨卡托坐标系(为投影坐标系)横纵轴坐标,以上面黄色区域质心为例,对应的坐标为“11592300,3564500”;
value:该时段内质心点对应区域内调用定位的终端数统计数,单位:次;
bd09_LNG,bd09_LAT:百度坐标系(为地理坐标系)横纵轴坐标;
wgs84_LNG,wgs84_LAT:WGS 1984坐标系(为地理坐标系,EPSG:4326)横纵轴坐标;
gcj02_LNG,gcj02_LAT: GCJ-02坐标系(也称:火星坐标系,为地理坐标系)横纵轴坐标。

4、Arcgis,QGIS软件数据处理教程(最近太忙后续更新)

4.1、Arcgis篇操作

这我朋友写的博文,百度热力图arcgis数据处理

从我这里买数据,送详细说明文档,文档写完了,但是没空复制到这里,调格式调半天。
xxx,详细内容见说明文档。
在这里插入图片描述

4.2、QGIS篇操作

从我这里买数据,送详细说明文档,文档写完了,但是没空复制到这里,调格式调半天。
xxx,详细内容见说明文档。

5、Arcgis PRO 百度热力图数据处理流程!!!

PS:提供批量处理数据服务!直接给你栅格数据,需要可以邮箱联系。帮你省去下面这么多繁琐的步骤。

(1)csv数据可视化!!!

在这里插入图片描述

1.添加数据

在这里插入图片描述

2.选择csv 或者csv拖拽进来,这里就可以直接选了

在这里插入图片描述

3.经纬度,坐标系,选择保存位置,保存名称
或者直接在搜索栏搜索:“XY表转点”

在这里插入图片描述

4.搜索栏搜索:“XY表转点”

(2)为什么要投影?

投影能更准确地处理空间分析中的距离和面积计算。
• 地理坐标系(经纬度):经纬度表示的是角度,而不是实际距离。因此,在地理坐标系中直接进行距离或面积计算会导致误差。
• 投影坐标系(米/公里):投影坐标系将地球的曲面展开为平面,单位通常为米或公里,可以直接用于空间分析。
核密度分析需要计算点与点之间的距离,并基于距离分布生成密度图。如果不进行投影,分析结果的精度会受到影响,特别是在大范围地区分析时。小范围实际影响不大。出于准确性考虑,投影。

(3)UTM投影的选择(地区->投影带)

UTM投影的选择(地区->投影带)
在这里插入图片描述

投影带选择,直接代公式

(4)投影,转投影坐标系

在这里插入图片描述

1.直接搜投影,输出坐标系点那个“地球”图表,选投影看下图。
!哎呦,新发现,可以直接输入坐标系:WGS_1984_UTM_Zone_50N

在这里插入图片描述

2.投影坐标系-》UTM

在这里插入图片描述

3. UTM-》WGS84-》Northern Hemisphere

在这里插入图片描述

4. 找到自己的投影带

(5)核密度分析

在这里插入图片描述

1.直接搜

在这里插入图片描述

2.步骤

在这里插入图片描述

3.看效果

在这里插入图片描述

4.符号系统

在这里插入图片描述

5.效果

6、核密度分析的数学原理

xxx,详细内容见说明文档。

7、是否需要根据研究区进行裁剪?

xxx,详细内容见说明文档。

8、核密度输出栅格大小,搜索距离怎么选?

xxx,详细内容见说明文档。

9、常见应用

9.1 用途(空间结构研究,城区职住关系,人群聚集时空分析,XX活力测度)

其中,城市规划领域对于百度热力图做了较多的探索。比如有:吴志强基于热力图进行上海中心城区的空间结构研究;冷炳荣利用热力图进行重庆市主城区职住关系的剖析;王录仓基于热力图对武汉市主城区城市人群聚集程度进行的时空分析;周雨霏基于热力图的轨道交通站点服务区活力测度研究等等。

9.2 求周中平均/周末平均/周平均/日平均活力强度

xxx,详细内容见说明文档。

9.3 时间序列

xxx,详细内容见说明文档。

10、活力计算/相关论文

2024 黄志强 基于多源大数据的街道空间品质测度及其对街道 活力的影响*——以广州历史城区为例

热力图等级。xxx,详细内容见说明文档。

2021 司睿 基于街景数据的建成环境与街道活力时空分析 —以深圳福田区为例

涉及面积。和除于栅格区别不大。xxx,详细内容见说明文档。

xxx。

xxx,详细内容见说明文档。
太多了,复制不过来,调格式太繁琐。


11、其他数据处理/程序/指导!!!

直接看PDF吧,搬过来调格式类似了。
通过网盘分享的文件:v1.1 数据_代码_指导.pdf
链接: https://pan.baidu.com/s/1E93QTFcdl7DQjCYZW1Kj2Q?pwd=GGGX 提取码: GGGX

目录:GIS数据处理/程序/指导,街景百度热力图POI路网建筑物AOI等

  1. 百度热力图指导,买数据提供指导,含详细说明文档。链接0-数据介绍:百度慧眼百度热力图数据处理,可直接用于论文。链接1-原理及应用:百度热力图数据获取,原理,处理及论文应用-CSDN博客 。链接2-Pro操作:百度热力图数据处理流程Arcgis PRO篇,Arcgis,QGIS见链接其他文章-CSDN博客。

  2. 多模型(含全部树模型)分类回归精度结果对比(回复审稿人意见之:为什么选某个模型?比如为什么选XGBoost?)。

    回归模型:线性模型(Linear、Ridge 、Lasso、Huber 、Partial Least Squares),KNN,SVR,树模型(Decision Tree、RF、AdaBoost 、GBDT、XGBoost、LightGBM 、CatBoost )。可自定义增加。
    分类模型:Logistic Regression、Naive Bayes、KNN、SVM、树模型(Decision Tree、RF、AdaBoost 、GBDT、XGBoost、LightGBM 、CatBoost )可自定义增加。
    
  3. 树模型-SHAP分析,上一步选模型,这一步用模型进行分析。

  4. GCN用于街道研究,如GCN实现街道功能分类。

  5. 树模型-SHAP分析,上一步选模型,这一步用模型进行分析。

  6. 街景语义分割后像素提取,指标计算代码(绿视率、天空开阔度、界面围合度、视觉熵/景观多样性等),含详细说明文档。deeplabv3+街景图片语义分割,无需训练模型,看不懂也没有影响,直接使用,cityscapes数据集。

  7. 街景主观感知两两对比程序(数据集生成,自定义每张图片出现次数,提示剩余总对比次数,对比程序!最少对比次数,最高的效率。街景主观感知1:街景图片两两对比程序),TrueSkill计算beautiful、safer等维度主观感知评分(原理,代码)均含详细说明文档。街景两两对比程序,Trueskill计算评分代码,训练模型,预测街景。

  8. 街景主观感知训练,预测模型(beautiful, safer等自定义维度),多模型对比(ResNet50,ResNet101,EfficientNet、VGGNet、GoogleNet、DenseNet、MobileNet、ShuffleNet、Xception、ConvNeXt、Vision Transformer (ViT)、RegNet等),beautiful和safer维度精度均达到0.89。街景两两对比程序,Trueskill计算评分代码,训练模型,预测街景。

  9. 街景图片色彩聚类。

  10. 全国街景数据。

  11. OSM路网简化指导(详细说明文档,双线变单线,fclass选择,拓扑检查,短道路处理)。

  12. POI数据,重分类,各种密度,各种比例,功能混合度/熵/多样性计算。

  13. 建筑物各种指标计算(建筑密度,容积率)。

  14. 坐标系转化代码(bg09,wgs84,Gcj02等各种地理,投影转化)。

  15. 2019-2024年最新全国四级行政区划矢量数据shp 省市县乡镇

  16. 全国村级行政区划shp数据,村级矢量行政区划界线!

  17. MIT Place Pulse 2.0数据集
    18.街景全景图切分六面视图(含数据处理教程,可批量处理)

  18. GIS相关处理,指标计算,街道街区相关,活力相关,街道品质相关。

邮箱:邮箱已设置自动回复!!!随意发送邮件即可获得联系方式。437969428@qq.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9860.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文阅读(九):通过概率图模型建立连锁不平衡模型和进行关联研究:最新进展访问之旅

1.论文链接:Modeling Linkage Disequilibrium and Performing Association Studies through Probabilistic Graphical Models: a Visiting Tour of Recent Advances 摘要: 本章对概率图模型(PGMs)的最新进展进行了深入的回顾&…

安装zsh并美化

0 Zsh 是一种功能强大的 shell,通常用于替代默认的 Bash shell。它为命令行提供了更多的功能,例如自动补全、强大的模式匹配和主题支持等。 Oh My Zsh 是用于管理 Zsh 配置的框架。 powerlevel10k是样式,通过p10k configure脚本可以调节自己…

最新-CentOS 7 基于1 Panel面板安装 JumpServer 堡垒机

CentOS 7 基于1 Panel面板安装 JumpServer 堡垒机 一、前言二、设备要求三、环境要求四、安装4.1 环境安装4.2 JumpServer安装4.3 访问JumpServerWeb端,进行登录 五、登录Web控制台 一、前言 JumpServer是广受欢迎的开源堡垒机。运维必备神器!JumpServe…

跨境数据传输问题常见解决方式

在全球化经济的浪潮下,跨境数据传输已然成为企业日常运营的关键环节。随着数字贸易的蓬勃发展和跨国业务的持续扩张,企业在跨境数据处理方面遭遇了诸多棘手难题。那么,面对这些常见问题,企业该如何应对?镭速跨境数据传…

OpenEuler学习笔记(十七):OpenEuler搭建Redis高可用生产环境

在OpenEuler上搭建Redis高可用生产环境,通常可以采用Redis Sentinel或Redis Cluster两种方式,以下分别介绍两种方式的搭建步骤: 基于Redis Sentinel的高可用环境搭建 安装Redis 配置软件源:可以使用OpenEuler的默认软件源&#…

【编译原理实验二】——自动机实验:NFA转DFA并最小化

本篇适用于ZZU的编译原理课程实验二——自动机实验:NFA转DFA并最小化,包含了实验代码和实验报告的内容,读者可根据需要参考完成自己的程序设计。 如果是ZZU的学弟学妹看到这篇,那么恭喜你,你来对地方啦! 如…

我的2024年博客总结(在工作、博客和生活中找到自己的生活节奏)

文章目录 ⭐前言⭐工作和博客的关联⭐找到自己的生活节奏⭐结束 ⭐前言 大家好,我是yma16,本文主要写2024年博客总结,关于在工作、博客和生活中找到自己的生活节奏。 node系列往期文章 node_windows环境变量配置 node_npm发布包 linux_配置…

RDK X5运行DeepSeek-R1-Distill-Qwen-1.5B,体验长思维链的语言大模型!

简介 本文介绍了在RDK X5上,如何从HuggingFace的原始模型权重(safetensors)经过量化和编译,的到llama.cpp推理框架所需要的GGUF格式的模型,然后演示了如何使用llama.cpp运行量化后的DeepSeek-R1-Distill-Qwen-1.5B模型…

巴塞尔问题详解:计算所有正整数平方的倒数之和

1 相关历史背景 巴塞尔问题(Basel Problem)是数学史上一个著名的问题,由意大利数学家皮埃特罗门戈利(Pietro Mengoli)在1644年首次提出。 但他未能解决,只能给出小数点后六位的近似解是1.644934&#xff0…

神经网络和深度学习

应用 类型 为什么近几年飞速发展 数据增长,算力增长,算法革新 逻辑回归 向量化 浅层神经网络(Shallow neural network) 单条训练数据前向传播计算表达式 batch训练数据前向传播计算表达式 反向传播计算表达式 参数随机初始化 不能全部设为0 原因是同一…

python3+TensorFlow 2.x(三)手写数字识别

目录 代码实现 模型解析: 1、加载 MNIST 数据集: 2、数据预处理: 3、构建神经网络模型: 4、编译模型: 5、训练模型: 6、评估模型: 7、预测和可视化结果: 输出结果&#xff…

AI大模型开发原理篇-8:Transformer模型

近几年人工智能之所以能迅猛发展,主要是靠2个核心思想:注意力机制Attention Mechanism 和 Transformer模型。本次来浅谈下Transformer模型。 重要性 Transformer模型在自然语言处理领域具有极其重要的地位,为NLP带来了革命性的突破‌。可以…

探索性测试与自动化测试的结合

随着软件开发周期的不断缩短和质量要求的不断提高,测试行业正在经历一场深刻的变革。自动化测试因其高效性和可重复性成为测试团队必不可少的工具,而探索性测试(Exploratory Testing, ET)则因其灵活性和创意性在面对复杂、动态变化…

C28.【C++ Cont】顺序表的实现

🧨🧨🧨🧨🧨🧨🧨🧨🧨初二篇🧨🧨🧨🧨🧨🧨🧨🧨🧨 目录 1.知识回顾…

【Redis】 String 类型的介绍和常用命令

1. 介绍 Redis 中的 key 都是字符串类型Redis 中存储字符串是完全按照二进制流的形式保存的,所以 Redis 是不处理字符集编码的问题,客户端传入的命令中使用的是什么编码就采用什么编码,使得 Redis 能够处理各种类型的数据,包括文…

QT设置应用程序图标

在线将png等图片转换成:在线生成透明ICO图标——ICO图标制作https://www.ico51.cn/ 将转换成的.ico图片添加到资源文件:

【视频+图文详解】HTML基础3-html常用标签

图文教程 html常用标签 常用标签 1. 文档结构 <!DOCTYPE html>&#xff1a;声明HTML文档类型。<html>&#xff1a;定义HTML文档的根元素。<head>&#xff1a;定义文档头部&#xff0c;包含元数据。<title>&#xff1a;设置网页标题&#xff0c;浏览…

回顾:Maven的环境搭建

1、下载apache-maven-3.6.0 **网址:**http://maven.apache.org 然后解压到指定的文件夹&#xff08;记住文件路径&#xff09; 2、配置Maven环境 复制bin文件夹 的路径D:\JavaTool\apache-maven-3.6.0\bin 环境配置成功 3、检查是否配置成功 winR 输入cmd 命令行输入mvn -v…

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.30 性能巅峰:NumPy代码优化全攻略

1.30 性能巅峰&#xff1a;NumPy代码优化全攻略 目录 #mermaid-svg-CMVXy3CN2tNmW8RJ {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-CMVXy3CN2tNmW8RJ .error-icon{fill:#552222;}#mermaid-svg-CMVXy3CN2tNmW8RJ …

白嫖DeepSeek:一分钟完成本地部署AI

1. 必备软件 LM-Studio 大模型客户端DeepSeek-R1 模型文件 LM-Studio 是一个支持众多流行模型的AI客户端&#xff0c;DeepSeek是最新流行的堪比GPT-o1的开源AI大模型。 2. 下载软件和模型文件 2.1 下载LM-Studio 官方网址&#xff1a;https://lmstudio.ai 打开官网&#x…