ArcGIS空间自相关Moran‘s I——探究人口空间格局的20年变迁

先了解什么是莫兰指数?

莫兰指数(Moran's I)是一种用于衡量空间自相关性的统计量,即它可以帮助我们了解一个地理区域内的观测值是否彼此相关以及这种相关性的强度和方向。

莫兰指数分类:

  • 全局莫兰指数 (Global Moran's I):用于检测整个研究区域内观测值的空间自相关性。如果全局莫兰指数显著不为零,则表明整个区域的数据点在空间上不是随机分布的。
  • 局部莫兰指数 (Local Moran's I):由 Luc Anselin 教授在 1995 年提出,用于识别特定位置及其邻域的空间自相关性。这有助于识别热点(高值聚集区)、冷点(低值聚集区)或异常值等局部模式。

莫兰指数的取值范围:

  • Moran's I 值范围在(-1,1)之间。Moran's I >0表示空间正相关性,其值越大,空间相关性越明显。Moran's I <0表示空间负相关性,其值越小,空间差异越大,否则,Moran's I = 0,空间呈随机性

应用场景:

  • 在地理信息系统 (GIS) 中,莫兰指数常常被用来分析诸如人口密度、疾病分布、环境污染等现象的空间分布模式。

本篇文章着重介绍全局莫兰指数 (Global Moran's I),通过人口普查数据来看我们人口分布在空间上的相关性,我们这里用了2000-2020年这20年的三次人口普查数据,数据来源国家统计局:普查数据 - 国家统计局 (stats.gov.cn),

我们打开工具箱,在【空间统计工具】——>【分析模式】——>【空间自相关】;

输入要分析的图层和需要判断空间相关性的要素字段,另外最好勾选生成报表,这样我们对空间自相会有直观的了解,空间关系的概念化选:INVERSE_DISTANCE 意为:与远处的要素相比,附近的邻近要素对目标要素的计算的影响要大一些,更多空间关系类型可以参考官方文档:

空间自相关 (Global Moran's I) (空间统计)—ArcMap | 文档 (arcgis.com),标准化选:ROW,通常,Global Moran's I 指数介于 -1.0 到 1.0 之间。是只有对我们权重进行了行标准化(时才会这样。如果没有对权重进行行标准化处理,则指数值可能会落在-1.0 到 1.0 的范围之外;

点击确定,生成结果会在下面这个文件夹路径生成,每个人的默认保存路径不同,可以自行查看;

打开这个MoransI_Result.html 的文件,该文件将在默认的浏览器中打开,我们可以看到五个值:Moran's I 指数、预期指数、方差、z 得分及 p 值,

Moran's I 指数、z 得分及 p 值三个值的关系到底怎么看,先看谁?

  • p 值用于判断空间自相关性的显著性,帮助我们决定数据是否可以用;
  • z 值用于评估 Moran's I 指数与预期随机分布之间的偏差程度,帮助我们了解数据在空间上是否有聚集或离散的趋势;
  • Moran's I 指数本身用于量化空间自相关性的强度,帮助我们确定数据是正相关还是负相关。

我们把关注点放在三个值上Moran's I 指数、z 得分及 p 值,我们先看p值;

p 值是在假设检验中用来评估结果的统计显著性的关键指标。在 Moran's I 指数中,p 值用于测试数据是否存在空间自相关性,那我们怎么测试,我们首先要有预期假设,在计算之前我们假设研究区域内的要素之间是随机分布,没有相关性,也就是零假设;

零假设

零假设:所分析的属性在研究区域内的要素之间是随机分布的。

说明在零假设条件下,空间内所分析的属性是不存在自相关性的。在该假设条件下,通过p值和z得分来判断是否拒绝零假设,若拒绝则表明空间中所分析的属性存在自相关性。

p 值

当 p 值小于某个显著性水平(例如 0.1 或 0.01),我们拒绝原假设,这意味着数据中存在空间自相关性,并且这种自相关性不太可能是由随机性造成的。具体来说:

  • 如果 p < 0.1,我们可以说在 90% 的置信水平上拒绝原假设,即数据具有空间自相关性。
  • 如果 p < 0.01,我们可以说在 99% 的置信水平上拒绝原假设,即数据具有高度的空间自相关性。
  • 如果 p > 0.1,我们接受原假设,即数据不具有空间自相关性。

好,新的名词置信水平是什么意思?

置信水平是用来表示对一个估计值的信心程度的概念,通常以百分比的形式表示。常见的置信水平包括:

  • 90%置信水平: 表示我们有90%的信心认为真实的参数值位于计算出的置信区间内。
  • 99%置信水平: 表示我们有99%的信心认为真实的参数值位于计算出的置信区间内。这个置信水平更高,对于一些要求较高置信度的研究或决策可能会选择使用。

也就是拒绝原假设的信心程度,p < 0.01,即我有99%的信心认为空间中所分析的属性存在自相关性;

z得分

z得分用于衡量观测值与预期值之间的差距。z得分(scores)表示标准差的倍数:

  • 当 z > 1.65 时,这通常意味着 Moran's I 指数显著高于随机分布的预期值,数据呈现出聚集分布。
  • 当 z < -1.65 时,这通常意味着 Moran's I 指数显著低于随机分布的预期值,数据呈现出离散分布。
  • 当 z 在 -1.65 和 1.65 之间时,这通常意味着 Moran's I 指数接近随机分布的预期值,数据呈现出随机分布。

Moran's I 指数本身

Moran's I 指数的值本身提供了关于空间自相关性的强度信息。即使 p 值通过了显著性检验,Moran's I 的值也可以很小,这仅表示存在一定程度的空间效应。然而,当 Moran's I 的值大于 0.2 或者小于 -0.2 时,这表明数据具有明显的空间自相关性。换句话说:

  • 如果 Moran's I 接近 +1,表示正的空间自相关性非常强,相邻的数据点有相似的值。
  • 如果 Moran's I 接近 -1,表示负的空间自相关性非常强,相邻的数据点有截然不同的值。
  • 如果 Moran's I 接近 0,表示数据点之间的值没有明显的关系,接近于随机分布。

那说了这么多,图上的3这个值合起来代表什么意思?

  1. Moran's I 指数: 这里显示的值为0.049936,这是计算得到的 Moran's I 指数。这个指数用于度量空间数据的自相关性,指数值接近于零,表明数据点之间的关系并不强烈,但仍然显示出一定的正向空间自相关性(因为该值为正)。
  2. z 得分: 这里的值为0.952106,它是将 Moran's I 指数转换成标准单位后的得分。z 在 -1.65 和 1.65 之间,因此我们可以推断出数据集中的空间自相关性并不显著。
  3. p 值: 这里的值为0.341043,这是进行假设检验后得出的概率值。我们看p值符合那个标准,p > 0.1,因此我们不能拒绝原假设(即数据是随机分布的),从而无法确认数据存在空间自相关性。

结论就是2020年七普人口数据在空间上不具有空间自相关性。

我们回归主题,再来看一下2010年六普的Moran's I 指数;

2000年五普的Moran's I 指数;

结论

我们通过3次的人口普查数据,可以发现虽然每次对单一年份人口普查数据做空间相关性分析得到的结果都是在空间上无法确认数据存在空间自相关性,但是从Moran's I 指数值上我们可以看出数据集整体表现出轻微的正向空间自相关性,且这种空间自相关性在逐渐减弱,20年间由0.089462减少到0.049936,那造成这些因素的可能的原因是哪些呢?

  1. 随着户籍制度的淡化,人口可以在不同城市和地区之间更加自由地迁移,这可能导致人口分布更加均匀,减少特定地区的人口密集程度,从而降低空间自相关性。

  2. 公共服务均等化:随着公共服务的均等化,这可能会减少城乡之间在教育、医疗、社会保障等方面的差距,从而影响人们的选择居住地点的决策,使人口分布更加均衡。

  3. 劳动力市场的变化:随着户籍限制的放松,劳动力可以在不同地区之间更加自由地流动,这可能会导致劳动力市场更加灵活,减少因户籍因素造成的人力资源分布不均的现象。

文末放一下原始数据:【免费】2024全国行政区边界(省、市、县)资源-CSDN文库

【免费】人口普查数据(五、六、七普)资源-CSDN文库

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/404572.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聊聊如何利用ingress-nginx实现应用层容灾

前言 容灾是一种主动的风险管理策略&#xff0c;旨在通过构建和维护异地的冗余系统&#xff0c;确保在面临灾难性事件时&#xff0c;关键业务能够持续运作&#xff0c;数据能够得到保护&#xff0c;从而最大限度地减少对组织运营的影响和潜在经济损失。因此容灾的重要性不言而…

zabbix实战-磁盘空间告警

1.创建监控项 选择&#xff1a;键值&#xff1a;vfs.fs.size[fs,<mode>] 。 直接写 vfs.fs.size[fs,<mode>]是不出数据的。我们要写具体的值 &#xff1a;vfs.fs.size[/,free] &#xff0c;这个表示查看根的剩余空间。 2.创建图形 为磁盘剩余空间监控项创建图形&am…

redis 遍渐进式历

1.scan cursor [match pattern] [coutn] [type]:以渐进式的方式进行建的遍历 cursor:是光标 指向当前遍历的位置 设置成0表示当前从0开始获取 math parttern &#xff1a;和keys命令一样的 keys * count: 限制一次遍历能够获取到多少个 元素默认是10 type :这次遍历只想获取…

[Python学习日记-10] Python中的流程控制(if...else...)

[Python学习日记-10] Python中的流程控制&#xff08;if...else...&#xff09; 简介 缩进 单分支 双分支 多分支 练习 简介 假如把写程序比做走路&#xff0c;那我们到现在为止&#xff0c;一直走的都是直路&#xff0c;还没遇到过分叉口&#xff0c;想象现实中&#x…

【python】Python实现XGBoost算法的详细理论讲解与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

Python编码系列—Python数据可视化:Matplotlib与Seaborn的实战应用

&#x1f31f;&#x1f31f; 欢迎来到我的技术小筑&#xff0c;一个专为技术探索者打造的交流空间。在这里&#xff0c;我们不仅分享代码的智慧&#xff0c;还探讨技术的深度与广度。无论您是资深开发者还是技术新手&#xff0c;这里都有一片属于您的天空。让我们在知识的海洋中…

Ps:首选项 - 单位与标尺

Ps菜单&#xff1a;编辑/首选项 Edit/Preferences 快捷键&#xff1a;Ctrl K Photoshop 首选项中的“单位与标尺” Units & Rulers选项卡允许用户根据工作需求定制 Photoshop 的测量单位和标尺显示方式。这对于保持工作的一致性和精确性&#xff0c;尤其是在跨设备或跨平台…

专题--自底向上的计算机网络(物理层)

目录 计算机网络概述 物理层 数据链路层 网络层 运输层 应用层 网络安全 详细见http://t.csdnimg.cn/MY5aI http://t.csdnimg.cn/8Ipa4 http://t.csdnimg.cn/uvMxS 信道复用技术不仅在物理层有运用&#xff0c;在数据链路层也确实需要信道复用技术。‌ 数据链路层是…

第N8周:使用Word2vec实现文本分类

本文为365天深度学习训练营 中的学习记录博客原作者&#xff1a;K同学啊 一、数据预处理 任务说明: 本次将加入Word2vec使用PyTorch实现中文文本分类&#xff0c;Word2Vec 则是其中的一种词嵌入方法&#xff0c;是一种用于生成词向量的浅层神经网络模型&#xff0c;由Tomas M…

隐语隐私计算实训营「数据分析」第 5 课:隐语PSI介绍及开发实践

深入理解隐语(SecretFlow)中的PSI技术 隐私集合求交(Private Set Intersection, PSI)是隐私计算中的一个重要技术,它允许多方在不泄露自己数据的前提下找出共同的数据交集。在本文中,我们将深入探讨SecretFlow(隐语)中PSI的实现和应用。 PSI的基本概念 PSI是一种特殊的安全多…

鸿蒙内核源码分析(时钟任务篇)

时钟概念 时间是非常重要的概念&#xff0c;我们整个学生阶段有个东西很重要,就是校园铃声. 它控制着上课,下课,吃饭,睡觉的节奏.没有它学校的管理就乱套了,老师拖课想拖多久就多久,那可不行,下课铃声一响就是在告诉老师时间到了,该停止了让学生HAPPY去了. 操作系统也一样&…

php源码编译与初始化

1 php源码编译 解压 yum install -y bzip2 # 安装解压工具 tar -xf php-7.4.12.tar.bz2 # 解压文件./condigure ./configure --prefix/usr/local/php --with-config-file-path/usr/local/php/etc --enable-fpm --with-fpm-usernginx --with-fpm-groupnginx --with-curl --wi…

线程面试题

1.JDK自带的线程池有哪些&#xff1f; 2.线程池中核心线程数与最大线程数与缓冲任务队列的关系&#xff1f; 先使用核心线程执行任务。 当核心线程不足时&#xff0c;新任务入队列等待。 当队列满且线程数未达最大值时&#xff0c;增加非核心线程执行任务。 当队列满且线程…

Leetcode每日刷题之209.长度最小的子数组(C++)

1.题目解析 根据题目我们知道所给的数组均是正整数&#xff0c;我们需要找到的是该数组的子数组&#xff0c;使其子数组内所有元素之和大于或等于给出的目标数字target&#xff0c;然后返回其长度&#xff0c;最终找出所以满足条件的子数组&#xff0c;并且要返回长度最小的子数…

网络硬盘录像机NVR程序源码海思3520D NVR 安防监控智能升级运用方案

随着安防技术的不断发展&#xff0c;传统的监控系统正逐步向智能化方向转变。海思Hi3520D作为一款高性能的网络视频处理芯片&#xff0c;在NVR&#xff08;网络视频录像机&#xff09;领域有着广泛的应用。本方案旨在探讨如何利用海思Hi3520D芯片的强大功能对现有的NVR系统进行…

vue2使用天地图

需求&#xff1a;用vue2使用天地图展示对应点位数据以及开发中出现的问题等&#xff0c;其实天地图的写法和百度地图差不多 注意&#xff01;&#xff01;&#xff01;天地图的接口不稳定&#xff0c;时常报错418&#xff0c;官网也是一样的情况&#xff0c;推荐还是使用百度或…

C++:C/C++的内存管理

目录 C/C内存分布 C语言中动态内存管理方式 C内存管理方式 new/delete操作内置类型 new/delete操作自定义类型 operator new与operator delete函数 new和delete的实现原理 定位new表达式 常见问题 malloc/free和new/delete的区别 内存泄漏 C/C内存分布 我们先来看以…

【机器学习】(基础篇七) —— 神经网络

神经网络 神经网络是一种模仿人脑神经元结构的计算模型&#xff0c;用于处理复杂的数据模式识别和预测问题。它由大量简单的处理单元&#xff08;称为“神经元”或“节点”&#xff09;组成&#xff0c;这些单元通过连接权重相互连接。神经网络可以学习从输入数据到输出结果之…

GitLab Merge Request流水线

GitLab Merge Request 流程文档 为了提升代码质量&#xff0c;让开发人员参与代码review&#xff0c;现在输出Merge Request的流程文档&#xff1a; 1.项目创建各自开发者的分支&#xff0c;命名规则是dev_名字首字母&#xff0c;比如我是dev_cwq.然后把本地分支推到远端orgin…

2024.8.19 学习记录 —— 作业

一、TCP机械臂测试 #include <myhead.h>#define SER_PORT 8888 // 与服务器保持一致 #define SER_IP "192.168.0.114" // 服务器ip地址int main(int argc, const char *argv[]) {// 创建文件描述符打开键盘文件int fd open("/dev/input/event1…