以1.7K深圳小区房价为例,浙大GIS实验室使用注意力机制挖掘地理情景特征,提升空间非平稳回归精度

地理加权回归 (Geographically Weighted Regression, GWR) 是一种广泛应用于地理空间分析的统计方法,用于捕捉地理现象的空间非平稳性(即空间异质性)。传统 GWR 通过为每个观测点分配权重来反映其对回归参数的影响,这些权重通常基于空间距离(如欧几里得距离)来计算,遵循「距离越近,影响越大」的原则。然而,这种基于距离的方法忽略了地理现象中复杂的情境相似性 (context similarity), 例如社会经济因素或环境特征的相似性,这些因素可能对回归模型产生重要影响。例如,在城市环境中,两个相距较远的区域可能因相似的交通便利性、人口结构等社会经济或环境因素而表现出相似的房价特征。

为了解决这一问题,浙江省 GIS 重点实验室的研究人员提出了一种基于注意力机制的深度学习模型 Context-Attention Geographically Weighted Regression (CatGWR)。 该模型通过引入注意力机制,将样本之间的空间距离和情境相似性相结合,从而更准确地估计空间非平稳性。这一创新为地理空间建模提供了新的视角,尤其是在处理复杂地理现象时,能够更好地捕捉空间异质性和情境影响。

在这里插入图片描述

相关成果以「Using an attention-based architecture to incorporate context similarity into spatial non-stationarity estimation」为题,发布于 International Journal of Geographical Information Science。

研究亮点:

  • CatGWR 模型引入了注意力机制来计算样本之间的情境相似性,可以有效地避免情景特征中的噪声干扰,得到更精准的相似性表达。

  • CatGWR 模型在模拟和实证数据集上具有显著的精度提升,并可提供更细致的解释方向。

在这里插入图片描述

论文地址:
https://doi.org/10.1080/13658816.2025.2456556
项目开源地址:
https://github.com/yorktownting/CatGWR

数据集:模拟实验与实际案例结合

本文通过模拟实验和实际案例研究验证了 CatGWR 模型的有效性。模拟实验使用了 2 个 64×64 的合成数据集(S1 和 S2),分别设计了包含情境异质性和仅空间异质性的场景。 这些数据集通过模拟的情境属性(如空间异质性特征和随机分布特征)来构建回归关系,从而为模型性能评估提供了可控的实验环境。

实际案例研究则以中国深圳的房价数据为例。 深圳作为中国快速城市化的典型代表,房价表现出显著的空间异质性。研究数据包括 1,776 个住宅小区的房价样本,以及 7 个与房价相关的独立变量(如建筑年代、管理费、绿化率等)。此外,研究还引入了 6 维的出租车载客数据作为情境特征,这些数据能够反映城市动态和人类活动模式,为模型提供了丰富的空间和情境信息。

模型架构:情景注意力驱动的地理加权回归

CatGWR模型使用加性注意力机制计算地理情景相似性,并将之与空间距离权重相结合。模型分为 3 个模块:预处理模块(Preprocessor Module)、放大模块(Amplifier Module)和回归模块(Regression Module)。 如下图所示:

在这里插入图片描述

CatGWR 的结构设计

(a) 预处理模块: 负责提取输入数据中的因变量、自变量和情境特征,并计算每个样本与其邻域内的空间权重矩阵和空间联通矩阵。

(b) 放大模块: 扩展模型的感受野,增强模型对邻域信息的利用。

© 回归模块: 通过注意力机制计算样本间的情境相似性,并将其与空间权重矩阵结合得到情景化空间权重;利用多层感知机(MLP)将情境化的空间权重转换为回归系数,从而实现对空间非平稳性的估计。

实验结论:揭示深圳房价决定因素的空间非平稳性

本文通过模拟实验和深圳房价实证研究验证了 CatGWR 模型的有效性。 在模拟实验中,首先模拟生成 4 个地理情景的特征变量 (Contextual Variables),并使用生成的特征变量,进一步构建 2 组模拟数据集:S1(特征变量作为系数的一部分参与数据集生成)和 S2(特征变量和回归关系无关,成为输入 CatGWR 的噪声)。实验结果表明:

在情景化场景 (S1) 中, CatGWR 可以更准确的解算情景相似性,并有效地将其与空间邻近性耦合,其表现显著优于 GWR、MGWR、CGWR 和 GNNWR 等现有模型。

在非情景化场景 (S2) 中, 即使引入了与数据集无关的「情景变量」作为噪声,由于 CatGWR 所使用的注意力机制的鲁棒性,其表现仍不弱于传统 GWR 模型。

在这里插入图片描述

CatGWR 在模拟数据集上的对比试验结果

在深圳房价数据集上,CatGWR 模型进一步证明了其优越性。 与现有模型相比,CatGWR 在训练集上的 R² 值从 0.853 提升至 0.920,预测集上的 R² 值从 0.717 提升至 0.764,RMS E和 MAE 分别降低了 28% 和 26%。

此外,CatGWR 模型还揭示了深圳房价决定因素的空间非平稳性, 例如在深圳湾附近,受深港西部通道带来的深港通勤居民的影响,配套停车位数量对房价的影响相比其他区域更为显著。同时,样本间情景化空间权重的「距离相近但权重相异」的特点也反映了深圳市的城市建设和分区特点。这表明 CatGWR 能够有效捕捉空间异质性和情景相似性对房价的影响。

在这里插入图片描述

情景化权重差异及其反映的深圳市的城市建设和分区特点

  • 特别经济区建设导致的城郊差异(相近物理距离下权重A-E > A-D,A-C > A-B)

  • 用地类型(卫星城-风景区)的差异(F-H > F-L,F-G > F-L)

CatGWR 模型通过引入注意力机制,成功将情景相似性与空间邻近性相结合,显著提升了空间非平稳性建模的精度和鲁棒性。 该模型不仅在模拟数据上表现出色,还在实际应用中展现了强大的拟合能力,为地理过程建模提供了新的思路和方法。

借房价预测,对地理过程进行科学性解释

2024 年 4 月,浙江省 GIS 实验室的研究团队也曾在 International Journal of Geographical Information Science 上发表一篇同一研究领域的成果, 将神经网络优化的空间邻近性度量与地理神经网络加权回归方法 (Geographically Neural Network Weighted Regression, GNNWR) 进一步结合,构建了 osp-GNNWR 模型,通过解算因变量与自变量的空间非平稳回归关系实现神经网络的训练。
论文链接:
https://www.tandfonline.com/doi/full/10.1080/13658816.2024.2343771

点击查看完整报道:浙大GIS实验室提出osp-GNNWR模型:准确描述复杂空间过程和地理现象

无独有偶,该研究是以武汉房地产数据为例展开研究与验证,实验结果表明,osp-GNNWR 模型在描绘现实世界地理过程中的空间异质性方面具有潜在的优势。

该研究的作者浙江大学遥感与地理信息系统博士生丁佳乐, 曾在一次线上学术分享中介绍道,「身为一个地理科学的探索者,如果我们推出的模型只能简单预测房价,那这样的成果在我看来是无趣的。我们追求的是,借助这些模型输出的一系列随空间位置而变化的回归系数,来对地理过程或者地理模式做出合理的科学解释,这样的研究才更具有实用性」。

诚然,地球科学的相关研究或隐秘于市井高楼之间,或远航于山川湖海之巅,但最终都将落于这片土地,帮助人们更好地理解地理过程,挖掘地理现象背后的意义。近年来,随着观测技术的不断进步,地球科学领域的时空数据呈现爆炸式增长,这也进一步促进了 AI 等新兴技术在地球科学领域的落地实践。

浙江省 GIS 重点实验室作为 AI 与地球科学交叉学科研究的先锋团队, 将传统地理加权回归的理念与神经网络技术相结合,提出了一系列创新模型,包括地理神经网络加权回归 (GNNWR)、地理时空神经网络加权回归 (GTNNWR) 等。

自首篇论文发表以来,GNNWR 、GTNNWR 等系列方法备受关注,并在海洋学、地理学、大气科学和地质学等多个方向得到了广泛应用,团队累积发表相关论文超 30 篇。同时,相关成果也行业内其他团队带来灵感与启发,许多外部团队利用类似的建模思想或技术架构开展研究,而这也恰恰开源研究的魅力所在。

GNNWR 开源地址:

https://github.com/zjuwss/gnnwr

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27569.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【JavaEE】线程安全

【JavaEE】线程安全 一、引出线程安全二、引发线程安全的原因三、解决线程安全问题3.1 synchronized关键字(解决修改操作不是原子的)3.1.1 synchronized的特性3.1.1 synchronized的使用事例 3.2 volatile 关键字(解决内存可见性) …

智慧农业中光谱相机对土壤成分的无损检测应用‌

可浏览之前发布的一篇文章:光谱相机在农业中的具体应用案例 一、土壤成分定量分析 ‌养分检测‌ 光谱相机通过捕捉土壤反射的特定波长光线,可精准检测氮、磷、钾等主要养分含量,以及有机质和水分比例。例如,不同养分对近红外波段…

实现浏览器交互Ai Web Ui-本地化部署的deepseek + Ollama + Page Assist

一、deepseek本地化部署 上篇写了deepseek本地化部署的小白教程。 deepseek 本地化部署(小白也可部署) 但有个问题,Ollama只能在命令行进行交互,体验相当差。 二、Page Assist安装 本篇给大家介绍个好用的chrome浏览器AI Web …

使用Maven搭建Spring Boot框架

文章目录 前言1.环境准备2.创建SpringBoot项目3.配置Maven3.1 pom.xml文件3.2 添加其他依赖 4. 编写代码4.1 启动类4.2 控制器4.3 配置文件 5.运行项目6.打包与部署6.1 打包6.2 运行JAR文件 7.总结 前言 Spring Boot 是一个用于快速构建 Spring 应用程序的框架,它简…

易语言模拟真人鼠标轨迹算法 - 防止游戏检测

一.简介 鼠标轨迹算法是一种模拟人类鼠标操作的程序,它能够模拟出自然而真实的鼠标移动路径。 鼠标轨迹算法的底层实现采用C/C语言,原因在于C/C提供了高性能的执行能力和直接访问操作系统底层资源的能力。 鼠标轨迹算法具有以下优势: 模拟…

10.【线性代数】—— 四个基本子空间

十、 四个基本子空间 1. 列空间 C ( A ) C(A) C(A) in R m R^m Rm2. 零空间 N ( A ) N(A) N(A) in R n R^n Rn3. 行空间 C ( A T ) C(A^T) C(AT) in R n R^n Rn4. 左零空间 N ( A T ) N(A^T) N(AT) in R m R^m Rm综述5. 新的向量空间 讨论矩阵 A m ∗ n A_{m*n} Am∗n​…

使用通义万相Wan2.1进行视频生成

使用通义万相Wan2.1进行视频生成 源代码准备运行环境准备创建Python虚拟环境并激活安装依赖包 模型下载生成视频官网的视频生成例子简单描述场景视频生成示例详细描述场景视频生成示例 最近通义万相开源了其视频生成模型。模型有两个版本,一个是1.3B的,一…

P8651 [蓝桥杯 2017 省 B] 日期问题--注意日期问题中2月的天数 / if是否应该连用

P8651 [P8651 [蓝桥杯 2017 省 B] 日期问题--注意日期问题中2月的天数 / if是否应该连用 题目 分析代码 题目 分析 代码中巧妙的用到3重循环,完美的解决了输出的顺序问题【题目要求从小到大】 需要注意的是2月的值,在不同的年份中应该更新2月的值 还有…

smolagents学习笔记系列(番外二)Agent+Ollama分析本地图像与文件

这篇文章是在 smolagents 官方教程结束后的番外篇二,实现了如何使用 smolagents 库 Ollama 调用本地模型对图像与文件进行分析。 【注意】:这篇文章需要你在本地部署Ollama的视觉语言模型,如果你的架构方案是纯线上模式,则可以跳…

Java 入门 (超级详细)

一、什么是Java Java是一种高级编程语言,由Sun Microsystems公司于1995年推出。Java具有跨平台性、面向对象、健壮性、安全性、可移植性等特点,被广泛应用于企业级应用开发、移动应用开发、大数据处理、云计算等领域。Java程序可以在不同的操作系统上运…

02_NLP文本预处理之文本张量表示法

文本张量表示法 概念 将文本使用张量进行表示,一般将词汇表示为向量,称为词向量,再由各个词向量按顺序组成矩阵形成文本表示 例如: ["人生", "该", "如何", "起头"]># 每个词对应矩阵中的一个向量 [[1.32, 4,32, 0,32, 5.2],[3…

【实战 ES】实战 Elasticsearch:快速上手与深度实践-1.4.2内存与磁盘配置陷阱

👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 Elasticsearch内存与磁盘配置深度避坑指南1. 内存管理核心原理1.1 内存分配矩阵1.2 内存压力预警线 2. 堆内存配置陷阱解析2.1 错误配置案例2.2 正确配置公式2.3 堆内存与分…

每日一题-奶酪题(蓝桥杯)【模拟】

题目要求 题目思路 假设有一个立方体奶酪,N2 1✖1✖N的奶酪块有3种(x方向,y方向,z方向) 如果x方向上想放 1✖1✖N的奶酪块,需要x方向上的有连续n个奶酪块被切走。同理,y方向和z方向也一样 …

git详细使用教程

文章目录 一、 git介绍与安装1、git介绍2、git的安装3、git使用前的说明 二、git的基础使用1、走进git之前2、git基础使用1、git init 项目初始化(init)成仓库(repository)2、git add 管理文件3、git commit 把文件提交到仓库&…

iOS接入Flutter项目

首先要把iOS项目和flutter项目统一目录下,而且需要注意的是flutter是module。 第一步:Flutter相关内容的创建 module创建命令: flutter create --templatemodule my_flutter,之后再执行 flutter pub get flutter build ios …

SEKI —— 基于大型语言模型的自进化与知识启发式神经架构搜索

01、项目概述 我们引入了一种基于新型大型语言模型( LLM )的神经架构搜索( NAS )方法,名为 SEKI 。SEKI 受到现代 LLM 中思维链( CoT )范式的启发,分为两个关键阶段运行&#xff1a…

【现代深度学习技术】卷积神经网络03:填充和步幅

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。深度学习最重…

探秘基带算法:从原理到5G时代的通信变革【一】引言

文章目录 一、引言1.1 研究背景与意义1.2 研究目的与方法1.3 研究内容与创新点 本博客为系列博客,主要讲解各基带算法的原理与应用,包括:viterbi解码、Turbo编解码、Polar编解码、CORDIC算法、CRC校验、FFT/DFT、QAMtiaozhi/解调、QPSK调制/解…

Free Auto Clicker - 在任意位置自动重复鼠标点击

“想让鼠标自己动起来,解放双手去做更有趣的事?”Free Auto Clicker 就像你的数字小助手,能在任意位置自动重复点击鼠标。从玩游戏到刷网页,这款免费工具让你告别枯燥的重复操作,效率瞬间起飞! 你有没有想…

【SQL】MySQL中的字符串处理函数:concat 函数拼接字符串,COALESCE函数处理NULL字符串

MySQL中的字符串处理函数:concat 函数 一、concat ()函数 1.1、基本语法1.2、示例1.3、特殊用途 二、COALESCE()函数 2.1、基本语法2.2、示例2.3、用途 三、进阶练习 3.1 条件和 SQL 语句3.2、解释 一、concat &…