ArcGIS pro中的回归分析浅析(加更)关于广义线性回归工具的补充内容

 在回归分析浅析中篇的文章中,

有人问了一个问题:

案例里的calls数据貌似离散,更符合泊松模型,为啥不采用泊松而采用高斯呢?

确实,在中篇中写道:

在这个例子中我们为了更好地解释变量,使用高斯模型代替更适合的泊松模型。

这句话该怎么理解呢?

一般情况下,拿到研究数据之后,如果我们计划使用GLR工具,首先需要判断使用哪个模型,使用哪个模型是由数据来确定的,当数据都是整数时,究竟是用高斯还是泊松呢?

我们知道,高斯模型需要满足数据正态分布。在Pro中如何看数据是否正态分布呢?

打开Pro,在内容列表中选择包含因变量的原始图层,选择创建图表,点击直方图就可以查看数据的分布形态了。

在图表属性中选择数值变量为Calls

存在变换三种形式,无变换、对数变换以及平方根变换。默认情况下选择无变换。

其中横轴是Calls值,纵轴为Calls的数量。

很显然,当前数据是偏斜的,并不是正态分布的。这种情况下是不建议选择高斯模型,更推荐使用泊松的。

但是很多情况下,高斯的性能或者说拟合度都要好于泊松。(大家可以尝试使用本例中的数据,再结合GLR工具中的泊松模型得出该模型的拟合度)

所以为了向高斯模型靠拢,提高模型精度,会尝试将数据进行变换。

你可以理解为在某种程度上,变换可以认为并非在调整数据,而是换个角度看数据,比如说圆柱体完全水平的看截面是正方形,而从顶上垂直俯视是圆形。怎么看(变换),都不会改变数据的最终表现,只是让我们从某个角度更容易的理解它而已。

god xia,公众号:虾神说D[虾答]莫兰指数计算时只能用原始数据还是也能用取对数后的数据?

以上内容引自虾神卢(下一篇会附上他的公众号)关于变换内容的说明

将数据进行变换,也就是尝试使用对数变换以及平方根变换,再来确定数据是不是正态分布的。如果变换后数据是正态分布的,我们仍然可以选择高斯模型来对变量之间的线性关系进行建模。

在这里我们尝试使用平方根变换。

很不幸。仍然不是正态分布。

但是上述这种,数据变换之后呈现正态分布的情况确实存在。例如这里我们使用了房价数据进行比较。

房价无变换       房价对数变换

非正态分布        呈正态分布

所以,严格来说,本例中使用高斯模型来进行数据的分析和预测是存在问题的。(同学们千万注意)

本例中,我们的本意是想讲清楚高斯模型中的众多的结果指标,并得出GLR工具在本例中并不平稳的结论。大家可以理解其方法和思路。

同一数据泊松分布的结果如下

地图视图结果展示

地图视图中增加了GLRPossionData911Calls图层。并使用偏差残差(非标准化残差)来进行渲染。

内容列表中的GLRData911Calls图层

同时增加了3个图表。图表与结果是相互印证的,因此在这里我们主要分析GLRPossionData911Calls图层的内容以及结果运行出来之后的详细信息。

与原始的ObsData911Calls相比较,保留了全部要素的Calls、Pop, Jobs, LowEduc, Dst2UrbCen也就是因变量和解释变量属性,增加了Raw Predicted(CALLS)、Predicted(CALLS)字段也就是因变量的预测值,以及Deviance Residual(偏差残差)这三个字段。

其中偏差残差也反应了预测值与实际值之间的差异,这个与标准残差不同,没有大于2.5或者小于-2.5的限制。

再来看泊松模型的GLR结果

可以发现结果与高斯模型的结果类似,都包含了系数、概率和VIF。这些要求比如概率带星号,VIF不能大于7.5的要求都是相同的。

GLR的诊断中已解释偏差表明因变量中有多少变化可以由模型解释,也叫作模型拟合优度,类似高斯模型中的R方。

从这里我们也能看出,本例中,泊松的拟合结果比高斯的要低。

本例中,我们提供的数据不是特别理想,导致模型的选择容易混淆。在云盘连接中,我们还补充了房产数据,符合高斯模型,大家可以尝试一下。链接: 

链接:https://pan.baidu.com/s/17KFw8l5PeBQMAgtAjKU80Q?pwd=1vsl 
提取码:1vsl 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/478832.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【面试题】2025年百度校招Java后端面试题

文章目录 前言一、网络IO1、服务器处理并发请求有哪几种方式?2、说一下select,poll,epoll的区别?3、Java 有一种现代的处理方式,属于异步I/O,是什么?redis,nginx,netty 是…

【Zookeeper 和 Kafka】为什么 Zookeeper 不用域名?

人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…

RiceChem——用于评估大语言模型在教育领域自动长答卷评分 (ALAG) 的数据集

摘要 论文地址:https://arxiv.org/abs/2404.14316 源码地址:https://github.com/luffycodes/automated-long-answer-grading 迄今为止,教育领域的自然语言处理(NLP)主要集中在简答题评分和自由文本作文评分方面。然而&#xff0c…

Java ArrayList 与顺序表:在编程海洋中把握数据结构的关键之锚

我的个人主页 我的专栏:Java-数据结构,希望能帮助到大家!!!点赞❤ 收藏❤ 前言:在 Java编程的广袤世界里,数据结构犹如精巧的建筑蓝图,决定着程序在数据处理与存储时的效率、灵活性以…

【04】Selenium+Python 手动添加Cookie免登录(实例)

一、什么是Cookie? Cookie 是一种由服务器创建并保存在用户浏览器中的小型数据文件。它用于存储用户的相关信息,以便在后续访问同一网站时可以快速检索这些信息。Cookie 主要用于以下几个方面: 1.状态管理: Cookie 可以保存用户…

GitLab|应用部署

创建docker-compose.yaml文件 输入docker-compose配置 version: 3.8 services:gitlab:image: gitlab/gitlab-ce:15.11.2-ce.0restart: alwayscontainer_name: gitlab-ceprivileged: truehostname: 192.168.44.235environment:TZ: Asia/ShanghaiGITLAB_OMNIBUS_CONFIG: |exter…

【PX4_Autopolite飞控源码】中飞控板初始化过程中的引脚IO控制(拉低/拉高)

先选择自己飞控板支持的硬件平台 打开对应的路径我的是Desktop/px4/PX4-Autopilot/boards/zhty/nora 找到board_config.h文件,打开nora后再往下去找Desktop/px4/PX4-Autopilot/boards/zhty/nora/src/borad_config.h 打开后可以看到有很多GPIO引脚的定义&#xff0c…

如何使用Postman优雅地进行接口自动加密与解密

引言 在上一篇文章中,分享了 Requests 自动加解密的方法,本篇文章分享一下更加方便的调试某个服务端接口。 Postman Postman 这个工具后端小伙伴应该相当熟悉了,一般情况下我们会在开发和逆向过程中使用它来快速向接口发送请求,…

Spring Boot——统一功能处理

1. 拦截器 拦截器主要用来拦截用户的请求,在指定方法前后,根据业务需要执行设定好的代码,也就是提前定义一些逻辑,在用户的请求响应前后执行,也可以在用户请求前阻止其执行,例如登录操作,只有登…

PYTORCH基础语法知识

初识Torch PyTorch,简称Torch,主流的经典的深度学习框架,深度学习的框架。 简介 PyTorch是一个基于Python的深度学习框架,它提供了一种灵活、高效、易于学习的方式来实现深度学习模型。PyTorch最初由Facebook开发,被…

C嘎嘎探索篇:栈与队列的交响:C++中的结构艺术

C嘎嘎探索篇:栈与队列的交响:C中的结构艺术 前言: 小编在之前刚完成了C中栈和队列(stack和queue)的讲解,忘记的小伙伴可以去我上一篇文章看一眼的,今天小编将会带领大家吹奏栈和队列的交响&am…

刷题日常(数据流中的中位数,逆波兰表达式求值,最长连续序列,字母异位词分组)

数据流中的中位数 描述 如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()…

SQL 复杂查询

目录 复杂查询 一、目的和要求 二、实验内容 (1)查询出所有水果产品的类别及详情。 查询出编号为“00000001”的消费者用户的姓名及其所下订单。(分别采用子查询和连接方式实现) 查询出每个订单的消费者姓名及联系方式。 在…

uniapp-vue2引用了vue-inset-loader插件编译小程序报错

报错信息 Error: Vue packages version mismatch: - vue3.2.45 (D:\qjy-myApp\admin-app\node_modules\vue\index.js) - vue-template-compiler2.7.16 (D:\qjy-myApp\admin-app\node_modules\vue-template-compiler\package.json) This may cause things to work incorrectly.…

VOLO实战:使用VOLO实现图像分类任务(二)

文章目录 训练部分导入项目使用的库设置随机因子设置全局参数图像预处理与增强读取数据设置Loss设置模型设置优化器和学习率调整策略设置混合精度,DP多卡,EMA定义训练和验证函数训练函数验证函数调用训练和验证方法 运行以及结果查看测试完整的代码 在上…

【Linux】TCP网络编程

目录 V1_Echo_Server V2_Echo_Server多进程版本 V3_Echo_Server多线程版本 V3-1_多线程远程命令执行 V4_Echo_Server线程池版本 V1_Echo_Server TcpServer的上层调用如下,和UdpServer几乎一样: 而在InitServer中,大部分也和UDP那里一样&…

XG(S)-PON原理

前言 近年来,随着全球范围内接入市场的飞快发展以及全业务运营的快速开展,已有的PON技术标准在带宽需求、业务支撑能力以及接入节点设备和配套设备的性能提升等方面都面临新的升级需求XG(S)-PON(10G GPON)是在已有GPON技术标准上演进的增强下一代GPON技…

C语言学习 12(指针学习1)

一.内存和地址 1.内存 在讲内存和地址之前,我们想有个⽣活中的案例: 假设有⼀栋宿舍楼,把你放在楼⾥,楼上有100个房间,但是房间没有编号,你的⼀个朋友来找你玩,如果想找到你,就得挨…

前端---CSS(部分用法)

HTML画页面--》这个页面就是页面上需要的元素罗列起来,但是页面效果很差,不好看,为了让页面好看,为了修饰页面---》CSS CSS的作用:修饰HTML页面 用了CSS之后,样式和元素本身做到了分离的效果。---》降低了代…

H.265流媒体播放器EasyPlayer.js无插件H5播放器关于移动端(H5)切换网络的时候,播放器会触发什么事件

EasyPlayer.js无插件H5播放器作为一款功能全面的H5流媒体播放器,凭借其多种协议支持、多种解码方式、丰富的渲染元素和强大的应用功能,以及出色的跨平台兼容性,为用户提供了高度定制化的选项和优化的播放体验。无论是视频直播还是点播&#x…