多元线性回归模型及stata实现:总论

多元线性回归模型及stata实现:总论

一、模型

Y=β0+β1X1+β2X2+⋯+βnXn+e

  1. Y: Dependent variable(因变量、应变量、反应变量、响应变量、被解释变量等)
  2. X1、X2⋯Xn:Independent variable(自变量、解释变量、控制变量)
    如果重点探究一个因素与另一个因素的作用时,纳入模型的其他X通常称为叫控制变量
  3. β1、β2⋯βn:偏回归系数、回归系数(每个βn表示控制其他X时,Xn每增加一个单位,对Y的边际效应)
  4. e: 残差项、残差、扰动项等(代表不包含在模型中的解释变量和其他一些随机因素对被解释变量的总影响项)
  5. β0,截距,常数项。表示所有自变量为0时的Y值。(有时候需要注意,如果自变量不可能等于0,这个值的意义需要考虑;如果需要真实的截距值,可以用Xi-Xmin,Xi-Xmean替代每个Xi。)
    残差的性质非常重要

二、条件/假设

2.1 严格最小二乘估计(OLS)的条件和假设

  1. 假设1: 因变量为连续变量(二值、有序、计数等永其他模型)
  2. 假设2:Y与X1、X2⋯Xn之间存在线性关系(当然:X可以为分类)
  3. 假设3:独立性:因变量Y取值相互独立,即残差间相互独立,不存在自相关。主要和抽样、时间序列数据等有关 | 采用自回归模型(Autoregressive model,简称AR模型,用x预测 x(自己);所以叫做自回归)等解决。
  4. 假设4:残差方差齐性:标准化残差的大小不随变量取值的改变而改变(残差图)
  5. 假设5:正态性:就自变量的任何一个线性组合,应变量y均服从正态分布,即要求残差ei服从正态分布
    在这里插入图片描述
  6. 假设6:自变量间不存在共线性
  7. 假设7:不受异常值影响
  8. 条件8:样本量至少为自变量个数的5~10倍,20倍以上为宜

注:学者认为,至少大于30个,最好100个以上就可以算大样本了
而且,以上部分假设和条件在一定条件下是可以放松的。

2.2 放松的OLS假设:大样本OLS
假设1、2、6、7、8是必须的(线性性、不存在共线性、不受强离群值影响、样本量充足是必须得);
假设3、4、5会做在一定程度的放松;即残差的球形假定(独立、正态、等方差)相对放松。

三、条件/假设的stata验证

stata回归命令

regression Y X1 X2 X3……Xn
reg Y X1 i.X2 X3……Xn / 若存在分类变量,在变量名称前加上i. 即可,如i.X2;stata 里面的命令可以缩写,只要缩写不产生歧义即可;

条件/假设
1. 假设1的判断:直接看,possion回归等需要验证(已经不属于简单的多元线性回归了);
2.线性性的判断: 分别做Y与每个X之间的散点图、拟合图。不满足时可以转换数据,加平方项、三次方项、分段回归等;

scatter Y X1
scatter Y X2
……
lowess Y X1 
lowess Y X2

3. 自相关的判断:如果抽样没问题,不是时间序列数据,一般不会有自相关。若针对时间序列数据,可以如下检验;

如果原数据不是时间序列数据,则需要自行定义一个:

 gen n=_n / 生成一个时间序列的标志变量ntsset n / 将这个数据集定义为依据时间序列标志变量n定义的时间序列数据

检验方法

(1) 绘制残差图

predict e,r  / 生成残差值
scatter eLe  / 生成残差散点图

(2) DW检验(杜宾-瓦特森检验)

estat dwatson / 杜宾-瓦特森检验

若DW值在1.8-2.2之间时接受原假设,说明模型不存在一阶自相关,若DW值接近0或4,则拒绝原假设,认为存在一阶自相关。若落在模糊区域,则无法判断。
DW接近2,残差间相关性差
DW接近0,残差间正相关
DW接近4,残差负相关

(3)BG检验

estat bgodfrey / BG检验

若输出的P-Value显著小于0.05,则拒绝原假设,认为存在序列相关。

4. 残差方差齐性的判断:残差的方差齐下,用异方差检验、绘制残差图等;

white检验

 imtest,white /  white检验

如果输出的P-Value显著小于0.05,则拒绝原假设,认为存在异方差性。
残差图

reg Y X1 X2…… / 先做完回归
rvfplot

5. 残差正态性:绘制标准化残差的直方图、茎叶图、正态概率分布图(PP图)等;
残差的偏度、峰度等

predict  residual_1 , residual / 得到残差,取名residual_1 
histogram residual_1 / 方法1. 绘制直方图看看
sum residual_1 ,detail / 方法2. 可以选择通过偏度、峰度来看
qnorm residual_1 / 方法3 ,QQ图
sktest residual_1 / 正态性检验 也可以用 swilk residual_1, sfrancia residual_1等

6. 多重共线性:VIF检验;

estat vif / 方差扩大因子法检验

VIF需要用在线性回归之后,若为logistic回归,先替换为线性回归,做完再做vif检验。
一般认为:
VIF≥3,有多重共线性;
VIF≥6,比较严重多重共线性
VIF≥10,非常严重的多重共线性;

7. 异常值检验:变量描述、箱式图;

graph box Y / 方法1 , 绘制Y的箱式图
sum Y,detail  /  方法2 , 对Y进行详细描述

当然,绘制散点图的时候就能发现异常值。

四、不满足条件 / 假设的解决办法

1. 不满足线性关系:用非线性回归模型,或变量转换、加多次项(平方项、三次方项)、分段回归等
2. 不满足残差独立性:自回归(Autoregressive model,简称ARM)、广义估计方程(Generalized Estimated Equation, GEE,多层线性模型(multi-level analysis model)
3. 不满足残差方差齐性、正态性:使用稳健标准差、 加权最小二乘法(Weighted Least Squares,WLS)、分层回归(hierarchical multiple regression)等
4. 不满足多重共线性:剔除部分自变量、逐步回归法选择变量、岭回归(Ridge Regression)等
5. 样本量不足:增加样本含量
当然,以上假设和条件在一定条件下是可以放松的。

推荐阅读:
正态性/方差齐性检验stata实现
stata学习笔记

博客持续更新
主要参考
陈强 计量经济学
医咖会
知乎
其他互联网资料

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28220.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux 系统使用 git 提交代码-- git 的安装及使用(简明教学指南)

序 2023/02/09 晚 鉴于本篇文章收藏量比较多,那就给大家分享点在实际工作中使用频率最高的工作流命令吧。 场景如下(多人共同开发一个项目):我叫小明,参与了一个名为 chatGPT 的项目,这个 AI 最近很火,就以此作为例…

慕课前端售1299元的面试题【第二阶段】汇总 day05

上一篇链接 如果有看不懂的,别硬看,直接chatgpt,让它回答。 - 我的博客需要缩宽页面观看,图片无法均放,很抱歉。 1. 请说明 Ajax Fetch Axios 三者的区别? 1. 用 XMLHttpRequest 实现 Ajax function aja…

Javaweb复习之HTTPTomcatServelet

1.Web概述 1.1 Web和JavaWeb的概念 Web是全球广域网,也称为万维网(www),能够通过浏览器访问的网站。 JavaWeb就是用Java技术来解决相关web互联网领域的技术栈 1.2 JavaWeb技术栈 B/S 架构:Browser/Server,浏览器/服务器 架构模…

DDD领域驱动设计实战-DDD微服务代码结构

更多内容关注微信公众号:fullstack888 DDD并没有给出标准的代码模型,不同的人可能会有不同理解。按DDD分层架构的分层职责定义,在代码模型里分别为用户接口层、应用层、领域层和基础层,建立了 interfaces、application、domain 和…

windows10环境下安装docker、Ubuntu、gitlab、wsl2

一、概述 By星年 文章参考 常用命令参考:(为了方便复制命令都做了换行处理,可直接双击复制。) 进docker terminal: docker exec -it gitlab /bin/bash 查看容器列表: docker ps -a 查看镜像列表: docker images git…

AIGC的发展史:从模仿到创造,AI的创造性探索

在 AI时代,人工智能不再是简单的机器,而是一个具有无限创造力的创造者。AIGC的诞生是人工智能从模仿到创造的一种进步,也是对人类创造力的一种新探索。 而这种由AI生成的内容究竟是如何发展而来的呢?在本文中,我们将探…

如何解决微信支付回调:支付成功及支付失败都不进行任何操作(支付坑)

这几天都在用微信支付这块功能,不得不吐槽一下微信支付的小坑 关于微信提供JSAPI文档,本来想着他们写的开发文档,肯定是没有任何问题。 结果在开发测试中,支付完成后或者支付失败都没任何效果。 我已经在JS里面做了跳转&#xff0…

android微信支付返回-1,支付失败总结!

解决办法1:看看二次生成sign的参数顺序是否跟我发的一致!很坑爹,必须一样才行! 解决办法2:请求得到prepayid参数的url必须是图中的Url

微信支付下载对账单400Bad Request问题解决方式

今天在做项目时, 需要用到微信支付的对账接口, 看了好多人的反馈, 加上自己的测试, 在用API V3生成了Sign后,对download_url进行Get请求访问时, 依然会出现问题, 就是Nginx报错400 Bad Request 看了好多人的文章, 基本上都是用的调用sdk生成的httpClient再次进行调用, 如下图 …

微信支付异常(“应答的微信支付签名验证失败“)记录

原因是: 配置错了“微信支付平台证书”; 如何解决: 1.下载 微信支付平台证书下载工具(Certificate Downloader)https://github.com/wechatpay-apiv3/CertificateDownloader 得到 CertificateDownloader-1.1.jar 2.执行命令 java -jar Cer…

postman-模拟上传图片

一、Chrome打开layui : 图片上传 右键打开检查,选择network,上传图片查看到: 二、postman测试 打开postman先设置post,并将url填好 : https://httpbin.org/post 选择form-data:添加key/value : key为与后台约定字段(一…

【苹果群发iMessage推送位置推】软件安装将会按照 Developer Program License Agreement

推荐内容IMESSGAE相关 作者推荐内容iMessage苹果推软件 *** 点击即可查看作者要求内容信息作者推荐内容1.家庭推内容 *** 点击即可查看作者要求内容信息作者推荐内容2.相册推 *** 点击即可查看作者要求内容信息作者推荐内容3.日历推 *** 点击即可查看作者要求内容信息作者推荐…

风辞远的科技茶屋:可怖的AI

大家好,我是脑极体的风辞远。一直以来我们都在写大块文章,很少有机会跟大家聊天。时间长了,总觉得这种方式有一点冷漠感,不够轻松,加上往往每篇文章只聚焦一个话题,而我们产能有限,就会有很多值…

千万别再乱点黄色APP了!

上一篇:文心一言员工跳槽工资翻倍,猎头:百万年薪很正常 网络诈骗千千万,涉黄APP占一半。 小伙来自山东菏泽,失手在手机上下载了非法的涉黄APP,当他准备观看视频时发现,需要充值成为会员或完成任…

如何分析系统平均负载过高?

文章目录 前言uptime命令平均负载平均负载到底是多少才合理平均负载和CPU的关系CPU与进程1比1,CPU使用率高导致负载变高I/O高,导致负载高进程数超过CPU数,导致负载高 前言 我相信你应该用过uptime命令查询系统负载的情况,或者在各…

线上负载过高排查(top/vmstat/ifstat/free/df)

目录 一、五大命令 二、故障排查步骤 1、top命令找出CPU占比最高的 2、ps -ef 或者 jps -l进一步定位 3、ps -mp位到具体线程或者代码 4、jstack精准定位到错误的地方 本文通过学习:周阳老师-尚硅谷Java大厂面试题第二季 总结的LinuxJDK命令操作相关的笔记 一…

解决Linux 负载过高问题过程记录

解决问题的思路 1.top命令查看该机器的负载状况 2.cd /proc/pid 查看对应高占用程序的位置 3.进入对应程序中查看日志,根据CPU和内存这两个因素分析 4.ps -ajxf 查看进程及其之下的线程,通过stat查看是否存在D僵尸进程 1.什么是负载过高 1.1load A…

假如ChatGPT 去面试前端工程师,结果会怎么样?

近日,有个叫 ChatGPT 的同学来我司面试前端,考考他面试八股文。先来问问闭包。 第一问,说说 JS 闭包 追问,详细讲讲闭包 由于篇幅太长,转成文字,以下皆为 ChatGPT 回答 闭包是一个非常重要的 JavaScript 概…

青椒肉丝饭

今天第一次来华德吃饭,为了吃这顿饭跑遍了半个上海。 先是去长乐路上的大铁门排挡吃自助,结果人家收摊了,估计都回家过年了吧。 然后又去新华路上的粮仓饭湘,结果人满为患,连个站的地方都没有。 最后回到北新泾这里…

五花青椒包菜

[猪头]每次做完菜,第一口一定要找块好肉尝尝。肉好吃😋,这道菜就差不了,下饭。 ​[调皮]肉不好吃的菜,没有灵魂。 ​[愉快]今天的菜,五花肉青椒土豆包菜。