【统计模型】某地区土壤所含可给态磷回归分析

目录

某地区土壤所含可给态磷回归分析

一、研究目的

二、数据来源和相关说明

三、描述性分析

3.1 样本描述

3.2 数据可视化

四、数据建模

4.1 回归模型A

4.2 回归模型B

4.3 回归模型B模型诊断

4.4 回归模型C

五、结论及建议

5.1 结论

5.2 建议

六、代码


某地区土壤所含可给态磷回归分析

摘要: 本文建立了多个回归模型,分析土壤内可给态磷影响因素。经过分析得出土壤内可给态林浓度主要与土壤内无机磷浓度、土壤内溶于K2CO3溶液但不溶于溴化物水解的有机磷有关,且前者对可给态磷浓度影响较大。逐步回归模型满足正态性与方差齐性,且通过了显著性检验。根据土壤内无机磷浓度增加的0-1变量对土壤内可给态磷浓度不存在显著性影响。基于此,可以根据回归方程模型,对玉米的生产与产量起到指导意义。

一、研究目的

结合土壤中可给态磷的浓度,可以预测玉米体内可供态磷浓度的状态,预测玉米的生长态势,指导玉米生产;另一方面,可以求出土壤中无机磷浓度被期望的范围,从而对改善玉米的土壤条件,对提高玉米产量起到重要作用。结合此背景,本文欲分析某地区土壤所含可给态磷的影响因素,进而对提出合理化建议。

二、数据来源和相关说明

本文依据表1某地区土壤所含可给态磷的情况,建立多元线性回归方程。数据共计18条,涉及4个变量,分别是:

表 2-1  变量说明

变量

解释

X1

土壤内所含无机磷浓度

X2

土壤内溶于K2CO3溶液并受溴化物水解的有机磷

X3

X4

土壤内溶于K2CO3溶液但不溶于溴化物水解的有机磷

以变量X1中位数为分界点,将X1化为0-1变量

Y

一种在20℃土壤内的玉米中的可给态磷

三、描述性分析

为了获取对数据的直观了解,本文先对数据进行了描述性统计分析。

3.1 样本描述

表 3-1  样本描述

 

MEAN

SD

MIN

MED

MAX

X1

11.94

10.15

0.40

10.50

29.90

X2

42.06

13.58

19.00

44.00

65.00

X3

123.00

45.74

37.00

123.50

202.00

Y

81.28

27.00

51.00

77.00

168.00

      从表3-1可以得出:土壤内所含无机磷浓度(X1)介于0.40-29.90之间,其平均水平约为11.94(平均值)和10.50(中位数),变异水平约为10.15(标准差);土壤内溶于K2CO3溶液并受溴化物水解的有机磷(X2)介于19.00-65.00之间,其平均水平约为42.06(平均值)和44.00(中位数),变异水平约为13.58(标准差);土壤内溶于K2CO3溶液但不溶于溴化物水解的有机磷(X3)介于37.00-202.00之间,其平均水平约为123.00(平均值)和123.50(中位数),变异水平约为45.74(标准差);一种在20℃土壤内的玉米中的可给态磷(Y)介于51.00-168.00之间,其平均水平约为81.28(平均值)和77.00(中位数),变异水平约为27.00(标准差)。

3.2 数据可视化

      为了更直观分析数据分布情况与数据间的相关关系,本文绘制了各个变量的直方图与各变量的相关性热力图,结果如图3-1和3-2所示。

图 3-1  直方图

      从图3-1可以得出:四个均不服从正态分布,其中无机磷(X1)浓度主要集中在0~5;土壤内溶于K2CO3溶液并受溴化物水解的有机磷(X2)浓度主要集中在30-60;土壤内溶于K2CO3溶液但不溶于溴化物水解的有机磷(X3)浓度主要集中在100-175;可给态磷浓度(Y)主要集中在60-100。

图 3-2  相关性热力图

      由图3-2可以得出:变量X1与Y之间存在较强的线性相关关系,变量X2、X3与Y之间的线性相关关系较弱。

四、数据建模

4.1 回归模型A

      为了分析可给态磷浓度(Y)的影响因素,本文首先建立了全部变量的多元线性回归方程A,即以Y作为因变量,X1-X3作为自变量,建立线性回归方程:

Y=β0+β1X1+β2X2+β3X3+ϵ

模型结果如表4-1所示。

表 4-1  回归模型A结果

 

Estimate

Std.Error

t value

Pr(>|t|)

(Intercept)

43.650

18.054

2.418

0.030*

X1

1.785

0.540

3.308

0.052**

X2

-0.083

0.420

-0.198

0.846

X3

0.161

0.112

1.443

0.171

R-squared

0.5493

Adjusted R-squared

0.4527

p-value

0.009227

      从表4-1可以得出:在显著性水平α=0.05 下,三个变量中,只有X1的P值<0.05,即对Y有显著影响,而变量X2和X3的P值>0.05,即对Y不存在显著性影响。模型的检验P值为0.009<0.05,即通过检验,说明方程具有统计学意义。

4.2 回归模型B

      由于模型A中X2和X3对Y不存在显著性影响,因而本文又建立了逐步回归模型B,对自变量进行选择,模型结果如表4-2所示。

表4-2 回归模型B结果

 

Estimate

Std.Error

t value

Pr(>|t|)

(Intercept)

41.479

13.883

2.988

0.009**

X1

1.737

0.467

3.721

0.002**

X3

0.155

0.104

1.494

0.156

R-squared

0.5481

Adjusted R-squared

0.4878

p-value

0.002589

      由表4-2可以得出:经过逐步回归分析,剔除了变量X2,保留了变量X1和X3。模型P值为0.003<0.05,通过检验。回归方程为:

Y=41.479+1.737X1+0.155X3     (1)

即X1每增加1,因变量Y增加1.737;X3每增加1,因变量Y增加0.155,自变量X1对Y影响更大。

4.3 回归模型B模型诊断

      首先对自变量进行共线性诊断,结果如表4-3所示。X1和X3的VIF值均小于4,即变量之间不存在多重共线性。

表 4-3  共线性检验

 

VIF

X1

1.023639

X3

1.023639

      其次,对模型的正态性、方差齐性与异常值进行诊断,结果如表4-1所示。由QQ图可以得出,残差项基本服从正态分布;由左下角图形可以得出,方差基本保持水平,即满足等方差性;由右下角图形可以得出,大部分点的cook距离均小于0.5,只有第17个点的cook距离>0.5,位于1.0-1.5之间,可以考虑剔除此点,以优化模型。

图 4-1  回归模型B诊断

4.4 回归模型C

      考虑到自变量X1对Y影响较大,本文又根据变量X1增设变量X4,具体操作是以X1中位数为分界点将X1数据分为两类,若>X1中位数,则X4=1,否则X4=0,即变量X4为0-1变量。将变量X4那个模型,建立回归模型C。模型结果如表4-4所示。

表4-4  回归模型C结果

 

Estimate

Std.Error

t value

Pr(>|t|)

(Intercept)

39.069

17.687

2.209

0.04574*

X1

2.850

0.904

3.153

0.00763**

X2

-0.088

0.405

-0.218

0.83048

X3

0.200

0.111

1.802

0.09475

X4

-25.363

17.609

-1.44

0.17342

R-squared

0.6113

Adjusted R-squared

0.4918

p-value

0.01069

由表4-4可以得出:模型P值为0.01<0.05,即在显著性水平α=0.05 下,模型C具有统计学意义;自变量X1-X4中,只有变量X1通过了检验,即对因变量Y存在显著性影响,X2-X3未通过检验。下面考虑对变量X1-X4进行选择,即建立逐步回归模型,模型结果如表4-5所示。

表4-5  逐步回归模型结果

 

Estimate

Std.Error

t value

Pr(>|t|)

(Intercept)

41.479

13.883

2.988

0.009**

X1

1.737

0.467

3.721

0.002**

X3

0.155

0.104

1.494

0.156

R-squared

0.5481

Adjusted R-squared

0.4878

p-value

0.002589

  由表4-5可以得出,经过逐步回归分析,剔除了变量X2和X4,保留了X1和X3,模型结果与回归模型B结果相同,模型解读与诊断与模型B相同。

五、结论及建议

5.1 结论

      通过建立多个回归模型,得出如下结论:土壤内可给态林浓度主要与土壤内无机磷浓度、土壤内溶于K2CO3溶液但不溶于溴化物水解的有机磷有关,且前者对可给态磷浓度影响较大。逐步回归模型满足正态性与方差齐性,且通过了显著性检验。根据变量X1增加的0-1变量X4对土壤内可给态磷浓度不存在显著性影响。

5.2 建议

      土壤内所含可给态磷浓度与土壤内无机磷浓度、土壤内溶于K2CO3溶液但不溶于溴化物水解的有机磷浓度存在线性回归关系。可以根据土壤内两者浓度,预测土壤内可给态磷浓度,进而预测玉米体内可供态磷浓度的状态与生长态势,指导玉米生产;另一方面,可以通过改善土壤内所含可给态磷浓度,改善玉米的土壤条件,进而提高玉米产量。

六、代码

a=read.csv("D:/个人成长/学业/课程/大三下课程/统计模型/作业/第二次作业/k2co3.csv",header=1)
a[c(1:5),]N = sapply(a,length)
MU = sapply(a,mean)
SD = sapply(a,sd)
MIN = sapply(a,min)
MED = sapply(a,median)
MAX = sapply(a,max)
result = cbind(N,MU,SD,MIN,MED,MAX)
resultpar(mfrow = c(2,2))
hist(a$X1, xlab = "无机磷", ylab = "频数",main=NULL)
hist(a$X2, xlab = "双溶有机磷", ylab = "频数",main=NULL)
hist(a$X3, xlab = "单溶有机磷", ylab = "频数",main=NULL)
hist(a$Y, xlab = "可给太磷", ylab = "频数",main=NULL)
vif(Model.AIC)
library(corrplot)
k=cor(a,use='everything',method='pearson')
par(mfrow=c(1,1))
corrplot(k,addCoef.col = "black")fit = lm(Y~X1+X2+X3, data = a)
summary(fit)Model.AIC=step(fit,trace=F)
summary(Model.AIC)#共线性检验
library(car)
vif(Model.AIC)#模型诊断
par(mfrow = c(2,2))
plot(Model.AIC,which=1)
plot(Model.AIC,which = 2)
plot(Model.AIC,which = 3)
plot(Model.AIC,which = 4)b=read.csv("D:/个人成长/学业/课程/大三下课程/统计模型/作业/第二次作业/k2c032.csv",header=1)fit2 = lm(Y~X1+X2+X3+X4, data = b)
summary(fit2)Model.AIC2=step(fit,trace=F)
summary(Model.AIC2)

个人见解,欢迎大家批评指正

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/44717.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【MySQL 第18章_MySQL8其它新特性】

第18章_MySQL8其它新特性 1. MySQL8新特性概述 1.1 MySQL8.0 新增特性 1. 更简便的NoSQL支持2.更好的索引3. 更完善的JSON支持4. 安全和账户管理5. InnoDB的变化6. 数据字典7. 原子数据定义语句8. 资源管理9. 字符集支持10. 优化器增强11. 公用表表达式12. 窗口函数13. 正则表…

第18章_MySQL8其它新特性(窗口函数、公用表表达式)

第18章_MySQL8其它新特性 第18章_MySQL8其它新特性1. MySQL8新特性概述1.1 MySQL8.0 新增特性1.2 MySQL8.0移除的旧特性 2. 新特性1&#xff1a;窗口函数2.1 使用窗口函数前后对比2.2 窗口函数分类2.3 语法结构2.4 分类讲解1. 序号函数2. 分布函数3. 前后函数4. 首尾函数5. 其他…

淘宝代购系统、海外代购系统、代购小程序、APP的开发以及源码PHP前端源码

以下是部分演示站&#xff0c;需了解更多代码展示请移步http://console.open.onebound.cn/console/?iAndy https://china-taobao.com/ 俄罗斯市场 ; https://www.cssbuy.com 全球市场; https://www.yeslogistics.com.my/ 新马市场; https://www.engtb.com/ 新加坡马来西亚…

18_MySQL8其它新特性

1. MySQL8新特性概述 MySQL从5.7版本直接跳跃发布了8.0版本&#xff0c;可见这是一个令人兴奋的里程碑版本。MySQL 8版本在功能上做了显著的改进与增强&#xff0c;开发者对MySQL的源代码进行了重构&#xff0c;最突出的一点是多MySQL Optimizer优化器进行了改进。不仅在速度上…

电商平台如何高效快速获取信息?

随着互联网的发展&#xff0c;电商跨境电商给我们的购物带来了巨大的便利和变化。 比如电商平台中&#xff0c;经常要做的就是如何获取某个平台畅销产品。这里举例&#xff0c;淘宝畅销榜的信息获取。 请求地址 公共参数 请求参数 请求参数&#xff1a;q 参数说明&#xf…

MySQL 面试常问问题及答案总结

1、事务的特性ACID 原子性&#xff08;Atomicity&#xff09; 事务被视为不可分割的最小单元&#xff0c;事务的所有操作要么全部提交成功&#xff0c;要么全部失败回滚。 回滚可以用回滚日志&#xff08;Undo Log&#xff09;来实现&#xff0c;回滚日志记录着事务所执行的…

酷藏品:5月27日国内主流平台数字藏品NFT发售日报

“酷宇宙”汇总每日国内主流平台数字藏品发售的相关信息&#xff0c;仅作为数字藏品爱好者交流使用&#xff0c;并不构成任何投资及金融方面的参考。 请大家严格遵守国家相关法律法规&#xff0c;保护好自己的财产&#xff0c;远离风险&#xff0c;远离非法投资&#xff01; …

5月23日国内主流平台数字藏品NFT发售日报

“酷宇宙”汇总每日国内主流平台数字藏品发售的相关信息&#xff0c;仅作为数字藏品爱好者交流使用&#xff0c;并不构成任何投资及金融方面的参考&#xff0c;如需交流请点击&#xff1a;联系方式 请大家严格遵守国家相关法律法规&#xff0c;保护好自己的财产&#xff0c;远…

tmall API接口关键字获取商品数据

作为一名技术爱好者&#xff0c;我们总会遇到各种各样的技术问题&#xff0c;需要寻找合适的技术解决方案。而在互联网时代&#xff0c;我们可以快速通过搜索引擎获取丰富的技术资源和解决方案。然而&#xff0c;在不同的技术分享中&#xff0c;我们常常会遇到质量参差不齐的文…

【MySQL】数据备份(导出数据 / 导入数据)

&#x1f3af;导出数据 1、使用 SELECT ... INTO OUTFILE 语句导出数据 SELECT...INTO OUTFILE 是 MySQL 用于导出数据的语句&#xff0c;它允许将查询结果保存到指定的文件中。 该语句的基本语法如下&#xff1a; SELECT column1, column2, ... INTO OUTFILE file_path …

MySQL基础篇-第18章_MySQL8其它新特性

第18章_MySQL8其它新特性 讲师&#xff1a;尚硅谷-宋红康&#xff08;江湖人称&#xff1a;康师傅&#xff09; 官网&#xff1a;http://www.atguigu.com 1. MySQL8新特性概述 MySQL从5.7版本直接跳跃发布了8.0版本&#xff0c;可见这是一个令人兴奋的里程碑版本。MySQL 8版…

通过端口 1433 连接到主机 localhost 的 TCP/IP 连接失败。错误:“Connection refused: connect.......

第一步&#xff1a;打开 SQL Server 配置管理器 第二步&#xff1a;点击SqlServer网络配置&#xff0c;点击 TCP/IP&#xff0c;右键属性&#xff0c;点击启用。 确定IP是1433 第三步&#xff1a;启动 MSSQLSERVER服务。 第四步&#xff1a;如果MSSQLSERVER在这个服务是运行状…

NumPy入门讲座(4):常用函数

文章目录 1. 特殊值2. 函数命名空间3. 数学函数4. 统计函数1. 特殊值 NumPy有两个很有趣的特殊值,np.nan 和 np.inf,nan 是 not a number 的简写,意为不是数字,inf 是 infinity 的简写,意为无穷大。咱们先来看看它们的本尊真身。 >>> a = np.array(

先正达将在科创板上会:拟募资650亿元,预计全年收入超2100亿元

3月15日&#xff0c;先正达集团股份有限公司&#xff08;下称“先正达”&#xff09;在上海证券交易所递交招股书&#xff08;上会稿&#xff09;。这意味着&#xff0c;先正达将于近期上会&#xff0c;接受科创板上市委员会的现场审议。据贝多财经了解&#xff0c;先正达于202…

科学计算基础软件包NumPy入门讲座(5):常用函数

文章目录 1. 特殊值2. 函数命名空间3. 数学函数4. 统计函数5. 插值函数6. 多项式拟合函数7. 自定义广播函数7.1&#xff0e;使用np.frompyfunc定义广播函数7.2 使用np.vectorize定义广播函数 1. 特殊值 NumPy有两个很有趣的特殊值&#xff0c;np.nan 和 np.inf。nan 是 not a …

chatgpt解决建表维度处理逻辑

需求 现有店铺汇总表&#xff1a;小时日月三种维度划分&#xff0c;内涵客流数据销售数据。 需要根据数据计算出服务区南北区每个小时&#xff0c;日&#xff0c;月&#xff0c;年四种维度的客单价客单转换率&#xff0c;服务区每个店铺的每个小时&#xff0c;日&#xff0c;月…

AI论文“高引用转化率”排名出炉:OpenAI第一,旷视第二,谷歌位居第九

丰色 发自 凹非寺量子位 | 公众号 QbitAI 哪些机构或国家&#xff08;地区&#xff09;发表的AI研究是最具影响力的&#xff1f; 为了弄清这个问题&#xff0c;美国Zeta Alpha平台统计了2020-2022三年之间全世界引用次数前100的AI论文&#xff0c;得出了一些很有意思的结果。 比…

GPT-4 vs 文心一言:让子弹飞一会儿

百度的文心一言刚发布&#xff0c;网上就出现很多群嘲的文章。   笔者不是百度的粉丝&#xff0c;对百度搜索结果的过度营销很反感&#xff0c;但看了GPT-4发布会和文心一言发布会&#xff0c;且了解了文心一言的发布前后事情&#xff0c;有几点真让人不吐不快&#xff01;…

2019年新版新媒体运营学习路线,附完整视频+工具+运营经验

一、2019版新媒体运营学习路线图——每阶段市场价值和可解决的问题 二、2019版新媒体运营学习路线图——学习大纲和每阶段知识点 三、新媒体运营学习路线图——视频篇&#xff1a; 1、第一阶段&#xff1a;构建营销思维视频资源 第1阶段&#xff1a;新媒体运营之如何构建运营思…

自媒体应该怎么入门,这几点教会你

2022年了&#xff0c;才开始做自媒体还来得及吗&#xff1f;答案是一定来得及&#xff0c;现在自媒体发展相对来说是比较成熟的阶段&#xff0c;那么自媒体新手应该怎么入门&#xff0c;下面这几点教会你&#xff01; 1、了解各平台机制 每个平台的机制是不同的&#xff0c;选…