R实验 参数估计

  • 实验目的:
  1. 掌握矩法估计与极大似然估计的求法;
  2. 了解估计量的优良性准则:无偏性、有效性、相合性(一致性);
  3. 学会利用R软件完成一个正态总体均值和两个正态总体均值差的区间估计;
  4. 学会利用R软件完成两个成对数据均值差的区间估计;
  5. 学会利用R软件完成一个总体比例和两个总体比例差的区间估计;
  6. 掌握大样本数据关于单个总体均值和总体比例的样本容量的确定方法。

实验内容:

(习题5.1)下表列出 50 个抽取自二项分布总体 B(n, p) 的数据(数据存放在 binom . data件中),试用矩估计方法估计参数np

来自二项分布总体的数据

15

16

14

15

16

11

15

15

12

14

14

14

12

14

12

15

14

14

12

14

15

17

18

10

13

12

15

17

16

18

17

12

10

15

13

12

14

16

16

16

15

11

13

15

16

17

14

11

16

17

解:若将n作为未知参数,则需要同时考虑一阶矩和二阶矩。

总体的一阶矩和二阶矩分别为:

a1 =E(X)= npa2 =E(X 2)= var(X)+(E(x))2 = np(1-p)+(np)2,

根据矩估计的基本思想,a1 = A1,a2 = A2,(其中

即有

解上述方程组,可得

以下请根据上式完成R程序,计算出参数np的矩估计量的值

(参考n = 20.0284,p = 0.713986)

源代码:

# 读取数据data <- scan("C:/Users/黄培滇/Desktop/R语言生物统计学/chap05/binom.data")# 计算参数估计m1 <- mean(data)m2 <- mean(data^2)p=1+m1-m2/m1n=m1/ppn

  

运行结果或截图:

(习题5.2)设总体X的分布密度函数为

从总体X抽取的样本为:

0.1  0.2  0.9  0.8  0.7  0.7  0.6  0.5

求参数a 的极大似然估计量

解:

X1,X2,…,Xn 为其样本,只需要考虑xÎ(0, 1)部分。依题意,

此分布的似然函数为         L(a ; x) =

相应的对数似然函数为       ln L(a ; x) = n ln(a +1)+ a ln

令           

 ln=0

解此似然方程得到

,或写为

容易验证

,从而a 使得L达到极大,即参数a 的极大似然估计量

以下请根据上式完成R程序,计算出参数a 的极大似然估计量的值。

源代码:

data<-c(0.1,0.2,0.9,0.8,0.7,0.7,0.6,0.5)n<-length(data)alpha_hat<-n/(-sum(log(data)))-1alpha_hat

运行结果或截图:

补充:求参数a 的矩估计量。由于只有一个参数,因此只需要考虑a1 = A1,即E(X)=

而由E(X)的定义有:E(X)=

因此,解得

以下请根据上式完成R程序,计算出参数a 的矩估计量的值,并与其极大似然估计量的值进行比较。

源代码:

data<-c(0.1,0.2,0.9,0.8,0.7,0.7,0.6,0.5)data_bar<-mean(data)alpha_hat_moment<-(data_bar-1)*(data_bar+2)alpha_hat_moment

运行结果或截图:

(习题5.4)为研究新生儿出生时的体重,随机地选取了某妇产医院的100个新生儿,其样本均值为3338g,样本标准差为629g。试计算新生儿平均体重的置信水平为95%的置信区间。

提示:参考例5.6

解:源代码及运行结果:(复制到此处,不要截图)

birth_bar<-3338birth_S<-629n<-100alpha<-0.05z<-qnorm(1-alpha/2)c(birth_bar - birth_S/sqrt(n)*z,birth_bar + birth_S/sqrt(n)*z)

结论:

(习题5.5)某妇产医院有意估计产妇在该医院住院的平均天数,在过去的年份中随机抽取了 36位孕妇,每位孕妇住院天数取整后如下表所示(数据存放在 hospital.data 文件中)。使用这些数据构建 95% 的置信区间,估计在该医院生小孩的所有孕妇的平均住院天数。

提示:参考例5.10。由于此题是小样本数据,也可以直接使用t.test()函数。

解:源代码及运行结果:(复制到此处,不要截图)

> H_data<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap05\\hospital.data")Read 36 items> H_bar<-mean(H_data);S<-sd(H_data)> n<-length(H_data)> alpha<-0.05> t<-qt(1-alpha/2,df = n-1)> c(H_bar - S/sqrt(n)*t,H_bar + S/sqrt(n)*t)

[1] 2.910812 3.700299

结论:

即95%的产妇在医院的平均住院时间在2~3天

(习题5.8)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10 只,测得其寿命(单位:小时)为

1067  919  1196  785  1126  936  918  1156  920  948

求灯泡寿命平均值的置信度为0.95的单侧置信下限。

提示:此题是一个正态总体的区间估计问题,且由于总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。参考例5.11,单侧置信下限,t.test()函数中的参数alternative="greater"。

解:源代码及运行结果:(复制到此处,不要截图)

> L<-c(1067,919,1196,785,1126,936,918,1156,920,948)> t.test(L,alternative="greater")

One Sample t-test

data:  L

t = 23.969, df = 9, p-value = 9.148e-10

alternative hypothesis: true mean is greater than 0

95 percent confidence interval:

 920.8443      Inf

sample estimates:

mean of x

    997.1

结论:

即这批灯泡中95%的平均寿命在997.1小时以上

(习题5.11)某调查公司对 902 名高尔夫女选手进行了一项调查,以了解女选手怎样看待自己在比赛中的安排。调查结果显示 397 名女选手对下午茶的时间感到满意。(1) 试计算所有女选手对下午茶的时间感到满意的置信区间,这里取置信水平为 0.95; (2) 如果使用binom. test ()函数精确计算两者相差多少?

提示:参考例5.12。

解:源代码及运行结果:(复制到此处,不要截图)

> my<-397;w<-902> p<-my/w;q<-1-p> alpha<-0.05;z<-qnorm(1-alpha/2)> c(p-z*sqrt(p*q/w),p+z*sqrt(p*q/w))

0.4077379 0.4725281

> binom.test(my,w)

Exact binomial test

data:  my and w

number of successes = 397, number of trials =

902, p-value = 0.0003617

alternative hypothesis: true probability of success is not equal to 0.5

95 percent confidence interval:

 0.4074246 0.4732337

sample estimates:

probability of success

              0.440133

结论:

即在女子高尔夫比赛时间安排中,女选手对下午茶的时间满意总体比例在0.407~0.473的概率是95%

两者相差0.440133

(续习题5.12)如果希望新生儿的平均体重与总体均值的边际误差不超过 100 ,应从该妇产医院随机地选取多少名新生儿?

提示:例5.13。

解:源代码及运行结果:(复制到此处,不要截图)

> birth_S<-629> E<-100> alpha<-0.05> z<-qnorm(1-alpha/2);> (n<-z^2*birth_S^2/E^2)

[1] 151.9839

结论:

说明还需要从妇产医院再随机抽取52名新生儿

(习题5.13)某汽车营销公司计划估计某地区拥有小汽车家庭所占的比重,要求边际误差不超过5%,置信水平取 90%, 问应抽取多少样本?公司调查人员认为,拥有小汽车家庭的实际比重不会超过 20%,如果这一结论成立,应抽取多少样本?

提示:例5.14。

解:源代码及运行结果:(复制到此处,不要截图)

> p<-0.2;E<-0.05;alpha<-0.1> z<-qnorm(1-alpha/2)> (n<-z^2*p*(1-p)/E^2)

[1] 173.1548

结论:

即需要随机抽取174个家庭

(习题5.16)甲、乙两种稻种分别播种在10块试验田中,每块试验田甲、乙稻种各种一半。假设两稻种产量X, Y均服从正态分布,且方差相等。收获后10块试验田的产量如下所示(单位:千克)。

甲种

140

137

136

140

145

148

140

135

144

141

乙种

135

118

115

140

128

131

130

115

131

125

求出两稻种产量的期望差m1-m2的置信区间(a =0.05)。

提示:此题是两个正态总体的区间估计问题,且由于两总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。t.test()可做两正态样本均值差的估计。注意此例中两样本方差相等。

解:源代码及运行结果:(复制到此处,不要截图)

> a<-c(140,137,136,140,145,148,140,135,144,141)> b<-c(135,118,115,140,128,131,130,115,131,125)> a_bar<-mean(a);Sa<-sd(a);na<-length(a)> b_bar<-mean(b);Sb<-sd(b);nb<-length(b)> alpha<-0.05;z<-qnorm(1-alpha/2)> S<-sqrt(Sa^2/na + Sb^2/nb)> c(a_bar - b_bar - z*S,a_bar - b_bar + z*S)

[1]  7.956516 19.643484

结论:

两个稻种产量的期望差在95%的置信水平下位于[7.96, 19.64]这个区间内。

(习题5.17)甲、乙两组生产同种导线,现从甲组生产的导线中随机抽取4根,从乙组生产的导线中随机抽取5根,它们的电阻值(单位:W)分别为

甲组

0.143

0.142

0.143

0.137

已组

0.140

0.142

0.136

0.138

0.140

假设两组电阻值分别服从正态分布N(m1, s 2)和N(m1, s 2),s 2未知。试求m1-m2的置信区间系数为0.95的区间估计。

提示:此题是两个正态总体的估计问题,且由于两总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。t.test()可做两正态样本均值差的估计。注意此例中两样本方差相等。

解:源代码及运行结果:(复制到此处,不要截图)

> x <- c(0.143, 0.142, 0.143, 0.137)> y <- c(0.140, 0.142, 0.135, 0.138, 0.140)> x_bar <- mean(x)> Sx <- sd(x)> nx <- length(x)> y_bar <- mean(y)> Sy <- sd(y)> ny <- length(y)> Sw2 <- ((nx - 1) * Sx^2 + (ny - 1) * Sy^2) / (nx + ny - 2)> S <- sqrt(Sw2 * (1/nx + 1/ny))> alpha <- 0.05> t <- qt(1 - alpha/2, nx + ny - 2)> conf_interval <- c(x_bar - y_bar - t*S, x_bar - y_bar + t*S)> conf_interval

[1] -0.002104423  0.006604423

结论:

两组之差的置信区间系数为0.95的区间估计为-0.002,0.007

思考:

常用的点估计的方法有哪些?

矩估计法;极大似然估计法;

估计量的优良性准则有哪些?

估计量的优良性准则:无偏性、有效性、相合性(一致性)

在对单个总体样本均值进行区间估计时,可以使用Z统计量和T统计量,这两个统计量分别在什么情况下使用?

总体标准差已知且样本容量较大,则可以使用Z统计量进行区间估计;

如果总体标准差未知或者样本容量较小,则应使用T统计量进行区间估计

对于单个总体比例的区间估计问题,涉及到其实是二项分布。但是当满足
    n大于等于30                条件时,也可以近似使用正态分布来计算。

对于单个总体比例的区间估计,涉及的是二项分布。因此在R语言中,可以使用binom.test()函数进行区间估计,它是精确检验函数,通常用于小样本数据;当处理大样本数据时,在R语言并没有使用正态分布函数,而是使用了  prop.test()      分布函数?同样,在使用这个分布函数时,仍然需要满足 样本容量足够大,且满足二项分布近似正态性                   条件。

在对两个总体样本均值差进行区间估计时,可以使用Z统计量和T统计量,这两个统计量分别在什么情况下使用?

两个总体标准差已知,用Z统计量

两个总体标准差未知,用T统计量

在对两个总体样本均值差进行区间估计时,如果使用了T统计量,还要进一步考虑两个总体的     方差      是否相同 ,来分别使用不同的T统计量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/335059.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为什么要学习c++?

你可能在想&#xff0c;“C&#xff1f;那不是上个时代的产物吗&#xff1f;” 哎呀&#xff0c;可别小看了这位“老将”&#xff0c;它在21世纪的科技舞台上依旧光芒万丈&#xff0c;是许多尖端技术不可或缺的基石&#xff01; 1. 无可替代 c源于c语言&#xff0c;它贴近于硬…

mybatis新增到数据库后返回当前ID

描述 在开发中&#xff0c;插入一条数据并返回当前的ID的场景很多 之前用mybatisPlus自带的api非常简单&#xff0c;调用完save or insert之后再getId即可。 今天使用mybatis的时候也遇到了这个场景&#xff0c;在此记录一下。 解决问题 直接再insert标签里面表明属性 核心…

Innodb Buffer Pool缓存机制(一)一条sql的执行过程

思维导图 石墨文档&#xff1a;https://shimo.im/mindmaps/NJkbnZV0ePINXzkR 一、SQL的执行 执行过程&#xff1a; 加载缓存数据&#xff0c;加载id为1的记录所在的整页数据&#xff08;相当于索引树的一个结点&#xff0c;16KB&#xff09;&#xff1b;写入更新数据的旧值到…

使用C/C++ API接口操作 Zookeeper 数据

ZooKeeper 支持 Java 和 C 的API接口。本文将介绍使用 C/C 语言客户端库的编译安装和使用入门。 一、编译安装 PS&#xff1a;就在上一篇文章还觉得安装和配置 jdk 、maven 麻烦&#xff0c;所以当时选择 apache-zookeeper-[version]-bin.tar.gz 的版本。然而&#xff0c;本文…

微信小程序-常用的视图容器类组件

一.组件分类 小程序中的组件也是由宿主环境提供的&#xff0c;开发者可以基于组件快速搭建出漂亮的页面结构。 官方把小程序的组件分为了9大类: (1) 视图容器 (2) 基础内容 (3) 表单组件 (4)导航组件 (5) 媒体组件 (6) map 地图组件 (7) canvas 画布组件 (8) 开放能力 (9) 无…

Linux:top命令的每一列的具体含义

Linux&#xff1a;top命令的每一列的具体含义 文章目录 Linux&#xff1a;top命令的每一列的具体含义图片显示top命令的概念语法显示字段的含义顶部字段第二行第三行第四行第五行每列字段的含义 图片显示 top命令的概念 top命令上一个常用的Linux命令行工具&#xff0c;用于实…

Gopher的Rust第一课:第一个Rust程序

经过上一章[1]的学习&#xff0c;我想现在你已经成功安装好一个Rust开发环境了&#xff0c;是时候撸起袖子开始写Rust代码了&#xff01; 程序员这个历史并不算悠久的行当&#xff0c;却有着一个历史悠久的传统&#xff0c;那就是每种编程语言都将一个名为“hello, world”的示…

计算机图形学入门02:线性代数基础

1.向量&#xff08;Vetors&#xff09; 向量表示一个方向&#xff0c;还能表示长度&#xff08;向量的摸&#xff09;。一般使用单位向量表示方向。 向量加减&#xff1a;平行四边形法则、三角形法则。比卡尔坐标系描述向量&#xff0c;坐标直接相加。 1.1向量点乘&#xff08;…

初识STM32单片机-TIM定时器

初识STM32单片机-TIM定时器 一、定时器概述二、定时器类型2.1 基本定时器(TIM6和TIM7)2.2 通用定时器(TIM2、TIM3、TIM4和TIM5)2.3 高级定时器(TIM1和TIM8) 三、定时中断基本结构和时基单元工作时序3.1 定时器基本结构3.2 预分频器时序3.3 计数器时序3.3.1 计数器有无预装时序(…

N的阶乘(高精度)

目录 题目描述 输入格式 输出格式 样例输入 样例输出 思路 参考代码 题目描述 输入正整数n&#xff0c;输出n&#xff01; 输入格式 一个正整数n&#xff0c;n 3000 输出格式 输出n&#xff01; 样例输入 3 样例输出 9 思路 主要就是高精度乘法的模版&#x…

“大数据建模、分析、挖掘技术应用研修班”的通知!

随着2015年9月国务院发布了《关于印发促进大数据发展行动纲要的通知》&#xff0c;各类型数据呈现出了指数级增长&#xff0c;数据成了每个组织的命脉。今天所产生的数据比过去几年所产生的数据大好几个数量级&#xff0c;企业有了能够轻松访问和分析数据以提高性能的新机会&am…

平方回文数-第13届蓝桥杯选拔赛Python真题精选

[导读]&#xff1a;超平老师的Scratch蓝桥杯真题解读系列在推出之后&#xff0c;受到了广大老师和家长的好评&#xff0c;非常感谢各位的认可和厚爱。作为回馈&#xff0c;超平老师计划推出《Python蓝桥杯真题解析100讲》&#xff0c;这是解读系列的第73讲。 平方回文数&#…

低价焕新用户体验生态 京东向上增长通道宽了

5月16日&#xff0c;京东对外发布了其2024年第一季度财报。整体来看&#xff0c;相当不错&#xff0c;营收与净利润双双超预期。一季度&#xff0c;京东集团收入达到2,600亿元人民币&#xff08;约360亿美元&#xff09;&#xff0c;同比增长7.0%&#xff0c;尤其是在持续补贴和…

实现UI显示在最上面的功能

同学们肯定遇到过UI被遮挡的情况&#xff0c;那如何让UI显示在最前面呢&#xff0c;先看效果 原理:UI的排序方式是和unityHierarchy窗口的层级顺序有关的&#xff0c;排序在下就越后显示&#xff0c;所以按照这个理论&#xff0c;当我们鼠标指到UI的时候把层级设置到最下层就好…

IOPS:存储芯片的“心跳”性能

IOPS&#xff0c;即每秒输入/输出操作数&#xff08;Input/Output Operations Per Second&#xff09;&#xff0c;是一个用于计算机存储设备&#xff08;如硬盘,SD Nand 、eMMC等&#xff09;性能测试的量测方式&#xff0c;是评估存储系统性能的一个关键指标。 常见IOPS量测方…

制作Dcoker镜像

文章目录 一、Docker构建镜像的原理1、镜像分层原理2、Docker的镜像结构3、分层存储原理4、构建命令与层的关系5、最终镜像的创建 二、docker commit 构建镜像1、使用场景2、手动制作yum版的nginx镜像2.1、启动一个centos容器&#xff0c;安装好常用的软件以及nginx2.2、关闭ng…

如何评价GPT-4o

一&#xff1a;简介 GPT-4o作为OpenAI的又一里程碑式技术成果&#xff0c;展现了显著的技术进步和创新。以下是对GPT-4o的评价&#xff0c;包括与先前版本的对比分析、技术能力以及个人感受。 1、版本间的对比分析 相较于先前的GPT系列模型&#xff0c;GPT-4o在多个方…

Redis解决缓存一致性问题

文章目录 ☃️概述☃️数据库和缓存不一致采用什么方案☃️代码实现☃️其他 ☃️概述 由于我们的 缓存的数据源来自于数据库, 而数据库的 数据是会发生变化的, 因此,如果当数据库中 数据发生变化,而缓存却没有同步, 此时就会有 一致性问题存在, 其后果是: 用户使用缓存中的过…

Python读取Excel表格文件并绘制多列数据的曲线图

本文介绍基于Python语言&#xff0c;读取Excel表格数据&#xff0c;并基于给定的行数范围内的指定列数据&#xff0c;绘制多条曲线图&#xff0c;并动态调整图片长度的方法。 首先&#xff0c;我们来明确一下本文的需求。现有一个.csv格式的Excel表格文件&#xff0c;其第一列为…

将本地项目上传到 gitee 仓库

1、创建 gitee 仓库 到 gitee 官网&#xff0c;新建仓库 配置新建仓库 完成仓库的创建 项目上传到仓库 上传项目需要安装git git官方下载地址&#xff1a;git下载地址 安装完成&#xff0c;前往本地项目所在文件夹&#xff0c;右击选择 Git Bash Here 刚下载完成需要配置G…