大学生就业问题的统计研究

最近在写学年论文,哈哈,这个文章被导师修改,觉得有些不妥就基本算是胎死腹中了。但是毕竟是自己的blog,在这里写写感觉也无所谓的哈。但是秉承着对自己博客,对希望学习统计的大伙儿负责的态度。我可以保证研究过程中的思路是无误的。可能研究方法比较单纯,这篇文章的学术性不强,但是希望大家能从这篇文章中学会利用多方法进行数据分析。


文章中的内容包括了许多统计学,计量经济学的思想,应用了SPSS,R,EViews进行了简单的分析。以下是正文部分,我没有直接附上我的学年论文,后续看看能不能留一个邮箱供大家下载我的原版论文,也便于各位对我的不成熟的想法提出建议。


正文

先说下这个背景哈。考虑到大学生就业人数与招生人数及生源质量密切相关,大学生扩招作为主要影响因素,应当格外考虑。因此在选取指标方面,对于前后波动较大的指标应区分开来。1999年教育部出台的《面向21世纪教育振兴行动计划》,是扩招开始的源头,在此之前高校扩招年均增长都只在8.5%左右。而1999年当年政策实施,增长速度达到史无前例的47.4%。2006年,国家提出要把高等教育发展的重点放在提高质量上。2007年提出,高等教育将继续扩招,但幅度将大大放缓。进入2008年,当年全国普通高校本专科招生计划为599万,增长幅度仅为5%。因此本论文以2007-2018年数据作为研究数据,其中以2016年为基期,以2007-2016年数据作为样本,2016-2018年数据用于检验,运用统计学、计量经济学等相关学科研究方法进行计算、研究,最终得出相关结论并提出一些合理建议。
按初次就业率80%计算出样本(即2007-2016年)的全国高校毕业生就业人数和未落实就业的人数 。
初次就业率(又称一次就业率)是指在7月10日之前,各高校毕业生的就业比例。2016年高校毕业生就业创业研讨会上公布,高校毕业生初次就业率连续14年超70%,其中据各省初次就业统计报告,近十年来全国浙江省,江苏省,内蒙古自治区,宁夏省,黑龙江省等19省和直辖市达到80%,广东省初次就业率达到90%。 因此折中选取初次就业人数80%作为各省市大学生初次就业的指标。
就业弹性系数的计算涉及到经济增长率,而大学生近年来的入学人数上升可能与人口数增加有关,考虑多因素,试初步建立五元线形回归函数。设模型的函数形式如下:

Y为高校毕业生初次就业人数(万人)(按初次就业率80%计算),P为高校同届招生人数(万人),X为国内生产总值(亿元),S为年末城镇总人口数(万人),T为年末乡村总人口数(万人),Q为全国人口自然增长率(百分比)。e为随机误差项, C_0为常数项。角标t表示这个随时间变化。

表1                    1990-2016模型指标相关数据

年份(届)

高校毕业生初次就业人数(万人)

高校同届招生人数(万人)

国内生产总值(亿元)

年末城镇总人口数(万人)

年末乡村总人口数(万人)

全国人口自然增长率(%)

1990

49.12

57.20

18872.90

30195.00

84138.00

1.44

1991

49.12

61.68

22005.60

31203.00

84620.00

1.30

1992

48.32

66.97

27194.50

32175.00

84996.00

1.16

1993

45.68

59.71

35673.20

33173.00

85344.00

1.15

1994

50.96

60.90

48637.50

34169.00

85681.00

1.12

1995

64.40

62.00

61339.90

35174.00

85947.00

1.06

1996

67.12

75.40

71813.60

37304.00

85085.00

1.04

1997

66.32

92.40

79715.00

39449.00

84177.00

1.01

1998

66.40

90.00

85195.50

41608.00

83153.00

0.91

1999

67.84

92.60

90564.40

43748.00

82038.00

0.82

2000

76.00

96.60

100280.10

45906.00

80837.00

0.76

2001

82.88

100.00

110863.10

48064.00

79563.00

0.70

2002

106.96

108.40

121717.40

50212.00

78241.00

0.65

2003

169.60

159.70

137422.00

52376.00

76851.00

0.60

2004

191.28

220.60

161840.20

54283.00

75705.00

0.59

2005

245.44

268.30

187318.90

56212.00

74544.00

0.59

2006

302.00

320.50

219438.50

58288.00

73160.00

0.53

2007

358.23

335.00

270232.30

60633.00

71496.00

0.52

2008

409.56

447.30

319515.50

62403.00

70399.00

0.51

2009

424.88

504.46

349081.40

64512.00

68938.00

0.49

2010

460.34

546.10

413030.30

66978.00

67113.00

0.48

2011

486.53

565.92

489300.60

69079.00

65656.00

0.48

2012

499.76

607.66

540367.40

71182.00

64222.00

0.50

2013

510.98

639.49

595244.40

73111.00

62961.00

0.49

2014

527.49

661.76

643974.00

74916.00

61866.00

0.52

2015

544.71

681.50

689052.10

77116.00

60346.00

0.50

2016

563.34

688.83

743585.50

79298.00

58973.00

0.59

注:表中的高校毕业生初次就业人数=普通高校毕业生人数*初次就业率80%

数据来源:《国家数据·中国统计年鉴》

(一)多因素分析

使用 此模型进行分析

首先对其中各变量做相关系数矩阵:



可以看到,Y对各自变量相关性较强,Corr表示相关系数,通过其他变量对Y的关系,均发现其高度相关。下面对 整体进行数据的拟合,以计算最优回归方程,从而估计出大学生初次就业人数的预测值。考虑到几个变量与Y的相关关系较强,且多表现为线性相关。因而首先考虑在R中构建线性回归方程。如下:



得到了不错的结果,下面考虑使用赤池信息量AIC优化模型。



初始AIC为160.67,筛选后,AIC指标在删除S和Q后达到最优。可见,在已知的几个变量中,将五元回归模型转变为三元回归模型。通过显示的结果,得到了如下模型:

(二)模型的检验及修正

1. 多重共线性

上一步已经做过的AIC作为一种甄选最优模型的方法,可以有效防止多重共线性的产生。为验证其共线性,应用R中的VIF()函数计算方差膨胀因子,一般地,认为VIF>10即表示模型中存在着很强的共线性问题。计算得到:

 

 

表2              方差膨胀因子

P1

X

T

39.77309

25.03900

29.60196

 

表示存在着较强的多重共线性。模型还需要在原有基础之上重新构造。

现有模型数据整理如下:


表3
Year         Y         P         X                      T
1990 49.12 57.20 18872.90   84138.00
1991 49.12 61.68 22005.60         84620.00
1992 48.32 66.97 27194.50         84996.00
1993 45.68 59.71 35673.20         85344.00
1994 50.96 60.90 48637.50         85681.00
1995 64.40 62.00 61339.90  85947.00
1996 67.12 75.40 71813.60  85085.00
1997 66.32 92.40 79715.00  84177.00
1998 66.40 90.00 85195.50  83153.00
1999 67.84 92.60 90564.40  82038.00
2000 76.00 96.60 100280.10 80837.00
2001 82.88 100.00 110863.10 79563.00
2002 106.96 108.40 121717.40 78241.00
2003 169.60 159.70 137422.00 76851.00
2004 191.28 220.60 161840.20 75705.00
2005 245.44 268.30 187318.90 74544.00
2006 302.00 320.50 219438.50 73160.00
2007 358.23 335.00 270232.30 71496.00
2008 409.56 447.30 319515.50 70399.00
2009 424.88 504.46 349081.40 68938.00
2010 460.34 546.10 413030.30 67113.00
2011 486.53 565.92 489300.60 65656.00
2012 499.76 607.66 540367.40 64222.00
2013 510.98 639.49 595244.40 62961.00
2014 527.49 661.76 643974.00 61866.00
2015 544.71 681.50 689052.10 60346.00
2016 563.34 688.83 743585.50 58973.00

对以上数据构建Lasso回归模型,筛选合适的变量并重新构建模型


  其中x,y表示自变量/因变量的矩阵。Lars()函数仅适用于矩阵型数据。依次选取的变量为P1,T,X。作图观察。同时给出它的Cp值,如下:






Cp值越小,越能用于衡量多重共线性。取到第3步,Cp值最小,即三个自变量应全部保留。

多重共线性在使用AIC信息量进行判断时,是采用逐步回归方法(即判断是否存在多重共线性,又削弱了多重共线性的程度)确定得到的最佳模型。在此基础之上,我们采取Lasso回归的方法,让多重共线性的影响降到最低。因此该模型虽然膨胀因子较大,但多重共线性相对于其他模型相对较弱,多重共线性的问题也就得到了修正。

2. 自相关性

针对自相关性,采取BOX-COX变换中的对数变换,先输入:



这是一串EViews的代码,输出结果如下


此时构建的模型为:

DW统计量为1.049。给定显著性水平a=0.05水平下,查DW表,其中n=27,k’=3,得到dL=1.162,dU=1.651,因为0 <1.049<1.162,所以拒绝原假设,扰动项存在一阶正相关,再附上一张残差图吧,也能看的出来。

3. 分段回归

考虑到在数据选取过程中,由于1999年国家教育部出台政策的变化导致的当年招生人数大幅增加,间接使得2003届毕业生人数大幅增加。因此需要先对数据进行检验,考虑是否以分段回归方法在模型中加入0-1变量来更好的描述大学毕业生初次就业人数情况。



2002年入学招生人数为108.4万人,对应毕业生人数为106.96万人。而2003年入学招生人数为159.7万人,对应毕业生人数达到169.6万人。毕业生人数增长幅度远大于1990-2002年。尝试构建模型:

来拟合,其中

实际上,这是一个四元线性回归模型,而P_t受到虚拟变量影响,为了清楚起见,特引入两个新的自变量 ,便于大家理解,所以有:

对数据做一下处理,构建新的模型方程为:


要判别是否有必要对数据进行分段回归,只需对模型中P_t2的回归系数作显著性检验即可。由于在1990-2002年P_t2值为0,其对数不存在,因此特别规定当 值为NA时取值为0。


在EViews中输出结果如下:


结果指出,设置虚拟变量后产生的 不显著。分段回归后改变的是原变量 的斜率,而引入后,并未对其结果产生实质性的影响。所以后续研究过程中仍使用DW检验中的模型。

4. 自相关性的处理

对于DW检验后证实存在的自相关性,考虑使用Cochrane-Orcutt迭代对模型作变换,使变化后的误差项是序列独立的,在EViews中,每次回归的残差存放在resid序列中,为了对残差进行回归分析,需生成命名为e的残差序列。对e求其滞后一期的自回归,定义为 可得回归方程:


即:  可得 ,对原模型进行广义差分,得到广义差分方程:


对上述方程进行回归,输入以下代码:


得到输出结果如下:

该模型以1991-2016年数据为样本,样本容量损失了1个,为26个。在α=0.05水平下,查DW表,其中n=26,k’=3,得到dL=1.143,dU=1.652,落入无法判别区。考虑再次进行迭代,作二阶差分。

即:  可得  。对原模型进行广义差分,得到广义差分方程:


对上述方程进行回归,输入以下代码:

Ls LY-0.46*LY(-1)+0.41*LY(-2) CLP1-0.46*LP1(-1) +0.41*LP1(-2) LX-0.46*LX(-1) +0.41*LX(-2) LT-0.46*LT(-1)+0.41*LT(-2)

输出结果如下:

该模型以1992-2016年数据为样本,样本容量损失了2个,为25个。在α=0.05水平下,查DW表,其中n=25,k’=3,得到dL=1.123,dU=1.654,模型中DW=2.4530>dU,说明广义差分模型已无自相关,不必再进行迭代。同时可见,可决系数 ,t、F统计量也均达到理想水平。

代入相关数据拟合后,已知2018年高校毕业人数将达到820万,就业人数在初次就业率80%条件下估计值约为657万人。即置信区间为95%条件下,剩余的163万毕业生除部分成功考上研究生或自主创业并存活下来之外,其余人面临的就是“毕业即失业”的窘况。如何让这些毕业生走出校园在社会站稳脚跟,将成为对学生自身和政府民生工作的双重考验。


完毕

------------------------------------------------------------------------------------------

这是这篇论文中,对于这些数据进行各种处理的具体过程。中间有考虑过使用主成份分析构建一些新的变量来进行计算,因为影响就业的主要因素和国家发展的水平指标GDP,以及城镇、乡村人口这些指标看来似乎关联不大。我的推断也是根据一些与大雪山就业联系比较紧密的词频中挖掘到了这几个常出现的词汇,并加以分析。所以这篇文章的可信度仍然有限,但是研究的过程我个人认为还是比较有意义的,如果以后有一些成功的科研成果,我会对这篇文章进行进一步的完善。作为本科学生,能力有限,也希望大家给予合理指导,指出不足,从根本上否定的我也接受。

希望统计、数据分析的路上,有大家陪伴,会一起走的更远吧!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/71978.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PHP计算比较两段文字内容的重复率

一、介绍 用于比较两段文字内容的重复率二、运行结果 三、代码 <?php /*** 内容相似度计算*/ class GetSimilar{function __construct(){}function getSimilar($str1, $str2) {$len1 strlen($str1);$len2 strlen($str2);$len strlen($this->getLCS($str1, $str2, $…

抖音直播运营 | 疫情时代下如何用直播驱动品牌业务增长

自从提出「兴趣电商」概念后&#xff0c;抖音便开始逐步发力并推出三大扶持计划。大量商家入驻抖音电商&#xff0c;争相踏入品牌自播这一黄金赛道&#xff0c;在疫情时代下找到了效率更高、品牌价值链更短的新零售模式。 货架电商的特征是指数式增长、顾客货比三家&#xff0c…

抖音如何直播汉字找不同小游戏

在电脑下载电脑版微信、直播伴侣2款软件&#xff1b; 免费玩小程序可以在微信小程序搜索&#xff1a;火眼金睛汉字找不同、金金汉字找不同、范范汉字找不同、九九汉字找不同&#xff0c;这4个名字都可以&#xff0c;包含基本功能&#xff1b; 定制版VIP小程序联系微信号&…

如何用直播摄像机、编码器、电脑端OBS软件在抖音平台上做推流直播现实背景

现实背景 自2021年以来&#xff0c;抖音平台提高了电脑推流直播门槛&#xff0c;导致很多人无法通过电脑软件做推流直播&#xff0c;也无法通过第三方推流工具做直播&#xff0c;具体要求如下图所示&#xff1a; 抖音平台的新规则如下&#xff1a;硬性条件&#xff1a; 1. 需实…

利用OBS推流抖音直播电脑屏幕或PC游戏

抖音目前的火爆程度相信大家都有目共睹&#xff0c;抖音也为部分活跃用户提供直播功能&#xff0c;开通直播的方法有&#xff1a;①抖音粉丝达到10000粉丝&#xff0c;官方会自动邀请你开通直播权限。②加入和抖音官方合作的工会&#xff0c;无需粉丝&#xff0c;也可以开通直播…

抖音弹幕互动游戏直播怎么弄?

● 本质上是基于直播的一种实时互动玩法&#xff0c;用户可以通过直播间互动行为实现跟主播之间的实时互动&#xff1b; ● 主播开启玩法后进行投屏分享&#xff0c;用户通过发送评论/赠送礼物来影响主播侧的玩法内容&#xff1b; ● 特定礼物流水&#xff08;即魔法镜、能量电…

最常用的抖音直播话术大全,新手主播快收藏

1.高客单直播间主播话术怎样说? 第一 首先高客单价的女装播的时候一定要着重去讲你的做I、你的设计、你的款式、你的品牌、你 的独特性,要知道高客单消费人群需要的是价值,示范:各位姐妹们看一下主播身上的这款水雾蓝的 设计款连衣裙给大家做了一个内衬,领子立起来特别的好看,…

怎么把短视频做成gif图?短视频生成gif的步骤

在平时大家刷手机的时候&#xff0c;经常能够刷到一些短视频&#xff0c;我们经常可以看到很多由mp4视频转化成的精彩动图片段&#xff0c;那么应该怎么吧短视频做成gif图呢&#xff1f;其实视频转gif的方法非常简单&#xff0c;今天就来教大家一个在线视频转gif格式的方法&…

短视频程序源码,如何实现短视频的热门页面

之前做过一些短视频程序源码和直播项目&#xff0c;但是很多部分使用的是别的公司做好的SDK&#xff0c;由于不想像傻瓜一样不知道具体实现方式的调用来调用去&#xff0c;我决定自己做一个完全开源的&#xff0c;没有任何封装的SDK的短视频程序源码。 在实现短视频程序源码的…

短视频源码APP开发——短视频的功能

说到短视频&#xff0c;首先想到的就是抖音快手。毫无疑问&#xff0c;这两款短视频app是目前最受欢迎的&#xff0c;各大巨头都在布局短视频市场。短视频相比传统的文字、图片&#xff0c;在宣传和传播方面&#xff0c;短视频更有趣&#xff0c;传播范围广&#xff0c;短短几分…

什么是爆款视频生成器?怎么开发搭建

一、 什么是爆款视频生成器&#xff1f; 爆款视频生成器&#xff0c;是为创作者提供全方位创作灵感&#xff0c;创意脚本支持的短视频生成工具&#xff0c; 爆款文案热门话题创意标题&#xff0c;模板化视频制作加持&#xff0c;助力商家流量提升及团单转化的一种微信小程序。…

图文一键生成短视频工具

文字转视频好用的工具有哪些&#xff1f;文字图片一键自动朗读转视频文件解放双手&#xff0c;一刀工具箱提供在线文字转语音短视频制作必备工具。 代码片段 //2018.9.22 下载与打包生成视频static function buildMp4($id){if($id){$lists self::where("is_convert&qu…

短视频源码,成品短视频app源码搭建第一步

随着短视频平台的兴起&#xff0c;短视频app也成为了移动应用市场的一大风口。开发一款成品的短视频app需要大量的资源和时间&#xff0c;而使用现成的小视频app源码则可以快速地搭建出一个基础功能完备的短视频app。本文将介绍如何选择适合自己的小视频app源码&#xff0c;作为…

Google发布文本内容生成短视频工具:Imagen Video

我是卢松松&#xff0c;点点上面的头像&#xff0c;欢迎关注我哦&#xff01; AI视频机器人方面的两个突破性进展&#xff0c;一个产品叫imagen video,可以生成1280768的24帧的高清视频片段&#xff0c;另一个叫PHENAKI,可以根据文字描述生成长视频。 最近Google发布文本内容…

时隔 5 年,3 年匠心打造的 Godot Engine 4.0 都带来了哪些惊喜?

【CSDN 编者按】语言经历了漫长的等待&#xff0c;万众瞩目的 Godot Engine 4.0 正式版在其 3.0 版本发布 5 年以后&#xff0c;终于带着海量令人兴奋的新功能横空出世&#xff01; 整理 | 开发游戏的老王 责编 | 王子彧 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews…

chatgpt赋能python:Python中如何暂停程序的执行

Python中如何暂停程序的执行 Python是一种高级的编程语言&#xff0c;它的语法简洁、易于理解&#xff0c;并且在各种领域都有广泛的应用。在编写代码时&#xff0c;我们经常需要在程序的执行过程中暂停或延迟某些操作&#xff0c;这在很多情况下对程序的性能、稳定性和可读性…

【GPT】文本生成任务(生成摘要、文本纠错、机器翻译等的模型微调)

note 文章目录 note一、NLG任务二、NLG之文本摘要2.1 基于mT5的文本摘要2.2 基于openai接口测试2.3 基于chatGPT接口 三、根据自己的数据集进行模型微调四、文本纠错任务五、机器翻译任务Reference 一、NLG任务 NLG&#xff1a;自然语言生成任务&#xff0c;很多NLP任务可以被…

英语四六级考试技巧/英语四六级真题

先问一个残忍的问题&#xff1a; 同学&#xff0c;四六级英语考试准备好了吗 介绍一下四六级占分比例&#xff1a;写作 15%听力 35%阅读 35%翻译 15% 如果时间够多的话 当然是积累词汇量了选择一款背单词APP准备起来没事听听英语听力&#xff0c;找到感觉 如果时间不够多的话&…

服务器远程拒绝访问解决办法之一

把如图所示的用户权限分配中的【拒绝通过远程桌面服务登录】里面的用户删掉。

拒绝用户访问

Failed to execute goal org.mybatis.generator:mybatis-generator-maven-plugin:1.3.6:generate (default-cli) on project booksys: Access denied for user ‘root’‘localhost’ (using password: 出现这个问题有很多种可能导致&#xff1a; 解决方案1&#xff1a; 重新启…