基于面板数据的熵值法介绍与实现

熵值法是一种基于信息熵理论的客观赋值方法。即数据越离散,所含信息量越多,对综合评价影响越大。

目录

        • 一、基于面板数据熵值法介绍
        • 二、R语言实现
        • 参考文献

一、基于面板数据熵值法介绍

        传统的熵值法有个弊端,只能针对于截面数据,即根据某一年 k k k个地区 j j j项指标进行综合评价。而在实际处理经济型数据过程中,经常会遇到面板数据。即根据 m m m个年份, k k k个区县, j j j项指标对其进行综合评价。其具体过程如下(与传统的熵值法过程非常相似,主要是第二步和第三步有区别):

(1) 指标标准化处理

正向指标 Z α i j = x α i j − x m i n x m a x − x m i n \text{正向指标}Z_{\alpha ij}=\frac{x_{\alpha ij}-x_{min}}{x_{max}-x_{min}} 正向指标Zαij=xmaxxminxαijxmin 负向指标 Z α i j = x m a x − x α i j x m a x − x m i n \text{负向指标}Z_{\alpha ij}=\frac{x_{max}-x_{\alpha ij}}{x_{max}-x_{min}} 负向指标Zαij=xmaxxminxmaxxαij 式中, x m a x \mathit{x_{max}} xmax x m i n \mathit{x_{min}} xmin分别代表第 j \mathit{j} j项指标的最大值和最小值; x α i j x_{\alpha ij} xαij z α i j z_{\alpha ij} zαij分别代表第 j \mathit{\:j\:} j项指标标准化处理前和处理后的值。

(2) 指标归一化
P α i j = Z α i j ∑ α = 1 m ∑ i = 1 k Z α i j P_{\alpha ij}=\frac{Z_{\alpha ij}}{\sum\limits_{\alpha=1}^{m}\sum\limits_{i=1}^{k}Z_{\alpha ij}} Pαij=α=1mi=1kZαijZαij

(3) 计算熵值
E j = − k 1 ∑ α = 1 m ∑ i = 1 k P α i j l n P α i j E_{j}=-k_{1}\sum\limits_{\alpha=1}^{m}\sum\limits_{i=1}^{k}P_{\alpha ij}ln{P_{\alpha ij}} Ej=k1α=1mi=1kPαijlnPαij
其中, k 1 = 1 l n ( m × k ) k_{1}=\displaystyle\frac{1}{ln(m \times k)} k1=ln(m×k)1

(4) 计算各项指标的冗余度
D j = 1 − E j D_{\mathit{j}}=1-E_{\mathit{j}} Dj=1Ej

(5) 计算各项指标权重
W j = D j ∑ j = 1 n D j W_{\mathit{j}}=\frac{D_{\mathit{j}}}{\sum\limits_{\mathit{j=1}}^{n}D_{\mathit{j}}} Wj=j=1nDjDj

(6) 得到各区县的综合经济指数
I α i = P α i j × W j I_{\alpha i}=P_{\mathit{\alpha ij}} \times W_{\mathit{j}} Iαi=Pαij×Wj

二、R语言实现

以重庆市各区县为例,选取如下九项指标数据构建综合经济指数,数据来源《重庆统计年鉴》,时间范围为2009-2018年。

一级指标二级指标
经济实力GDP(国民生产总值)
全社会固定资产投资
社会消费品总额
经济质量第三产业/GDP
人均GDP
区县一般公共收入/GDP
社会生活农村居民人均纯收入
人均一般公共服务支出
城镇居民人均可支配收入

部分数据展示如下:
在这里插入图片描述

代码如下:

#根据数据实际情况,修改初始参数
setwd('C:/Users/dell/Desktop')
library(xlsx)
k=38  #区县个数
m=10  #年份
n=9  #指标个数#读取数据
data.list=list()
for(i in seq(n))data.list[[i]]=read.xlsx('df.xlsx',sheetIndex = i,encoding='UTF-8')caculate_p<-function(x) {z<-(x[,-1]-min(x[,-1]))/(max(x[,-1])-min(x[,-1]))p<-z/(sum(z))
}
P<-lapply(data.list,caculate_p)caculate_d<-function(x){a<-x*log(x)a[is.na(a)]<-0d<-(1-(-sum(a)/log(k*m)))
}
d<-sapply(P,caculate_d)#输出权重
w<-sapply(d,function(x) {x/sum(d)})
print(w)#得到每年九个指标的Pij
rank=list()
data=data.frame(matrix(0,k,0))
for(j in seq(m))
{  for(i in seq(n)){data[paste0("指标",i)]=as.vector(P[[i]][,j])rank[[j]]=data}
}#写出各年区县的综合经济指数
year=2018 
for(i in seq(length(rank)))
{score<-as.matrix(rank[[i]]) %*% w  #计算各区县综合指数county_score<-data.frame(cbind(as.character(data.list[[1]][,1]),score))  #添加区县名colnames(county_score)<-c("区县",'综合经济指数')write.xlsx(county_score,file='rank.xlsx',sheetName=paste0(year,'年'),append=TRUE,row.names=F)cat(paste0(year,'年写入完毕\n'))year<-year-1
}

写出的文件则是2009-2018年各区县的综合经济指数。

各指标权重占比依次为(GDP、社会消费品总额、…)
在这里插入图片描述

生成各年份各区县的综合经济指数如下图所示:
在这里插入图片描述

注意:
1、代码中的k、m、n参数根据实际数据进行修改
2、需要将数据文件放置R的工作路径中

由于原指数太小,对其乘以 1 0 4 10^{4} 104,绘制2009年和2018年各区县的综合经济指数柱形图:
在这里插入图片描述
从上图不难看出:
1、2018年各区县的综合经济发展指数明显要大于2009年各区县的综合经济发展指数,说明10年来重庆市各区县经济得到了较大的发展。

2、渝中区、江北区、九龙波区、渝北区综合经济发展水平较高,而城口县、巫溪县、巫山县、酉阳县经济发展水平较低

参考文献

[1]冯兴华,钟业喜,李峥荣,傅钰.长江经济带城市体系空间格局演变[J].长江流域资源与环境,2017,26(11):1721-1733.

后续将会将熵值法应用到空间相关分析中,敬请期待~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33421.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

信息熵的计算

信息熵计算公式&#xff1a; 演示数据&#xff1a; 性别&#xff08;x&#xff09;考试成绩&#xff08;y&#xff09;男优女优男差女优男优 X的信息熵计算为&#xff1a; p(男) 3/5 0.6 p(女) 2/5 0.4 根据上面的计算公式可得&#xff1a; 列X的信息熵 为&#xff1a; H&…

各种信息熵(Information entropy)的计算方法

一、Jensen不等式 若f为区间I上的凹函数&#xff0c;则Jensen不等式成立&#xff1a; 这里若函数f为凹函数&#xff0c;则有&#xff1a; 凹函数&#xff08;上凸&#xff09;如下图所示&#xff1a; 归纳证明&#xff1a; 二、信息论 1.熵&#xff08;信息不确定性度…

信息与信源熵

0x01 三个定义 信息 指各个事物运动的状态及状态变化的方式。人们从对周围世界的观察得到的数据中获得信息。信息是抽象的意识或知识&#xff0c;它是看不见、摸不到的。当由人脑的思维活动产生的一种想法仍被存储在脑子里时&#xff0c;它就是一种信息。 消息 指包含信息的…

python计算图片的信源熵值(信息熵)

附录&#xff1a; from PIL import Image from matplotlib import pyplot as plt import numpy as np import scipy as cp import math image Image.open(rC:\Users\Administrator\Desktop\IMG.jpg) # 读入和显示图像 imagesnp.asarray(image) plt.subplot(211) plt.imshow(im…

【熵的计算】

熵的计算 什么是熵&#xff1f; 定义&#xff1a; 熵是表示随机变量不确定性的度量 简单理解&#xff1a;熵就是混乱程度&#xff0c;一个集合中类别越多&#xff0c;越混乱&#xff0c;属于哪一个类别越不确定。 熵的计算公式&#xff1a; 简单理解一下公式&#xff1a; …

信息熵计算及代码

实验目的:了解离散信源数学模型和信息熵实验内容:以附件中英文文本文件中的内容为来源&#xff0c;构建26个英文字母(区分大小写)为信源符号的数学模型&#xff0c;要求输出字母的概率和该模型的信息熵。要求:请使用自己熟悉的编程语言&#xff0c;完成信源建模&#xff0c;输出…

信息熵的计算与分析

信息熵的计算与分析 一、[实验目的]二、[实验环境]三、[实验原理]四、[实验内容]五、[实验过程]1、二元信源熵函数曲线2、求解离散单符号信源熵3、计算图像一维图像熵 一、[实验目的] 1、掌握离散信源熵的原理和计算方法。 2、熟悉matlab 软件的基本操作&#xff0c;练习使 用…

【chatgpt】解除PDF的password

无论是Adobe Acrobat Pro还是Pdf xchange editor都是一样的&#xff0c;更改安全性就可以了。 把该加密Pdf导入软件&#xff0c;然后点文件&#xff0c;属性&#xff0c;安全性&#xff0c;改成无安全后确定就行了。 pdf是可携带文件格式&#xff0c;亦称“PDF(portable docum…

免费好用的聊天机器人上线,原Openai前员工们创立的Claude

1.下载slack,注册登录。 2.在claude网站上同意Al与你的slack账号相联接。 3.在slack里就可以直接与AI对话了。 4.网页端Mac、苹果手机、安卓都可以&#xff0c;win没试过&#xff0c;应该也可以。 具体的细致操作网上有&#xff0c;也可以留言讨论。 Anthropic是一家总部位…

国内又款智能AI聊天软件-科大讯飞星火模型

介绍 介绍 中国科大讯飞星火GPT聊天软件是一款基于自然语言处理技术的人工智能聊天机器人。它利用了大量的文本数据&#xff0c;通过深度学习模型进行训练&#xff0c;从而实现与用户的智能对话。讯飞星火GPT聊天软件能够理解用户输入的问题或指令&#xff0c;并根据预设的回答…

启英泰伦推出多种智能语音识别照明解决方案,改装简单,成本低

随着人工智能技术的普及&#xff0c;智能家居设备开始走进千家万户。而智能照明系统成为其不可或缺的一部分&#xff0c;占据着举足轻重的地位。 但是照明系统和其他家居设备不一样的是&#xff0c;开发商交房时已布好电路&#xff0c;或用户直接购买精装房&#xff0c;导致改…

让 ChatGPT 更智能,Tauri 带你实现 AI 对话应用

背景 Tauri 和 Electron 都是用于开发跨平台桌面应用程序的工具&#xff0c;因为最近使用ChatGPT在国内环境的确不够友好&#xff0c;又没有一个比较轻量简洁的工具可用&#xff0c;如是想自己造个轻量点的轮子&#xff0c;力争做到代码轻量&#xff0c;界面美观简洁&#xff…

[AI达人特训营第三期] 使用Lora技术用Dreambooth训练国潮风格模型

★★★ 本文源自AlStudio社区精品项目&#xff0c;【点击此处】查看更多精品内容 >>> DreamBooth 介绍 DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation是一种新的文本生成图像(text2image)的“个性化”&#xff08;可适应用…

【社群运营】AI智能对话,打造自动化社群

人工智能大背景下&#xff0c;各行各业都在往智能化发展&#xff0c;无论是办公产品&#xff0c;还是生产器械都选择接入了更加智能的AI来提高生产效率。那么&#xff0c;在日常的社群管理工作中&#xff0c;我们又能否跟上这一波热度&#xff0c;让社群自动化高效运营&#xf…

夏杰语音麦克精灵:智能语音交互升级新体验

对于很多人来说&#xff0c;通过语音声控电视、空调等家电已经不再陌生。 “你好小智&#xff0c;我想听音乐”、“你好小智&#xff0c;播放深圳卫视”……近几年&#xff0c;“小智”逐渐被人认识。是的&#xff0c;它是夏杰语音旗下的一款智能精灵——麦克精灵。它不仅可以…

跟着我学 AI丨ChatGPT 详解

随着人工智能的发展&#xff0c;聊天机器人成为了一个备受关注的领域。而ChatGPT作为其中的佼佼者&#xff0c;其功能和技术水平也越来越受到人们的关注。那么&#xff0c;什么是ChatGPT&#xff1f;它又有哪些优点和限制呢&#xff1f; ChatGPT是一款基于自然语言处理技术开发…

小红书内容种草,曝光渠道分析总结

这是一个内容为王的时代&#xff0c;也是一个内容爆炸的时代。想要在以分享特色的小红书平台&#xff0c;实现内容种草&#xff0c;迅速出圈。今天来马文化传媒就从实操的角度&#xff0c;为大家带来小红书内容种草&#xff0c;曝光渠道分析总结的各种干货&#xff01; 一、什…

小红书达人账号数据分析

文章目录 一、项目背景二、数据预处理1、查看数据2、数据清洗2.1对达人列表进行清洗2.2对涨分榜进行清洗2.3对MCN列表进行清洗2.4对定性变量&#xff08;分类变量&#xff09;进行处理 3、表格处理3.1合并达人列表和涨粉榜 三、分析与数据可视化1、对达人列表进行相关性分析2、…

小红书账号分析丨千瓜指数高的小红书账号是否真的优质?

关键词&#xff1a;千瓜指数、小红书数据、小红书账号分析 达人账号质量是否优质从多个维度衡量&#xff0c;千瓜指数能够客观综合评价达人账号的质量&#xff0c;给到小红书达人一定的参考价值。 那么千瓜指数能够帮助达人什么&#xff1f; 品牌筛选达人会选择更优质的&#x…

GPT逆向:高效解读小红书文案生成器的内部逻辑

文章目录 前言一、什么是小红书文案生成器二、具体步骤总结 前言 关注我的很多同学都会写爬虫。但如果想把爬虫写得好&#xff0c;那一定要掌握一些逆向技术&#xff0c;对网页的JavaScript和安卓App进行逆向&#xff0c;从而突破签名或者绕过反爬虫限制。 最近半年&#xff…