面板数据进行熵值法

面板数据熵值法分析流程如下:

一、案例背景

当前有9家公司连续5年(2018-2022年)的财务指标数据,想要通过这份数据,确定各个财务指标的权重。熵值法根据指标离散程度确定赋权大小,客观公正准确度高。本次收集的指标数据不多,选择熵值法确定指标权重具有很强的操作性,运算过程简单易操作。

数据为9家公司连续5年的5个财务指标的数据,因为同时包含时间序列数据和截面数据,所以属于面板数据。应该有9*5=45行数据,5个财务指标各占一列,同时公司编号和年份各占一列,最后应该为45行*7列数据,最终应该将数据整理为如下格式:

数据虚构,仅做教学演示

二、数据处理

使用熵值法进行分析,需要对数据进行处理,包括数据方向处理和数据量纲处理。

(1)方向处理

本次分析的5个指标分别为营业利润、资产总额、负债总额、流动比率、销售成本。可以看出,这5个指标既有正向指标(越大越好的指标,如利润),又有逆向指标(越小越好的指标,如成本)。熵值法的运算规则中,正向指标越大越好,逆向指标越小越好,所以需要对数据进行方向处理。

将正向指标“营业利润”、“资产总额”、“流动比率”使用SPSSAU进行正向化处理;将逆向指标“负债总额”、“销售成本”使用SPSSAU进行逆向化处理。

SPSSAU【生成变量】->正向化/逆向化->确认处理,操作如下图:

同理,将其他两个指标进行逆向化处理即可。

(2)量纲处理

熵值法消除数据方向的影响后,还需要消除由于数据单位不同造成的影响,即进行量纲处理,SPSSAU提供十几种量纲处理方法,这里推荐使用数据归一化进行处理。

本案例因为上述分析中已经进行了正向/逆向此两种处理,而正向/逆向化处理可同时解决方向和量纲问题,所以不需要再次进行归一化处理。数据处理完成之后,接下来进行面板熵值法操作说明。

三、面板熵值法操作

熵值法是根据熵值进行权重确定的。“熵”原本是热力学的概念,后来被引入到信息论中,用于客观确定权重。熵值原理是通过指标的离散程度判断权重大小,离散程度越大说明不确定因素越多,对评价结果影响越大,权重越大。

从熵值的计算原理上看,并不会考虑是否为面板数据,面板数据与普通数据完全一致,直接放入分析即可。

从分析角度来看,针对面板数据,可以从两个角度进行熵值法分析,说明如下表:

接下来分别使用两种方法进行面板数据熵值法操作说明。

(1)一次法

在SPSSAU系统中,综合评价【熵值法】->将处理后的数据全部拖拽到分析框中->非负平移->开始分析

此时得到权重即为不区分是否面板数据,直接一次进行熵值法计算得到的指标权重。

补充非负平移:经过正向化/逆向化/标准化处理的数据,指标数据范围可以取到0,但是计算熵权时会进行取对数计算,出现0会导致计算无意义,所以需要对整体数据进行非负平移。SPSSAU非负平移功能是指,如果某列(某指标)数据出现小于等于0,则让该列数据同时加上一个“平移值”【该值为某列数据最小值的绝对值+0.01】,以便让数据全部都大于0,从而满足算法要求。

(2)多次法

分别筛选出2018-2022年的数据,进行5次熵值法,然后将得到的5次权重值进行取平均值的操作。

SPSSAU筛选操作如下:

筛选年份后,与一次法操作相同,分别进行5次熵值法,得到权重值,然后取平均值。

四、得到权重

(1)一次法权重计算结果

“一次法”进行面板数据熵值法得到权重结果如下:

使用熵值法对NMMS_负债总额等总共5项进行权重计算,从上表可以看出5个指标的权重值分别是18.58%、11.93%、19.45%、21/93%、28.11%。

SPSSAU输出权重可视化结果如下图:

(2)多次法权重计算结果

“多次法”进行面板数据熵值法,得到权重汇总结果如下表:

“多次法”进行熵值法,得到5个指标的权重值分别为37.54%、28.74%、29.97%、24.07%、18.46%、27.76%。

两种方法进行面板数据熵值法得到权重值对比见下表,可以看出两种方法计算面板数据的熵值法,得到的指标权重值接近。

提示:“多次法”进行面板数据熵值法分析,从原理上可行,此种做法是出于分析考虑,考虑了不同年份时数据的波动差异性。

五、总结

面板数据进行熵值法,与普通数据进行熵值法类似。首先需要统一数据方向,对正向指标进行正向化处理、逆向指标进行逆向化出理。如果数据单位不一致,需要消除量纲的影响,进行数据标准化处理。但是数据经量纲处理后,很可能出现负值,熵值法计算过程中包括取对数的操作,所以需要对数据进行非负平移,以确保分析结果能顺利得出。

面板数据进行熵值法有两种方法可以选择,分别是“一次法”和“多次法”。一次法不考虑是否面板数据,与普通数据一样做一次分析即可;多次法按年份分析,分别求出每一年指标的权重,然后取平均值。两种方法进行面板数据熵值法得到的指标权重值接近,多次法考虑了不同年份数据的波动差异性,两种方法研究人员可以自行选择来进行面板数据熵值法分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39685.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

跨数据中心下的 Kafka 高可用架构分析

导语 本文介绍了 Kafka 跨数据中心的两种部署方式,简要分析两种方式下的不同架构以及优缺点,对这些架构可能碰到的问题也提供了一些解决思路;同时也说明了 Kafka 跨数据中心部署的社区解决方案和商业化解决方案。 背景 Kafka 作为世界上最…

分布式的流处理平台Kafka

目录: 一、简介二、基本概念三、生产者使用详解四、发送消息五、消费者代码示例 一、简介 ApacheKafka 是一个分布式的流处理平台。它具有以下特点: 支持消息的发布和订阅,类似于 RabbtMQ、ActiveMQ 等消息队列;支持数据实时处理…

熵_相对熵_散度

1 信息量 意外越大,越不可能发生,概率就越小,信息量也就越大,也就是信息越多。比如说“今天肯定会天黑”,实现概率100%,说了和没说差不多,信息量就是0。 详见:2. 信息量 1.1 公式 …

流批一体计算引擎-4-[Flink]消费kafka实时数据

Python3.6.9 Flink 1.15.2消费Kafaka Topic PyFlink基础应用之kafka 通过PyFlink作业处理Kafka数据 1 环境准备 1.1 启动kafka (1)启动zookeeper zkServer.sh start(2)启动kafka cd /usr/local/kafka/ nohup ./bin/kafka-server-start.sh ./config/server.properties >&g…

【仿牛客网笔记】 Kafka,构建TB级异步消息系统——发送系统通知、显示系统通知

定义时间主题 判断消息内容是否为空,消息格式是否错误。 系统通知是后台发给用户 发送站内通知 构造一个Message对象 设置站内的值 判断是否有数据,然后放入到message中 对CommentController、LikeController、FollowController进行处理。 需要注入…

kafka集群压测与优化

影响kafka集群性能的因数有多个,网络带宽、cpu、内存、磁盘读写速度、副本数、分区数、broker数量、内存缓存等因素都会影响kafka集群的性能 1.优化kafka集群配置 server.properties配置文件优化 num.network.threads4 num.io.threads4 socket.send.buffer.bytes…

熵,信息熵,香农熵,微分熵,交叉熵,相对熵

2019-07-13 https://blog.csdn.net/landstream/article/details/82383503 https://blog.csdn.net/pipisorry/article/details/51695283 https://www.zhihu.com/question/41252833 https://cloud.tencent.com/developer/article/1397504 按顺序查看更容易理解 0、背景 在信息论中…

【Hive】云任务大量卡住故障分析

项目场景: 上一章节我们简单介绍到了JVM调优相关的知识,本章节结合日常故障处理进一步说明相关的使用 问题描述 在云上,hive任务出现大面积卡住的现象,但并无任何报错信息,具体如下: 原因分析&#xff1…

Linux服务器出现异常和卡顿排查思路和步骤

目录 前言一、查看内存使用情况二、查看磁盘使用情况三、top命令3.1 jmap分析堆内存配置信息和使用情况3.2 jstack分析线程的执行情况3.3 jstat查看各个区域占堆百分比 四、其他指令总结 前言 Linux 服务器出现异常和卡顿的原因有很多,以下是一些常见的原因&#x…

熵、交叉熵和散度

熵 自信息 I(x) - log p(x) 对于分布为P(x)的随机变量X,自信息的数学期望 即熵H(X)定义为: 熵越高,随机变量信息越高,反之越少。不同概率分布对应熵如下:P p()熵10001/21/41/41/31/31/3 概率分布越均匀&#xff0…

【腾讯轻量应用服务器上部署kafka并通过flink读取kafka数据】

环境准备 经过1个月的摸索,最终选择在腾讯云上搭建一个学习环境。当时选择原因还是新用户有优惠(150左右3年),但现在看1核2g的配置勉强够用,建议后续小伙伴选择时最好是2核4g配置。 由于是单节点安装,需要准备如下资源&#xff1…

【Twitter Storm系列】flume-ng+Kafka+Storm+HDFS 实时系统搭建

技术交流群:59701880 深圳广州hadoop好友会 微信公众号:后续博客的文档都会转到微信公众号中。 一直以来都想接触Storm实时计算这块的东西,最近在群里看到上海一哥们罗宝写的FlumeKafkaStorm的实时日志流系统的搭建文档,自己也跟…

学习笔记之信息量、熵、KL散度、交叉熵的一些介绍

文章目录 信息量熵KL散度(相对熵)交叉熵参考 信息量 以前我也一直只是知道信息量的计算公式,也有想过为什么会是这样,但是因为要学的东西太多了,就没怎么深究,直到看了“交叉熵”如何做损失函数&#xff1…

AI产品经理是如何理解机器学习的(附注释)

本期目的:回顾之前敲代码的日常,利用生活场景帮助AI产品经理认识机器学习及学习过程中常用算法和评价指标。 适用读者:AI/数据产品经理。 阅读重点:品,细品,结合班级故事再品。 最近看了很多关于机器学习…

卢伟冰称小米今年库存会回到更健康水位 将加大门店整合调整

雷递网 乐天 3月25日 小米集团(股票代码为:1810)今日发布财报,财报显示,小米集团2022年营收为2800亿元,较上年同期的3283亿元下降14.7%。小米2022年经调净利为85亿元。 小米2022年第四季度营收为660.47亿元…

小米年营收2800亿:经调整利润85亿 电动汽车业务投入31亿

雷递网 雷建平 3月24日 小米集团(股票代码为:1810)今日发布财报,财报显示,小米集团2022年营收为2800亿元,较上年同期的3283亿元下降14.7%。 2022年,小米集团的境外市场收入为1378亿元&#xff0…

什么是低代码开发平台(apaas)?低代码开发平台的价值有哪些

手码6500字,带你快速看懂:什么是低代码开发平台(apaas),低代码有哪些价值,以及低代码平台的使用逻辑和心得。 一、什么是低代码开发平台(apaas)? 低代码开发平台是一种a…

详解如何在ChatGPT内构建一个Python解释器

这篇文章主要为大家详细介绍了如何在ChatGPT内构建一个Python解释器,文中的示例代码讲解详细,具有一定的学习价值,需要的可以参考一下 目录 引用:Art Kulakov 《How to Build a Python Interpreter Inside ChatGPT》 这个灵感来自…

如何画各种“图”?

我们在写文档过程中,多多少少都会画一些图来说明程序的功能,这篇文章就来说明一些常用的"图"怎么画。 1,画图工具 常用的有这么几种 Visio:这是很常用的,基本上的图都可以用这个来画。StarUML&#xff1a…

patreon cg人物插画作品合集分享

1、wlop大神作品4K-8K精选无水印图片http://theme.chengxuz.com/265.html 2、加拿大女画师sakimi chan作品1-98期插画http://theme.chengxuz.com/250.html 3、画师Mirco Cabbia插画作品合集欣赏http://theme.chengxuz.com/306.html 4、画师Sciamano240插画作品分享http://th…