可视化看板:
分析背景:偶然看到一篇腾讯新闻讲“上市公司是地方经济的缩影,上市企业对于区域经济的贡献和影响越来越大,其数量和质量也直接反映了一个地区的经济实力和活跃度。”让我们使用PowerBI可视化A股上市公司区域分布情况吧。
一. 数据采集:
股票数据整理得好的软件当然是同花顺,通过同花顺的i问财就可以免费下载到想要的数据,数据格式是xlsx。这里限定了三个条件主要是想获取地区分布,市值,上市时间 这些数据。
这里有个坑,下载后的数据需要手动打开一次,信任数据来源,不然导入powerbi时会显示数据损坏。
二. 数据清洗:
本次数据清洗使用powerbi的powerquery。从表中可知整个A股总共有5092家公司,但查看数据后发现,有部分公司只是即将上市,还没发行股票,故剔除了这几家公司。
整体看来数据内容完好,基本不需要清洗。只是为了方便数据指标的搭建,删除了几列不需要的数据,重新计算了总市值列,拆分了上市日期列,增加城市的经纬字段。
这里我们要获取城市的坐标绘出的可视化地图才准确。所以利用了高德地图API转换出城市的经纬坐标数据。具体怎么获取API可参考网址:https://blog.csdn.net/guanj0623/article/details/121920636
本文只讲解在powerbi中使用这个api把城市的经纬等信息都转换出来的步骤。
首先,先在管理参数这里创建一个文本参数Geo。
在新建源这里选择web,输入高德API网址获取参数北京市的坐标信息。网址:https://restapi.amap.com/v3/geocode/geo?address="&Geo&" &output=XML&key=你的key"
网址输入后得到一张表,取名为Geo1。展开geocode列里面的location就是我们要的经纬坐标,按逗号分隔符拆分列就能得到经度和纬度。
再选择Geo1这张表鼠标右键创建新函数,取名为Get_Geo。
按图中步骤就能批量获取地区的坐标了。
应用更改,最终数据的全貌:
三. 构建指标:
创建了一张空度量表来存放接下来要新建的度量值。
新建度量值主要使用的DAX函数如下:
2022年上市公司数 = CALCULATE([上市公司(总数)],FILTER(Sheet1,Sheet1[上市日期(年)]=2022))
上市公司(总数) = SUMX(Sheet1,Sheet1[列])
省公司数排名 = RANKX(ALLSELECTED(Sheet1[省份]),[上市公司(总数)],'度量表'[上市公司(总数)],DESC)
市值排名 = RANKX(ALLSELECTED(Sheet1),[总市值(亿元)],,DESC)
占比 = '度量表'[上市公司(总数)]/[allselected清除筛选]
总市值(亿元) = SUM(Sheet1[总市值(亿元)])
allselected清除筛选 = CALCULATE('度量表'[上市公司(总数)],ALLSELECTED(Sheet1))
四. 可视化结果:
地理图:结合气泡的大小呈现上市公司数量分布情况。
矩阵图:简单明了的展示了各省上司公司省数量信息,并做了排名处理,最后两列展示的是过去两年上市的公司数,这个数量能说明该省经济潜力巨大,未来经济有望腾飞。
树状图:汇总了A股上市公司的行业分布情况,文字说明所属行业,数字展示该方向发展的公司数。
柱状图:从市值来看,很明显的长尾效应,东西部差距过大。
表:
五. 分析(未更新完)
上市公司数量最多的是广州省,先着重分析。
从地理图可以看到广东省的上市公司主要集中在珠三角区域,而且广东省50%的公司都位于深圳市,具有明显的虹吸效应。结合市值排行图也可以发现广东省内市值靠前的公司也是位于珠三角区域。
从下图的行业分布来看广东省的信息产业尤为发达,机械设备公司也占大头。这说明广东省的科技和工业是百花齐放,实力雄厚。
总得来说广东省发达区域太过集中于珠三角,明显的省内大部分地方的发展发展不平衡,这会削弱全省经济持续快速发展的后劲。
从地理上看,可能是内地交通设施不完善,不如沿海的区域便捷。那么政府可以加强交通设施的修建,让广东省的内地也能较快的与其它区域交流合作。