提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
目录
文章目录
一、pyecharts是什么?
二、八爪鱼的是什么以及有何作用
三、数据集的准备
四.使用pyecharts进行图像可视化
1.导入库
2.读入数据
3 、绘制多重柱状图
4、绘制雷达图
总结
一、pyecharts是什么?
Echarts是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
二、八爪鱼的是什么以及有何作用
八爪鱼采集器是深圳视界信息技术有限公司研发的一款业界领先的网页采集软件,具有使用简单,功能强大等诸多优点。
八爪鱼采集器是一款全网通用的互联网数据采集器,模拟人浏览网页的行为,通过简单的页面点选,生成自动化的采集流程,从而将网页数据转化为结构化数据,存储于EXCEL或数据库等多种形式。并提供基于云计算的大数据云采集解决方案,实现数据采集。是数据一键采集平台。
八爪鱼采集器以分布式云计算平台为核心,结合智能识别算法,可视化的操作界面。从不同的网站或者网页获取标准化数据。帮助需要从网页获取信息的客户,数据自动化标准化采集、导出,提高效率 。
八爪鱼采集器作为数据收集工具,服务于国内企业/单位。是一个四种语言版本的采集软件,覆盖汉语,英语,日语,西班牙语。
三、数据集的准备
本次我们采集数据的网站是赛高Score,一款专注于电竞的数据网站。
网址如下
www.scoregg.com
第一步:打开我们的八爪鱼数据采集工具。
第二步:开始采集自己想要获取的数据
这里我们采用LPL春季赛的数据页面英雄联盟选手数据库_选手数据查询_lol赛事查询-最宠粉的电竞玩家赛事社区
在这里选择没有要采集的数据设置登陆的任务进程
输入账号密码后点击已完成登录就会自动跳转到要采集的页面
这里选择本地采集就好了
我这里选择的是Excel格式,可以根据所需要的方式保存数据。
四.使用pyecharts进行图像可视化
1.导入库
Pandas是基于Numpy的专业数据分析工具, 可以灵活高效的处理各种数据集
它提供了的数据结构有DataFrame和Series等
我们可以简单粗的把DataFrame理解为Excel里面的一张表,而Series就是表中的某一列
import pandas as pd
2.读入数据
data_user = pd.read_excel('./中单数据.xlsx')
data_user
3 、绘制多重柱状图
pyecharts团队将其支持的图表类型归纳为以下几个类型:基本图表、直角坐标系图表、树型图表、地理图表、3D图表、组合图表。
对于分析师来讲,我们日常工作中使用最多的当属折线图、柱状图、散点图、箱型图等直角坐标系图表,当然还有饼图,不过饼图在此处被归于基本图表。这里采用多重柱状图能够很直接的看出各选手之间的重要数据对比。
from pyecharts import options as opts
from pyecharts.charts import Bar
# 数据类型的转换
x = data_user['选手ID'].tolist() # 转换成list对象
y1 = data_user['击杀'].tolist()
y2 = data_user['死亡'].tolist()
y3 = data_user['助攻'].tolist()
bar = (Bar(init_opts=opts.InitOpts(width='1200px',height='600px') # 初始化配置项).add_xaxis(x).add_yaxis("击杀",y1,color = 'pink').add_yaxis("死亡",y2,color = 'red').add_yaxis("助攻",y3,color = 'skyblue')
# .set_colors([ "#00ff00", "#ffcc00"]) # 另一种颜色设置方法.set_global_opts(title_opts=opts.TitleOpts(title="LPL中单选手数据", subtitle="我是副标题"))
)bar.render_notebook()
4、绘制雷达图
雷达图简洁、方便、精确、直观,可以体现较多的数据信息,可以将多维数据投影到平面上,实现多维数据的可视化。
雷达图是对客户财务能力分析的重要工具,从动态和静态两个方面分析客户的财务状况。静态分析将客户的各种财务比率与其他相似客户或整个行业的财务比率作横向比较;动态分析把客户现时的财务比率与先前的财务比率作纵向比较,就可以发现客户财务及经营情况的发展变化方向。
雷达图把纵向和横向的分析比较方法结合起来,计算综合客户的收益性、成长性、安全性、流动性及生产。
在这里我们使用雷达图对比前五名的数据。
import pyecharts.options as opts
from pyecharts.charts import Radarv1 = [data_user1['Scout'].tolist()]
v2 = [data_user1['knight'].tolist()]
v3 = [data_user1['FoFo'].tolist()]
v4 = [data_user1['Xiaohu'].tolist()]
v5 = [data_user1['Yagao'].tolist()](Radar(init_opts=opts.InitOpts(width="1280px", height="720px", bg_color="#CCCCCC")).add_schema(schema=[opts.RadarIndicatorItem(name="MVP次数", max_=20),opts.RadarIndicatorItem(name="获胜次数", max_=50),opts.RadarIndicatorItem(name="击杀", max_=500),opts.RadarIndicatorItem(name="助攻", max_=500),opts.RadarIndicatorItem(name="死亡", max_=200),],splitarea_opt=opts.SplitAreaOpts(is_show=True, areastyle_opts=opts.AreaStyleOpts(opacity=1)),textstyle_opts=opts.TextStyleOpts(color="#fff"),).add(series_name="Scout",data=v1,linestyle_opts=opts.LineStyleOpts(color="#CD0000"),).add(series_name="knight",data=v2,linestyle_opts=opts.LineStyleOpts(color="#5CACEE"),).add(series_name="FoFo",data=v3,linestyle_opts=opts.LineStyleOpts(color="#5CACEE"),).add(series_name="Xiaohu",data=v4,linestyle_opts=opts.LineStyleOpts(color="#5CACEE"),).add(series_name="Yagao",data=v5,linestyle_opts=opts.LineStyleOpts(color="#5CACEE"),).set_series_opts(label_opts=opts.LabelOpts(is_show=False)).set_global_opts(title_opts=opts.TitleOpts(title="基础雷达图"), legend_opts=opts.LegendOpts()).render_notebook()
)
总结
感谢大家的观看。