【数据可视化】全国星巴克门店可视化

🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者,提供AI相关的技术咨询、项目开发和个性化解决方案等服务,如有需要请站内私信或者联系任意文章底部的的VX名片(ID:xf982831907

💬 博主粉丝群介绍:① 群内初中生、高中生、本科生、研究生、博士生遍布,可互相学习,交流困惑。② 热榜top10的常客也在群里,也有数不清的万粉大佬,可以交流写作技巧,上榜经验,涨粉秘籍。③ 群内也有职场精英,大厂大佬,可交流技术、面试、找工作的经验。④ 进群免费赠送写作秘籍一份,助你由写作小白晋升为创作大佬。⑤ 进群赠送CSDN评论防封脚本,送真活跃粉丝,助你提升文章热度。有兴趣的加文末联系方式,备注自己的CSDN昵称,拉你进群,互相学习共同进步。

在这里插入图片描述

【数据可视化-13】全国星巴克门店可视化

  • 引言
  • 一、数据准备
    • 1.1 导入必要的库
    • 1.2 读取数据
    • 1.3 数据探索
    • 1.4 数据清洗
  • 二、数据可视化
    • 2.1 星巴克门店各个省份的数量可视化
    • 2.2 全国门店分布热点图地图可视化
    • 2.3 各省星巴克门店数量占比可视化
    • 2.4 星巴克门店营业时间段数量可视化
  • 总结

引言

  在该项目中我们将使用 pandaspyecharts 库来实现对星巴克全国门店数据的可视化分析。具体内容包括:

  1. 星巴克门店各个省份的数量可视化
  2. 全国门店分布热点图地图可视化
  3. 各省星巴克门店数量占比可视化
  4. 星巴克门店营业时间段数量可视化

  首先,你需要确保已经安装了 pandaspyecharts 库。如果尚未安装,可以使用以下命令进行安装:

pip install pandas pyecharts

一、数据准备

  接下来,让我们开始编写代码。

1.1 导入必要的库

import pandas as pd
from pyecharts.charts import Map, Pie, Bar, Line
from pyecharts import options as opts
from pyecharts.globals import ThemeType

1.2 读取数据

  假设我们有一个 CSV 文件 starbucks_locations.csv,其中包含星巴克门店的详细信息,如省份、城市、经纬度、营业开始时间、营业结束时间等。

# 读取星巴克门店数据
df = pd.read_csv('starbucks_locations.csv')

1.3 数据探索

# 读取星巴克门店数据
df.info()

1.4 数据清洗

print(df.shape)
# 尝试将time列转换为日期时间对象,无法转换的将被设置为NaT
df['开始营业时间'] = pd.to_datetime(df['开始营业时间'], format='%H:%M:%S', errors='coerce')
# 删除time列为NaT的行
df = df.dropna(subset=['开始营业时间'])# 由于time列现在已经是datetime类型,如果你想要保留原始字符串格式,可以将其转换回字符串
# 注意:这样做会丢失时间信息(如时区、日期部分等),除非你在转换时指定了这些信息
df['开始营业时间'] = df['开始营业时间'].dt.strftime('%H:%M:%S')
print(df.shape)


  删除了7行时间列异常的数据;

df['开始营业时间_1'] = pd.to_datetime(df['开始营业时间'])
df['停止营业时间_1'] = pd.to_datetime(df['停止营业时间'])
df['营业时长'] = df['停止营业时间_1'] - df['开始营业时间_1']
df['营业时长'] = pd.to_timedelta(df['营业时长'])
df['营业时长'] = df['营业时长'].dt.total_seconds()/3600
df['营业时长'] = df['营业时长'].apply(lambda x : x if x > 0 else x + 24)df['营业时长区间'] = pd.cut(df['营业时长'],bins=[0,8,10,12,14,16,24],labels=["0-8h","8-10h","10-12h","12-14h","14-16h","16-24h"])

  生成了营业时长和营业时长区间区间两个字段;

二、数据可视化

2.1 星巴克门店各个省份的数量可视化

# 星巴克门店最多10个城市
temp = df['省份'].value_counts().reset_index()
temp.columns = ['省份','计数']
temp1 = temp[:-2]
data_pair = [(row['省份'], row['计数']) for _, row in temp1.iterrows()]
top_city = sorted(data_pair, key=lambda x: x[1], reverse=True)[::-1]bar = (Bar(init_opts=opts.InitOpts(theme='dark',width='1000px', height='800px')).add_xaxis([x[0] for x in top_city]).add_yaxis("", [x[1] for x in top_city]).set_series_opts(label_opts=opts.LabelOpts(is_show=True, position='insideRight',font_style='italic',color='pink'),).set_global_opts(title_opts=opts.TitleOpts(title="星巴克门店各个省份的数量",subtitle='数据截止日期:2017年2月'),xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)),  #legend_opts=opts.LegendOpts(is_show=True),visualmap_opts=opts.VisualMapOpts(is_show=False,pos_top='60%',pos_left='40%',range_color=["green", "yellow", "red", "pink", "orange", "purple"])).reversal_axis())
bar.render_notebook()

2.2 全国门店分布热点图地图可视化

data_pair = []# 新建一个BMap对象
geo = Geo(init_opts=opts.InitOpts(theme='dark'))data_pair = [[temp.loc[i]['省份'],temp.loc[i]['计数']] for i in range(28)[:15]]geo = (geo.add_schema(maptype="china", zoom=1).add("", data_pair, type_='heatmap').set_series_opts(label_opts=opts.LabelOpts(is_show=False)).set_global_opts(title_opts=opts.TitleOpts(title="全国门店分布热点图",subtitle="数据截止日期:2017年2月"),legend_opts=opts.LegendOpts(is_show=False),visualmap_opts=opts.VisualMapOpts(is_show=True,max_=100, is_piecewise=False, range_color=['blue', 'green', 'yellow', 'red']))
)geo.render_notebook()

2.3 各省星巴克门店数量占比可视化

pie = (Pie(init_opts=opts.InitOpts(width='1000px', height='800px')).add(series_name="",data_pair=[list(z) for z in zip(temp['省份'][:28], temp['计数'][:28])],radius=["30%",'50%'],center=["38%", "50%"],label_opts=opts.LabelOpts(is_show=False, position="center"),).set_global_opts(title_opts=opts.TitleOpts(title='各省星巴克门店数量占比',pos_top='2%',pos_left="center",title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)),visualmap_opts=opts.VisualMapOpts(is_show=False,max_=600,pos_top='70%',pos_left='20%',range_color=['blue', 'green', 'yellow', 'red']),legend_opts=opts.LegendOpts(is_show=True, pos_right="15%", pos_top="8%",orient="vertical"),).set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))
)
pie.render_notebook()
pie.render("pie_set_color.html")

2.4 星巴克门店营业时间段数量可视化

  假设我们有一个字段 营业时间段,记录门店的营业时间范围,例如 “07:00-22:00”。

c = (Bar(init_opts=opts.InitOpts(width='1000px', height='400px')).add_xaxis(temp2['时间段'].tolist()).add_yaxis("基本柱状图", temp2['计数'].tolist(),itemstyle_opts=opts.ItemStyleOpts(color="#00CD96"))#自定义颜色.set_global_opts(title_opts=opts.TitleOpts(title="星巴克门店营业时间段数量", subtitle="数据截止日期:2017年2月"),brush_opts=opts.BrushOpts(), # 设置操作图表的画笔功能toolbox_opts=opts.ToolboxOpts(), # 设置操作图表的工具箱功能yaxis_opts=opts.AxisOpts(name="数量"), # 设置Y轴名称、定制化刻度单位xaxis_opts=opts.AxisOpts(name="时间段"), # 设置X轴名称visualmap_opts=opts.VisualMapOpts(is_show=False,max_=600,pos_top='70%',pos_left='20%',range_color=['blue', 'green', 'yellow', 'red']))
)
c.render_notebook()

总结

  通过以上的步骤,我们成功地实现了对星巴克全国门店数据的可视化分析。从各个省份的门店数量、全国门店分布热点图、各省门店数量占比,到门店的营业时间段数量,都进行了详细的可视化展示。这些图表可以我们直观地理解了星巴克门店的分布情况。


如果您在人工智能领域遇到技术难题,或是需要专业支持,无论是技术咨询、项目开发还是个性化解决方案,我都可以为您提供专业服务,如有需要可站内私信或添加下方VX名片(ID:xf982831907)

期待与您一起交流,共同探索AI的更多可能!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6394.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

密码无关认证:金融机构如何解决密码问题

密码安全问题,依然是金融行业面临的重大挑战。尽管密码简单易用,但许多金融机构仍然依赖这种方式进行身份认证。幸运的是,随着技术的发展,密码无关认证已经成为一种更加安全、便捷的选择,它能够为数字银行带来更好的用…

【Redis】持久化机制

目录 前言: RDB 触发RDB持久化方法有俩种: 1.手动触发 2.自动触发 RDB文件的优缺点: AOF: AOF工作机制:​编辑 ​编辑重写机制: 前言: Redis是一个内存数据库,将数据存储在内存中&…

Vue基础(2)

19、组件之间传递数据 组件与组件之间不是完全独立的&#xff0c;而是有交集的&#xff0c;那就是组件与组 件之间是可以传递数据的 传递数据的解决方案就是 props ComponentA.vue <template><!-- 使用ComponentB组件&#xff0c;并传递title属性 --><h3>…

Java操作Excel导入导出——POI、Hutool、EasyExcel

目录 一、POI导入导出 1.数据库导出为Excel文件 2.将Excel文件导入到数据库中 二、Hutool导入导出 1.数据库导出为Excel文件——属性名是列名 2.数据库导出为Excel文件——列名起别名 3.从Excel文件导入数据到数据库——属性名是列名 4.从Excel文件导入数据到数据库…

08-ArcGIS For JavaScript-通过Mesh绘制几何体(Cylinder,Circle,Box,Pyramid)

目录 概述代码实现1、Mesh.createBox2、createPyramid3、Mesh.createSphere4、Mesh.createCylinder 完整代码 概述 对于三维场景而言&#xff0c;二位的点、线、面&#xff0c;三维的圆、立方体、圆柱等都是比较常见的三维对象&#xff0c;在ArcGIS For JavaScript中我们知道点…

DAY6,使用互斥锁 和 信号量分别实现5个线程之间的同步

题目 请使用互斥锁 和 信号量分别实现5个线程之间的同步 代码&#xff1a;信号量实现 void* task1(void* arg); void* task2(void* arg); void* task3(void* arg); void* task4(void* arg); void* task5(void* arg);sem_t sem[5]; //信号量变量int main(int argc, const …

19_PlayerPres持久化_创建角色窗口

创建脚本 编写脚本 using UnityEngine; //功能 : 角色创建界面 public class CreateWnd : WindowsRoot{protected override void InitWnd(){base.InitWnd();//TODO//显示一个随机名字} }创建角色窗口CreateWnd.cs应该在玩家点击 进入游戏 按钮后显示 所以在 登录窗口LoginWnd…

热更新杂乱记

热更新主要有一个文件的MD5值的比对过程&#xff0c;期间遇到2个问题&#xff0c;解决起来花费了一点时间 1. png 和 plist 生成zip的时候再生成MD5值会发生变动。 这个问题解决起来有2种方案&#xff1a; &#xff08;1&#xff09;.第一个方案是将 png和plist的文件时间改…

【2024年华为OD机试】 (C卷,100分)- 用户调度问题(JavaScriptJava PythonC/C++)

一、问题描述 问题描述 在通信系统中&#xff0c;有 n 个待串行调度的用户&#xff0c;每个用户可以选择 A、B、C 三种调度策略。不同的策略会消耗不同的系统资源。调度规则如下&#xff1a; 相邻用户不能使用相同的调度策略&#xff1a;例如&#xff0c;如果第 1 个用户选择…

FPGA中场战事

2023年10月3日,英特尔宣布由桑德拉里维拉(Sandra Rivera)担任“分拆”后独立运营的可编程事业部首席执行官。 从数据中心和人工智能(DCAI)部门总经理,转身为执掌该业务的CEO,对她取得像AMD掌门人苏姿丰博士类似的成功,无疑抱以厚望。 十年前,英特尔花费167亿美元真金白银…

从手动到智能:自动化三维激光扫描

三维扫描&#xff0c;是通过先进三维扫描技术获取产品和物体的形面三维数据&#xff0c;建立实物的三维图档&#xff0c;满足各种实物3D模型数据获取、三维数字化展示、3D多媒体开发、三维数字化存档、逆向设计、产品开发、直接3D打印制造或辅助加工制造等一系列的应用。 传统的…

电容的一些常用数值

如果是滤高频信号的小电容一般采用100nF 如果是滤低频信号的大电容一般采用10uF(10000nF) 比如这个LDO降压 两个一起用滤波效果会更好 如果想要供电引脚悬空&#xff0c;按理不能悬空&#xff0c;所以应该接大电阻接地&#xff0c;一般采用5.1KΩ 比如这个6Pin USB-TypeC的…

编写子程序

实验内容、程序清单及运行结果 编写子程序&#xff08;课本实验10&#xff09; 1.显示字符串 问题显示字符串是现象工作中经常用到的功能&#xff0c;应该编写一个通用的子程序来实现这个功能。我们应该提供灵活的调用接口&#xff0c;使调用者可以决定显示的位置&#xff0…

亚马逊新店铺流量怎么提升?自养号测评新趋势

在竞争激烈的电商市场中&#xff0c;亚马逊新店铺如何在众多竞争者中脱颖而出&#xff0c;提升流量成为一大难题。对于新手卖家来说&#xff0c;掌握正确的流量提升策略至关重要。本文将为您揭秘亚马逊新店铺流量提升的方法&#xff0c;助您快速打开市场&#xff0c;实现业绩增…

FPGA自分频产生的时钟如何使用?

对于频率比较小的时钟&#xff0c;使用clocking wizard IP往往不能产生&#xff0c;此时就需要我们使用代码进行自分频&#xff0c;自分频产生的时钟首先应该经过BUFG处理&#xff0c;然后还需要进行时钟约束&#xff0c;处理之后才能使用。

JQuery基本介绍和使用方法

JQuery基本介绍和使用方法 W3C 标准给我们提供了⼀系列的函数, 让我们可以操作: ⽹⻚内容⽹⻚结构⽹⻚样式 但是原⽣的JavaScript提供的API操作DOM元素时, 代码⽐较繁琐, 冗⻓. 我们可以使⽤JQuery来操作⻚⾯对象. jQuery是⼀个快速、简洁且功能丰富的JavaScript框架, 于20…

Go语言中的值类型和引用类型特点

一、值类型 值类型的数据直接包含值&#xff0c;当它们被赋值给一个新的变量或者作为参数传递给函数时&#xff0c;实际上是创建了原值的一个副本。这意味着对新变量的修改不会影响原始变量的值。 Go中的值类型包括&#xff1a; 基础类型&#xff1a;int&#xff0c;float64…

15-spring整合mybatis方式一

spring整合mybatis 方式一【重要】 步骤: 1.导入相关jar包 junit mybatis mysql数据库 spring相关的 aop织入 mybatis-spring 【new】 junit junit 4.12 mysql mysql-connector-java 8.0.23 org.mybatis mybatis 3.5.2 org.springframework spring-webmvc 5…

豆包MarsCode:小C的类二进制拼图

问题描述 思路分析 1. 类二进制数字定义 从题目中我们可以知道&#xff0c;类二进制数字是仅由 0 和 1 组成的数字。比如&#xff1a;1, 10, 100, 101, 110 等等&#xff0c;这些数字都是合法的类二进制数字。换句话说&#xff0c;类二进制数字可以看作是 “二进制表示法” 对…

中国综合算力指数(2024年)报告汇总PDF洞察(附原数据表)

原文链接&#xff1a; https://tecdat.cn/?p39061 在全球算力因数字化技术发展而竞争加剧&#xff0c;我国积极推进算力发展并将综合算力作为数字经济核心驱动力的背景下&#xff0c;该报告对我国综合算力进行研究。 中国算力大会发布的《中国综合算力指数&#xff08;2024年…