共享单车轨迹数据分析:以厦门市共享单车数据为例(六)

副标题:.基于POI数据的站点功能混合度探究——以厦门市为例

为了保证数据时间尺度上的一致性,我们从互联网上下载了2020年的POI数据,POI数据来源于高德地图 API平台,包括名称、大小类、地理坐标等。并将高德地图 POI数据的火星坐标 系 GCJ-02统一转换为通用的 WGS-84地理坐标系,高德地图的POI类别共20个大类,分别为:汽车服务、汽车销售、汽车维修、摩托车服务、餐饮服务、购物服务、生活服务、体育休闲服务、医疗保健服务、住宿服务、风景名胜、商务住宅、政府机构及社会团体、科教文化服务、交通设施服务、金融保险服务、公司企业、道路附属设施、地名地址信息、公共设施,同时,每个大类别都还有二级以及三级的细小划分,具体的POI类别请参考:POI分类编码表

这里选了6大类POI进行分析,囊括了衣食住行,并将部分大类做了合并,把餐饮服务、购物服务、生活服务并称为生活服务,其他包括医疗保健服务、商务住宅、科教文化服务、交通设施服务、公司企业,具体细分项可以参照上面高德的编码表;

我们依然以厦门市为例,来通过POI来研究地铁站点分类,本篇文章研究的范围仅包含厦门的三条地铁线,不包含BRT线路,根据住房和城乡建设部于2015年颁布的 《城市轨道沿线地区规划设计导则》,轨道影响区:指距离站点约 500~800 m,所以这里我还是以常规800m影响范围来研究站点分类,这里采用允许缓冲区重叠的方式来形成缓冲区,重叠部分我认为他属于概率事件,他被A地铁站影响的同时也会受B地铁站影响,当然这个属于个人见解,如果需要形成不重叠的缓冲区,详见:ArcGIS应用指南:生成泰森多边形的缓冲区_交通站点以缓冲区范围结合泰森多边形形成的区域共同界定站域边界-CSDN博客;

信息熵用于度量系统的不确定性或混乱程度。本篇文章基于地铁站的功能混合度的背景下,信息熵可以用来度量一个影响区域内不同功能类型的分布情况。具体来说,如果一个区域内的功能类型分布非常均匀,信息熵会较高;如果功能类型分布非常集中,信息熵会较低。

信息熵 H(X)的数学定义如下:

H(X) = - \sum_{i=1}^{n} P(x_i) \log_2 P(x_i)

其中:

  • X是一个离散随机变量。
  • P(xi)是随机变量 X取值为xi​ 的概率。
  • \log 2表示以2为底的对数,单位是比特

举例说明:

例如,假设某个区域有100个地块,其中30个是居住区,20个是商业区,10个是工业区,40个是绿地公园,则各功能类型的比例为:

  • 居住区:p1=0.3
  • 商业区:p2=0.2
  • 工业区:p3=0.1
  • 绿地公园:p4=0.4

根据上述比例,计算该区域的功能混合度 H(A):

H(A) = - (0.3 \log_2 0.3 + 0.2 \log_2 0.2 + 0.1 \log_2 0.1 + 0.4 \log_2 0.4)

先计算各个项的对数值:

  • \log_2 0.3 \approx -1.73697
  • \log_2 0.2 \approx -2.32193
  • \log_2 0.1 \approx -3.32193
  • \log_2 0.4 \approx -1.32193

代入公式:

H(A) = - (0.3 \times -1.73697 + 0.2 \times -2.32193 + 0.1 \times -3.32193 + 0.4 \times -1.32193)

H(A) =- \left( -0.521091 - 0.464386 - 0.332193 - 0.528772 \right)

H(A) =- \left( -1.846442 \right)

H(A)= 1.846442

信息熵约为1.846442比特,表示该区域的功能类型分布较为均匀,功能混合度较高。

接下来,就是数据处理的步骤了,先把POI导进arcgis/arcgispro里面,显示x,y数据,必要的情况下可以把高德坐标系(GCJ-02)坐标转成WGS84,然后把点通过【空间连接】,连接关系选择【一对多连接】,匹配关系选择【包含】,即面包含点;

接下来,如法炮制,我们把每一类POI都进行上述步骤,然后做成一张表格,结果如下,这里我们只对岛内的站点功能混合度进行分析,因为部分站点统计出来的POI总量设置甚至是个位数的,有些失真,可能是本身该区域POI数量较少,或者数据有所缺失;

岛内(湖里区、思明区)信息熵值最高的前20座地铁站结果如下;

分析

  1. 高信息熵站点(信息熵 H(A)H(A) 接近或大于2.0):

    • 体育中心:信息熵 H(A)=2.019H(A)=2.019
    • 人才中心:信息熵 H(A)=2.004H(A)=2.004
    • 湖滨中路:信息熵 H(A)=2.000H(A)=2.000
    • 结论:这些站点的各类型POI分布非常均匀,功能混合度高。这表明这些站点的交通需求多样化,乘客选择不同出行目的的可能性较高。建议继续保持现有多样性,同时关注是否有进一步优化的可能。
  2. 中等信息熵站点(信息熵 H(A)H(A) 在1.8到2.0之间):

    • 两岸金融中心:信息熵 H(A)=1.965H(A)=1.965
    • 邮轮中心:信息熵 H(A)=1.960H(A)=1.960
    • 建业路:信息熵 H(A)=1.911H(A)=1.911
    • 湖里公园:信息熵 H(A)=1.884H(A)=1.884
    • 小东山:信息熵 H(A)=1.858H(A)=1.858
    • 育秀东路:信息熵 H(A)=1.858H(A)=1.858
    • 东宅:信息熵 H(A)=1.838H(A)=1.838
    • 结论:这些站点的功能混合度较高,各类型POI分布相对均匀。可以考虑优化周边POI布局,进一步增加乘客出行目的选择,提高整体运营效率。
  3. 较低信息熵站点(信息熵 H(A)H(A) 在1.7到1.8之间):

    • 观音山:信息熵 H(A)=1.791H(A)=1.791
    • 五缘湾:信息熵 H(A)=1.781H(A)=1.781
    • 华荣路:信息熵 H(A)=1.777H(A)=1.777
    • 将军祠:信息熵 H(A)=1.771H(A)=1.771
    • 软件园二期:信息熵 H(A)=1.758H(A)=1.758
    • 火炬园:信息熵 H(A)=1.750H(A)=1.750
    • 何厝:信息熵 H(A)=1.743H(A)=1.743
    • 岭兜:信息熵 H(A)=1.726H(A)=1.726
    • 五通:信息熵 H(A)=1.715H(A)=1.715
    • 结论:这些站点的各类型POI分布相对不均匀,功能混合度中等。这表明这些站点的功能性比较单一,可能倾向于居住为导向的站点类型或者以上班通勤为导向的站点类型。可以考虑增加这些线路的周边POI类型,提高服务多样性。

结论

  • 高信息熵站点(如体育中心、人才中心、湖滨中路):这些站点周边的各类型POI分布非常均匀,功能混合度高,交通需求多样化,乘客选择不同出行目的的可能性较高。建议继续保持现有多样性,同时关注是否有进一步优化的可能
  • 中等信息熵站点(如两岸金融中心、邮轮中心、建业路、湖里公园、小东山、育秀东路、东宅):这些站点的功能混合度较高,各类型POI分布相对均匀。可以考虑优化周边POI布局,进一步增加乘客出行目的选择,提高整体运营效率。
  • 较低信息熵站点(如观音山、五缘湾、华荣路、将军祠、软件园二期、火炬园、何厝、岭兜、五通):这些站点的各类型POI分布相对不均匀,功能混合度中等。这表明这些站点的功能性比较单一,可能倾向于居住为导向的站点类型或者以上班通勤为导向的站点类型。可以考虑增加这些线路的周边POI类型,提高服务多样性。

参考文献:

1、[1]王焕栋,马红伟.基于站点兴趣点的城市轨道交通站点分类方法[J].交通与运输,2020,36(04):33-37.

2、[2]徐灏铠,黄斌.基于POI数据的厦门市轨道站点影响区功能特征分析研究[C]//中国城市规划学会城市规划新技术应用学术委员会.夯实数据底座·做强创新引擎·赋能多维场景——2022年中国城市规划信息化年会论文集.华侨大学建筑学院;华南理工大学建筑学院;,2022:7.DOI:10.26914/c.cnkihy.2022.031413.

3、[3]郑权一,赵晓龙,金梦潇,等.基于POI混合度的城市公园体力活动类型多样性研究——以深圳市福田区为例[J].规划师,2020,36(13):78-86.
4、[4]张寅桐,郭力娜,郭柳娜,等.基于POI的石家庄主城区城市功能空间特征及混合度评估[J].华北理工大学学报(自然科学版),2024,46(02):84-94.

文章仅用于分享个人学习成果与个人存档之用,分享知识,如有侵权,请联系作者进行删除。所有信息均基于作者的个人理解和经验,不代表任何官方立场或权威解读。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/431482.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idea 创建多模块项目

一、新建项目,创建父工程 新建项目,选择 spring initializr 填写相关信息后提交 删除不相关的目录,如下 修改打包方式为 pom,在 pom.xml 文件中新增一行,如下 二、创建子模块 新增子模块 填写子模块信息&#x…

《机器学习》周志华-CH8(集成学习)

8.1个体与集成 集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统,基于委员会的学习。 同质”集成“:只包含同种类型的个体学习器,同质集成中的个体学习器亦称“基学习器”&#xff0…

C# winforms 使用菜单和右键菜单

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github:codetoys,所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的,可以在任何平台上使用。 源码指引:github源…

累加求和-C语言

1.问题: 计算123……100的和,要求分别用while、do while、for循环实现。 2.解答: 累加问题,先后将100个数相加。要重复进行100次加法运算,可以用循环结构来实现。重复执行循环体100次,每次加一个数。 3.代…

【C++掌中宝】C++ 中的空指针救世主——nullptr

文章目录 1. 什么是 NULL?2. NULL 在 C 和 C 中的区别3. C11 引入 nullptr 的原因4. nullptr 与 NULL 的区别5. nullptr 的应用场景6. 模拟 nullptr 的实现7. 总结结语 1. 什么是 NULL? 在 C 和 C 编程中,NULL 常用于表示空指针,…

如何修改音频的音量增益

一、前言 在开发音频相关的功能(比如说语音通话、播放音乐)时,经常会遇到音量太小的问题,这时候就需要我们对原始数据进行处理。本文将介绍如何通过修改原始音频数据来增加增益,本文包含如下内容: 1.音频数…

【Java】虚拟机(JVM)内存模型全解析

目录 一、运行时数据区域划分 版本的差异: 二、程序计数器 程序计数器主要作用 三、Java虚拟机 1. 虚拟机运行原理 2. 活动栈被弹出的方式 3. 虚拟机栈可能产生的错误 4. 虚拟机栈的大小 四、本地方法栈 五、堆 1. 堆区的组成:新生代老生代 …

速通LLaMA3:《The Llama 3 Herd of Models》全文解读

文章目录 概览论文开篇IntroductionGeneral OverviewPre-TrainingPre-Training DataModel ArchitectureInfrastructure, Scaling, and EfficiencyTraining Recipe Post-TrainingResultsVision ExperimentsSpeech Experiments⭐Related WorkConclusionLlama 3 模型中的数学原理1…

目标检测系列(一)什么是目标检测

目录 一、相关名词解释 二、目标检测算法 三、目标检测模型 四、目标检测应用 五、目标检测数据集 六、目标检测常用标注工具 一、相关名词解释 关于图像识别的计算机视觉四大类任务: 分类(Classification):解决“是什么&…

【LLM开源项目】LLMs-微调框架-LLaMA-Factory入门指南v3.0

【#】SFT 训练 项目地址:https://llamafactory.readthedocs.io/zh-cn/latest/getting_started/sft.html 可以使用以下命令进行微调: llamafactory-cli train examples/train_lora/llama3_lora_sft.yamlexamples/train_lora/llama3_lora_sft.yaml 提供…

车辆识别数据集,图片数量20500,模型已训练200轮

车辆识别数据集(Vehicle Recognition Dataset, VDRD) 摘要 VDRD 是一个专为车辆识别设计的大规模数据集,它包含了20500张不同类型的汽车、货车、公交车以及其他类型车辆的图像。数据集提供了四种车辆类别:汽车、货车、其他车辆和…

单片机原理及应用

单片机原理 一、单片机概述1.1 各种单片机系列1.2嵌入式处理器1.2.1 嵌入式DSP1.2.2 嵌入式微处理器 二、AT89S522.1 硬件组成2.2 引脚功能2.2.1 电源、时钟引脚2.2.2 控制引脚2.2.3 并行I/O口引脚 2.3 AT89S52单片机的CPU2.3.1 运算器2.3.2 控制器 2.4 AT89S52单片机的存储器结…

【代码随想录训练营第42期 Day60打卡 - 图论Part10 - Bellman_ford算法系列运用

目录 一、Bellman_ford算法的应用 二、题目与题解 题目一:卡码网 94. 城市间货物运输 I 题目链接 题解:队列优化Bellman-Ford算法(SPFA) 题目二:卡码网 95. 城市间货物运输 II 题目链接 题解: 队列优…

MySQL_表_进阶(1/2)

我们的进阶篇中,还是借四张表,来学习接下来最后关于表的需求,以此完成对表的基本学习。 照例给出四张表: 学院表:(testdb.dept) 课程表:(testdb.course) 选课表:(testdb.sc) 学生表…

python调用c++动态链接库,环境是VS2022和vscode2023

目录 前言:配置环境:基础夯实(对于ctypes的介绍):1. 加载共享库2. 定义函数原型3. 调用函数4. 处理数据结构5. 处理指针6. 错误处理7. 使用 ctypes.util总结 效果展示:操作步骤(保姆级教学)一在VS中创建dll…

YOLOv8——测量高速公路上汽车的速度

引言 在人工神经网络和计算机视觉领域,目标识别和跟踪是非常重要的技术,它们可以应用于无数的项目中,其中许多可能不是很明显,比如使用这些算法来测量距离或对象的速度。 测量汽车速度基本步骤如下: 视频采集&#x…

(done) 声音信号处理基础知识(4) (Understanding Audio Signals for ML)

来源:https://www.youtube.com/watch?vdaB9naGBVv4 模拟信号特点如下 时域连续(x轴) 振幅连续(y轴) 如下是模拟信号的一个例子: 数字信号特点如下: 一个离散值序列 数据点的值域是一系列有限的值 ADC:模拟信号到数字信号的…

python全栈学习记录(十八)re、os和sys、subprocess

re、os和sys、subprocess 文章目录 re、os和sys、subprocess一、re1.正则字符2.正则表达式的使用3.group的使用4.贪婪匹配与惰性匹配5.其他注意事项 二、os和sys1.os2.sys 三、subprocess四、打印进度条 一、re python中的re模块用来使用正则表达式,正则就是用一系…

【Python机器学习】NLP信息提取——提取人物/事物关系

目录 词性标注 实体名称标准化 实体关系标准化和提取 单词模式 文本分割 断句 断句的方式 使用正则表达式进行断句 词性标注 词性(POS)标注可以使用语言模型来完成,这个语言模型包含词及其所有可能词性组成的字典。然后,该…

http增删改查四种请求方式操纵数据库

注意:在manage.py项目入口文件中的路由配置里,返回响应的 return语句后面的代码不会执行,所以路由配置中每个模块代码要想都执行,不能出现return 激活虚拟环境:venv(我的虚拟环境名称)\Scripts\activate …