AI论文速读 | 【综述】城市计算中跨域数据融合的深度学习:分类、进展和展望

题目:Deep Learning for Cross-Domain Data Fusion in Urban Computing: Taxonomy, Advances, and Outlook

作者:Xingchen Zou, Yibo Yan, Xixuan Hao, Yuehong Hu, Haomin Wen(温皓珉), Erdong Liu, Junbo Zhang(张钧波), Yong Li(李勇), Tianrui Li(李天瑞), Yu Zheng(郑宇), Yuxuan Liang(梁宇轩)

机构:香港科技大学(广州),京东科技&京东智能城市,清华大学,西南交通大学

关键词:城市计算,数据融合,多模态数据,大语言模型,可持续发展

网址:https://arxiv.org/abs/2402.19348

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

Cool Paper:https://papers.cool/arxiv/2402.19348

`标题与作者
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要:

随着城市的不断发展,城市计算通过利用不同来源(例如地理、交通、社交媒体和环境数据)和模态(例如时空数据,视觉和文本模态)的跨域数据融合的力量,成为可持续发展的关键学科。 最近,看到利用各种深度学习方法促进智慧城市跨域数据融合的上升趋势。 为此,提出了第一篇综述——系统地回顾了为城市计算量身定制的基于深度学习的数据融合方法的最新进展。 具体来说,首先深入研究数据视角,以理解每种模式和数据源的作用。 其次,将该方法分为四个主要类别:基于特征、基于对齐、基于对比和基于生成的融合方法。 第三,将多模态城市应用进一步分为城市规划、交通、经济、公共安全、社会、环境和能源七类。 与之前的综述相比,本文更关注深度学习方法与城市计算应用的协同作用。 此外,还阐明了大型语言模型(LLM)和城市计算之间的相互作用,提出了可能彻底改变该领域的未来研究方向。 作者们坚信(firmly believe),综述中所描述的分类、进展和前景将极大地丰富研究界。

跨域城市计算蓝图。 左:通过数据融合过程整合来自不同模式的城市数据,包括时空、视觉、文本和其他模态。 右图:城市数据的多种来源,例如地理数据、交通、社交媒体、人口和环境。

本篇综述的动机:深度学习带来的范式转变使得之前关于城市数据融合的综述,有些过时了,因为传统的分类法可能无法恰当地捕捉这些先进方法之间的细微差别和差异。 鉴于这个问题,该综述致力于弥补这一差距,并通过提供符合深度学习时代的全面且更新的分类法来提供当代视角。

Q: 这篇论文试图解决什么问题?

A: 这篇论文旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。城市计算是一个多学科领域,它利用来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据融合来支持城市的可持续发展。随着城市化进程的加快,城市计算在解决能源消耗、环境污染、社会经济差异和交通问题等全球性挑战中发挥着越来越重要的作用。

论文的主要贡献和解决的问题包括:

  1. 数据视角:深入理解每种数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体和公民生成数据)在城市计算中的作用。
  2. 方法分类:将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  3. 应用分类:将多模态城市应用分为七类:城市规划、交通、经济、公共安全、社会、环境和能源。
  4. 深度学习与城市计算的结合:探讨深度学习方法与城市计算应用的结合,特别是大型语言模型(LLMs)在城市计算中的应用前景。
  5. 未来研究方向:提出未来研究的方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。
  6. 资源和实践应用:提供资源和实践应用的详细说明,帮助研究人员和利益相关者更好地理解城市数据模态的复杂性,并通过深度学习方法进行有效的数据融合。

通过这些贡献,论文旨在为城市计算领域的研究人员提供一个全面的资源,促进该领域的发展,并为解决城市化带来的挑战提供新的视角和工具。

Q: 有哪些相关研究?

相关综述与本文的比较(3方面:重点关注范围,相关模态和主要关注的主题)

A: 论文中提到了多个与城市计算和跨域数据融合相关的研究工作。以下是一些关键的相关研究:

  1. Zheng et al. (2015): 提供了跨域大数据融合方法的全面综述,特别是在城市计算领域。这项工作强调了跨域数据融合在整合多个信息源方面的关键作用。
  2. Wang et al. (2020): 对深度学习在时空数据挖掘中的应用进行了详尽的回顾,特别关注了多源时空数据的融合。
  3. Liu et al. (2020): 提供了城市大数据融合方法的总结,这些方法在2020年之前被广泛研究。
  4. Xie et al. (2020): 研究了基于生成对抗网络(GAN)的时空数据融合模型,特别是在人群流动预测方面。
  5. Yuan and Li (2021): 在智能交通领域,探讨了深度学习在城市计算中的应用。
  6. Afyouni et al. (2022): 研究了在社会事件检测中的应用,这是城市计算的一个子领域。
  7. Gao et al. (2022): 总结了基于生成对抗网络的融合模型,特别是在时空数据方面。
  8. Deldari et al. (2022): 集中在多模态数据融合的自监督表示学习上,这是一般领域的研究。
  9. Gao et al. (2023): 提出了一种基于Transformer的模型,用于交通需求预测,结合了多视图信息。
  10. Wang et al. (2023): 提出了一种基于扩散模型的街道视图图像生成方法,用于城市计算。
  11. Zhang et al. (2023): 提出了一种基于LLM的城市区域嵌入方法,用于城市计算。

这些研究为城市计算领域的数据融合提供了不同的视角和方法,涵盖了从基础理论到实际应用的广泛范围。论文通过这些相关工作,展示了城市计算领域在深度学习和数据融合方面的最新进展,并指出了未来研究的潜在方向。

Q: 论文如何解决这个问题?

A: 论文通过以下几个关键步骤来解决城市计算中跨域数据融合的问题:

  1. 系统分类:首先,论文提出了一个新颖的分类法,将现有的城市数据源分为五种类型(地理数据、交通数据、社交媒体数据、人口统计数据和环境数据),并从模态的角度(时空数据、视觉数据、文本数据等)对数据进行分类。这种分类有助于系统地理解和分析城市计算研究中使用的不同数据类型。
  2. 融合方法综述:论文详细回顾了城市计算中使用的融合方法,并将它们分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。每一类方法都有详细的技术描述和实例分析。
  3. 应用场景分析:论文进一步将城市应用分为七个领域:城市规划、交通、经济、公共安全、社会、环境和能源。对于每个领域,论文探讨了数据融合方法如何支持特定的下游任务。
  4. 数据集编译:为了支持研究和实践,论文全面编译了城市计算中常用的数据集,考虑了它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向:论文提出了未来研究的潜在方向,包括数据隐私保护、开放基准的建立、应用多样化以及效率优化等。这些方向旨在解决当前城市计算领域面临的挑战,并推动该领域的发展。
  6. LLMs与城市计算的结合:论文探讨了大型语言模型(LLMs)在城市计算中的应用,特别是在处理多模态和多源数据方面。LLMs的引入为城市计算提供了新的视角和工具。
  7. 资源和实践应用:论文提供了一个全面的资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

通过这些步骤,论文不仅为城市计算领域的研究人员提供了一个全面的资源,而且为解决城市化带来的挑战提供了新的视角和工具。

综述中的城市计算中基于深度学习的跨域数据融合的分类框架。 该框架自下而上围绕三个维度构建:数据、融合方法和应用。 在每个视角中,将现有研究分为不同类别,以提供全面且组织良好的回顾。

Q: 论文做了哪些实验?

A: 在这篇论文中,作者并没有进行实验来验证某个特定的模型或算法,而是进行了一项全面的文献综述。这项综述旨在系统地回顾和分类针对城市计算的跨域数据融合方法,特别是在深度学习领域的最新进展。因此,论文的重点在于理论分析、方法论的分类和未来研究方向的提出,而不是实验验证。

论文的主要贡献包括:

  1. 数据视角的分析:对城市计算中使用的不同类型的数据源和模态进行了分类和讨论。
  2. 融合方法的分类:将现有的数据融合方法分为四类,并提供了每种方法的详细描述和应用实例。
  3. 应用领域的分类:将城市计算的应用分为七个主要领域,并探讨了深度学习在这些领域中的应用。
  4. 数据集的编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  5. 未来研究方向的提出:基于当前研究的局限性和挑战,提出了未来研究的潜在方向。
  6. LLMs与城市计算的结合:探讨了大型语言模型(LLMs)在城市计算中的应用前景。

由于这项工作的性质是文献综述,所以没有包含实验部分。相反,作者通过分析现有的研究工作来建立一个全面的理论框架,并为未来的实证研究提供指导。

数据视角的分析

地理数据,交通数据,社交网络数据,人口数据,环境数据及其它。

城市计算跨域数据融合范围内强相关论文中数据集类型的比例。

融合方法的分类

基于特征融合,基于对齐融合,基于对比融合和基于生成融合

城市计算基于深度学习跨域数据融合的方法分类

应用领域的分类

城市规划,经济,社交,能源,交通,公共安全以及环境

城市计算中跨域数据融合的应用(类别)和常见下游任务(子类别)的分类

数据集的编译

地理数据,交通数据,社交网络数据,人口数据和环境数据

在城市计算中用于跨域数据融合的开源数据集的分类和总结

城市计算中基于深度学习的跨域数据融合模型的总结。方法名称将基于原始引用模型名称进行分配;否则,它们将以第一作者的名字命名。

Q: 有什么可以进一步探索的点?

A: 论文提出了几个未来研究方向,这些方向为城市计算和跨域数据融合领域的研究提供了潜在的探索点:

  1. 大型语言模型(LLMs)的应用:探索LLMs在城市计算中的应用,特别是在处理多模态和多源数据方面。研究LLMs如何与城市数据融合相结合,以及它们在城市分析和预测中的潜在作用。
  2. 智能体模拟(Agent-based Simulation):开发基于LLM驱动的智能体模型,以模拟城市动态并提高城市系统的适应性和响应性。这可以帮助创建更加智能和响应性强的未来城市。
  3. 多模态因果学习:研究如何将因果推断技术应用于城市数据,以提高对城市系统复杂动态的解释能力。这包括开发新的算法和技术来理解和预测城市环境中的因果关系。
  4. 多源数据隐私保护:研究如何在保护个人隐私的同时利用多源数据进行城市计算。这涉及到开发新的隐私保护技术,如差分隐私和联邦学习。
  5. 开放基准(Open Benchmark):合作开发标准化的数据格式、统一的评估指标和共享基准,以便于跨域数据融合模型的评估和比较。
  6. 下游任务多样性:扩展城市研究的范围,涵盖更多领域的应用,如经济、社会和环境,以全面理解城市环境中的挑战。
  7. 计算效率:优化城市计算模型的计算效率,包括模型压缩、高效训练和高效架构设计,以提高模型在实际城市环境中的可行性和有效性。
  8. 跨域数据融合的挑战:解决跨域数据融合中的具体挑战,如数据异构性、数据质量、数据集成和模型泛化能力。

这些研究方向不仅有助于推动城市计算领域的科学进步,而且对于解决实际城市问题和提高城市生活质量具有重要意义。

Q: 总结一下论文的主要内容

A: 这篇论文提供了一个全面的综述,专注于城市计算领域中跨域数据融合的最新进展,特别是深度学习方法的应用。以下是论文的主要内容总结:

  1. 背景与动机:随着城市化进程的加快,城市计算成为了一个关键领域,它通过整合和分析来自不同来源(如地理、交通、社交媒体和环境数据)的跨域数据来支持城市的可持续发展。
  2. 数据视角:论文首先从数据的角度出发,探讨了城市计算中使用的不同数据模态(如时空、视觉、文本等)和数据源(如传感器、卫星、社交媒体等)的作用。
  3. 方法分类:提出了一个新颖的分类法,将城市计算中的跨域数据融合方法分为四类:基于特征的、基于对齐的、基于对比的和基于生成的融合方法。
  4. 应用领域:将城市计算的应用分为七个主要领域,包括城市规划、交通、经济、公共安全、社会、环境和能源,并探讨了深度学习在这些领域的应用。
  5. 数据集编译:提供了一个关于城市计算中常用数据集的全面列表,包括它们的来源、时间覆盖范围和空间分布特征。
  6. 未来研究方向:指出了城市计算领域中的一些潜在研究方向,如LLMs的应用、智能体模拟、多模态因果学习、数据隐私保护、开放基准、下游任务多样性和计算效率。
  7. LLMs与城市计算:探讨了大型语言模型(LLMs)与城市计算的结合,以及它们在处理多模态和多源数据方面的潜力。
  8. 资源和实践应用:提供了一个资源列表,包括最新的论文列表和相关的开源数据集,以帮助研究人员和实践者更好地理解和应用深度学习技术进行城市数据融合。

总的来说,这篇论文为城市计算领域的研究人员提供了一个全面的资源,展示了深度学习在跨域数据融合中的应用,并为未来的研究提供了新的方向和视角。

项目概览

项目地址:https://github.com/yoshall/Awesome-Multimodal-Urban-Computing

项目目录:

  • 相关综述
  • 分类框架
  • 数据融合方法
  • 开源数据集的分类总结
  • 强相关的论文列表

项目内容

相关综述

按照时间顺序的相关综述

相关综述

分类框架

分类框架

数据融合方法

数据融合方法

数据融合方法分为4类:

  1. 基于特征(Feature Based Data Fusion
  2. 基于对齐(Alignment Based Data Fusion
  3. 基于对比(Contrast Based Data Fusion
  4. 基于生成(Generation Based Data Fusion

开源数据集的分类总结

开源数据集的分类总结

开源数据集的分类总结分为(分类,内容,形式):

  1. 地理数据(Geographical Data)
    1. 卫星图像(Satellite Image):图像
    2. 街道图像(Street View Image):图像
    3. POIs:点向量(Point Vector)
  2. 交通数据(Traffic Data)
    1. 交通轨迹(Traffic Trajectory):时空轨迹
    2. 交通流(Traffic Flow):时空图
    3. 路网(Road Network):时空图
    4. 物流(Logistics):时空轨迹
  3. 社交网络数据(Social Network)
    1. 文本(Text):文本
    2. 地理标记的图像和视频(Geo-tagged Image&Video):图像和视频
    3. 用户信息(Users’ Info):时间序列
  4. 人口统计数据(Demographic Data)
    1. 犯罪(Crime):时间序列
    2. 土地利用(Land Use):时间序列
    3. 人口(Population):时序
  5. 环境数据(Environmental Data)
    1. 气象(Meteorology):时间序列
    2. 绿化(Greenery):时间序列
    3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

强相关的论文列表

国内外高校和企业里时空数据挖掘相关的团队有哪些?
环境数据(Environmental Data)

  1. 气象(Meteorology):时间序列
  2. 绿化(Greenery):时间序列
  3. 空气质量(Air Quality):时间序列

强相关论文列表

按照国内外城市计算实验室总结

[外链图片转存中…(img-CBkZy1XP-1709808431165)]

国内外高校和企业里时空数据挖掘相关的团队有哪些?
https://www.zhihu.com/question/617528629/answer/3177883285
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/273361.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GitHub Desktop的常用操作【图形化】

文章目录 【1】仓库的创建和删除【2】文件操作【3】分支原理与分支操作1.分支创建2.分支合并 【4】标签 【1】仓库的创建和删除 在本地创建一个新的仓库: 然后输入仓库的名称,描述,并选择路径: 点击完后就发现我们的仓库创建好…

线性代数(一)——向量基础

向量基础 1、向量和线性组合2、向量的模和点乘3、矩阵4、参考 线性代数的核心是向量的加和乘两种运算的组合,本篇博客为线性代数的一个引子,主要从向量、线性组合和矩阵逐步引出线性代数的相关知识。 1、向量和线性组合 首先介绍的是向量相关&#xff0…

(每日持续更新)jdk api之SequenceInputStream基础、应用、实战

博主18年的互联网软件开发经验,从一名程序员小白逐步成为了一名架构师,我想通过平台将经验分享给大家,因此博主每天会在各个大牛网站点赞量超高的博客等寻找该技术栈的资料结合自己的经验,晚上进行用心精简、整理、总结、定稿&…

活体检测(点头,摇头,张嘴等动态识别)

活体检测(点头,摇头,张嘴等动态识别) 某本书里有一句话,等我去读、去拍案。 田间的野老,等我去了解、去惊识。 山风与发,冷泉与舌, 流云与眼,松涛与耳, 他们等…

HTML 学习笔记(四)图片

<!--通过图片标签"<img src "图片路径">"来调用图片在网页中进行显示--> <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthd…

2024年目标检测研究进展

YOLOv9 图片来源网络 YOLO相关的研究&#xff1a;https://blog.csdn.net/yunxinan/article/details/103431338

C++:vector底层剖析

文章目录 前言成员变量成员函数vector ()size_t size()size_t capacity()iterator begin()和const_iterator begin()constiterator end()和const_iterator end()const~vector()void push_back(const&T val)vector<T>(const vector<T>& v)vector<T>&a…

linux:线程的控制

个人主页 &#xff1a; 个人主页 个人专栏 &#xff1a; 《数据结构》 《C语言》《C》《Linux》 文章目录 前言一、线程的总结1. 线程的优点2. 线程的缺点3. 线程异常4.线程和进程 二、线程的控制创建线程线程终止线程等待获取返回值 线程分离 总结 前言 本文作为我对于线程的…

010Editor汉化版+下载+注册码+模板bug

项目场景&#xff1a; 这天我想使用我的不知名的一个破解版本的010Edit来查看一个EXE程序&#xff0c;并想使用模板功能&#xff0c;但是发现没有该模板还无法下载最新模板 问题描述 010Edit联网后需要注册码&#xff1a; 010 Editor 激活码生成器 使用方法 参照教程使用0…

HTML5+CSS3+移动web——CSS基础

系列文章目录 HTML5CSS3移动web——HTML 基础-CSDN博客https://blog.csdn.net/ymxk2876721452/article/details/136070953?spm1001.2014.3001.5501HTML5CSS3移动web——列表、表格、表单-CSDN博客https://blog.csdn.net/ymxk2876721452/article/details/136221443?spm1001.2…

【框架学习 | 第三篇】Spring上篇(Spring入门、核心功能、Spring Bean——>定义、作用域、生命周期、依赖注入)

文章目录 1.Spring简述1.1什么是Spring框架&#xff1f;1.2Spring的核心功能1.2.1 IOC&#xff08;1&#xff09;IOC介绍&#xff08;2&#xff09;控制&#xff1f;反转&#xff1f; 1.2.2 AOP&#xff08;1&#xff09;AOP介绍&#xff08;2&#xff09;专业术语&#xff08;…

docker学习笔记——Dockerfile

Dockerfile是一个镜像描述文件&#xff0c;通过Dockerfile文件可以构建一个属于自己的镜像。 如何通过Dockerfile构建自己的镜像&#xff1a; 在指定位置创建一个Dockerfile文件&#xff0c;在文件中编写Dockerfile相关语法。 构建镜像&#xff0c;docker build -t aa:1.0 .(指…

Oracle SQL优化(读懂执行计划 一)

目录 SQL执行计划的作用示例演示执行计划概念介绍执行计划实例DISPLAY_CURSOR 类型DISPLAY_AWR 类型 指标详解 SQL执行计划的作用 示例演示 执行计划概念介绍 执行计划实例 DISPLAY_CURSOR 类型 DISPLAY_AWR 类型 指标详解

云服务器99元1年选腾讯云还是阿里云?站长测评

99元一年云服务器可以选择阿里云或腾讯云&#xff0c;选择阿里云99元服务器还是腾讯云99元服务器&#xff1f;价格相同&#xff0c;阿腾云建议选择阿里云99元服务器&#xff0c;原因有二&#xff0c;阿里云99元服务器是ECS&#xff0c;腾讯云99元服务器是轻量应用服务器&#x…

qt练习案例

记录一下qt练习案例&#xff0c;方便学习qt知识点 基本部件 案例1 需求&#xff0c;做一个标签&#xff0c;显示"你好"知识点&#xff0c;QLabel画面 4. 参考&#xff0c;Qt 之 QLabel 案例2 需求&#xff0c;做一个标签&#xff0c;显示图片 知识点&#xff0c;…

【JavaSE】抽象类与接口

Object 类 类 java.lang.Object是类层次结构的根类&#xff0c;即所有类的父类。 除Object类之外的任何一个Java类&#xff0c;全部直接或间接的继承于Object类。由此&#xff0c;Object类也被称为根父类。Object类中声明的成员具有通用性&#xff0c;并且Object类中没有声明…

Leetcode 59.螺旋矩阵Ⅱ

1.题目 2.思路 &#xff08;借用代码随想录的图&#xff09; 1.我们将转一圈看作一个循环&#xff08;1->2->3->4->5->6->7->8 这是一个循环&#xff09; 2.在这个循环里&#xff0c;我们要画四条边&#xff08;上右下左&#xff09; 填充上行从左到右 填…

Java对接腾讯云直播示例

首先是官网的文档地址 云直播 新手指南 可以发现它这个主要是按流量和功能收费的 价格总览 流量这里还只收下行的费用&#xff0c;就是只收观看消耗的流量费 其它的收费就是一些增值业务费 &#xff08;包括直播转码、直播录制、直播截图、直播审核、智能鉴黄、实时监播、移动直…

04-ESP32S3-GPIO

ESP32S3-IDF GPIO GPIO简介 ESP32S3提供了多达45个物理GPIO管脚&#xff0c;这些管脚不仅可以作为通用的输入输出接口&#xff0c;还可以连接到内部外设信号。通过GPIO交换矩阵、IO MUX和RTC IO MUX&#xff0c;可以灵活地配置外设模块的输入信号来源于任何GPIO管脚&#xff0…

空间复杂度(数据结构)

概念&#xff1a; 空间复杂度也是一个数学表达式&#xff0c;是对一个算法在运行过程中临时占用存储空间大小的量度 。 空间复杂度不是程序占用了多少bytes的空间&#xff0c;因为这个也没太大意义&#xff0c;所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复…