为人工智能驱动的交通研究增强路面传感器数据采集

论文标题

英文标题:Enhancing Pavement Sensor Data Harvesting for AI-Driven Transportation Studies
中文标题:为人工智能驱动的交通研究增强路面传感器数据采集

作者信息

  • Manish Kumar Krishne Gowda
    Purdue University,
    465 Northwestern Avenue, West Lafayette, IN 47907
    Email: mkrishne@purdue.edu

  • Andrew Balmos
    Purdue University,
    465 Northwestern Avenue, West Lafayette, IN 47907
    Email: abalmos@purdue.edu

  • Shin Boonam
    Indiana Department of Transportation,
    1205 Montgomery Street, West Lafayette, IN 47906
    Email: BShin@indot.IN.gov

  • James V. Krogmeier
    Purdue University,
    465 Northwestern Avenue, West Lafayette, IN 47907
    Email: jvk@purdue.edu

论文出处

  • 提交日期:2024年8月1日

  • 总字数:6879字(包括摘要、正文和参考文献)


摘要

本文提出了综合的交通传感器数据管理指南,涵盖静态存档数据和实时数据流。通过部署开源的“Avena”软件平台和NATS消息系统作为安全通信代理,确保了可靠的数据交换。同时,利用TimescaleDB等强大的数据库进行有组织的存储,并通过Grafana等可视化平台提供实时监控能力。对于静态数据,提出了结合云存储和关系数据库的标准,以高效处理非结构化和海量数据集。通过FME等云数据传输工具,实现了从本地存储到云端的高效迁移。此外,将强大的可视化工具集成到框架中,有助于从复杂数据集中提取模式和趋势。这些提案通过INDOT的实际案例研究进行了验证,展示了其在研究项目中的有效性。


引言

交通研究旨在探索网络设计、评估路面材料在不同负载和天气条件下的行为、优化交通工程的关键要素等。这些研究的目标是提高交通系统的整体质量,确保公共安全。为此,研究人员在交通网络中部署了大量传感器,这些传感器持续提供交通动态和路面状况的信息,生成了大量需要有效管理的数据。然而,管理如此庞大且多样化的数据集是一个重大挑战,因为数据量大、需要密集的清理和预处理以减少错误和不一致性。因此,需要有效的工具和技术来处理和分析数据,最好是在实时和集中信息数据库中进行。这样的策略可以帮助更好地组织数据,推导出潜在的模式和关系,应用数据抽象技术,并据此做出基于证据的决策,从而促进可持续交通基础设施的长期发展。


动机与范围

全球每年进行的交通研究项目众多,许多项目涉及研究人员和工程师前往现场进行实验、长时间物理监控传感器,并手动将收集的数据传输回中央位置进行分析。这种方法存在多个缺点,包括劳动密集型的实验监控和数据后处理、数据丢失或错误、延迟处理和实验反馈延迟等。这些问题可以通过自动化的实时监控和中央数据存储位置的早期检测来避免。实时数据可视化工具可以提供即时的路面健康洞察和更深入的情境感知,减少后处理工作量。因此,需要一个全面的实时数据监控和交付系统。


方法论

本文首先提出了静态数据库管理的操作标准和实时数据管理的系统架构,并通过INDOT的两个项目展示了这些指南的实际应用。

静态数据管理指南

静态数据管理指南包括以下几个关键组成部分:

  1. 数据源:静态数据源是已知大小和固定容量的,通常保存在本地存储介质中,如硬盘和存储盘,或原始在线存储库中。本地存储不仅限制了数据的可访问性和协作能力,还增加了因硬件故障导致数据丢失的风险。将这些静态数据源纳入强大的在线框架可以受益于多种基于网络的数据分析工具,并减少与内部数据管理相关的安全风险。

  2. 云数据传输工具:高效可靠的数据传输工具对于传感器数据迁移到在线领域至关重要。这些工具必须兼容不同大小和格式的数据文件,并支持自动化调度,以减少手动干预。错误检测和日志功能可以防止数据传输过程中的网络问题导致的数据损坏或退化。虽然Python等脚本语言可以通过广泛的API兼容性实现定制化的高效数据传输,但需要掌握语言特定的语法和语义,这可能会限制研究社区对框架的适应性。

  3. 数据库:将大量传感器数据托管在云存储上可以显著增强数据处理和资源管理能力。为了协助对广泛数据集进行全面分析,研究人员需要对数据的范围和范围有一个基本的了解。这种对传感器数据集的执行摘要可以帮助研究人员更好地规划和策略化对研究数据的全面深入分析。此外,对遥测数据的简洁概述可以帮助研究人员进行数据质量评估、初步错误检测、识别差距和不规则性以及假设形成,从而促进资源优化。

  4. 可视化工具:静态传感器数据建模的可视化工具的一般特征与实时数据可视化工具相似。然而,传感器数据的性质可能决定了在静态数据库上下文中进行视觉分析的工具选择。例如,具有高粒度的数据可能需要支持平滑函数或插值方法的工具来减少噪声,而对于极大数据集,可视化工具必须使用下采样或交互式过滤等技术有效地处理规模。

静态数据案例研究

本文将静态数据管理指南应用于两个由Purdue-INDOT联合研究团队维护的数据库。第一个数据库包含I-69高速公路部分路段的路面传感器数据,第二个数据库包含INDOT研究部门的加速路面测试(APT)的历史记录。

  • I-69数据库:包含压力传感器和应变计数据,存储在MATLAB兼容文件中。研究人员开发了一个MATLAB应用程序来检查和可视化数据,但该程序在处理大数据集时响应缓慢,且难以进行跨实验比较分析。为了解决这些问题,研究人员将压力传感器和应变计的峰值和谷值坐标捕获到一个表格格式中,并将关键数据(如文件名、测试段ID、传感器ID等)以结构化表格格式存储。这种格式整合了相关信息,使研究人员能够跨不同文件进行传感器数据的交叉分析。

  • APT数据库:包含来自不同类别传感器的读数,用于研究路面性能。数据格式化包括对沥青激光轮廓数据、沥青预交通激光轮廓数据、沥青传感器数据、沥青静态载荷数据、混凝土激光轮廓数据、混凝土预交通激光轮廓数据和FWD相关传感器数据的处理。这些数据通过Python语言进行格式化,并使用Safe的FME软件作为数据传输工具上传到Oracle数据库。

实时数据管理架构

实时数据管理架构包括以下几个关键组成部分:

  1. 数据源:指生成传感器数据的系统,使分析和研究成为可能。多种传感器被部署用于交通研究,包括土压力传感器、应变计、摄像头、湿度传感器、空气质量传感器和激光轮廓传感器。数据采集系统(DAQ)主动监控这些传感器,采样并收集传感器数据。

  2. 数据接口:指在DAQ上托管的软件应用程序,促进传感器数据在DAQ和NATS消息系统之间的传输。NATS是一个安全、轻量级的消息服务,设计用于创建多节点分布式平台、云原生应用程序和物联网解决方案。NATS作为发布-订阅模型中的消息代理,避免了系统中的冗余数据交换。

  3. 数据库:在端到端系统中集成强大的数据库,提供有组织和高效的存储解决方案,并允许研究人员在安全、易于访问的存储库中方便地访问数据。理想的数据库候选者应能够管理高速时间关键型传感器数据,适应更多传感器、更大数据集、处理大规模查询,并支持通知和警报功能。

  4. 可视化平台:与所选数据库无缝集成的数据表示和可视化工具对于实时监控传感器测量值至关重要。这些工具使研究人员能够对传感器数据进行初步评估,并评估模式和趋势是否符合预期行为。

实时数据案例研究

实时数据管理架构在I-65高速公路的两个实验现场进行了集成,展示了概念设计的功能方面。实验中使用了土壤压缩传感器、土压力传感器和土壤湿度温度传感器,用于评估交通负载分布、监测建筑材料的结构稳定性、评估路面组件对天气变化的响应等。Campbell Scientific DAQ系统用于采样和监控嵌入式传感器,并通过MQTT协议将数据传输到中央服务器。NATS作为消息代理,将DAQ输出的传感器数据流与数据库连接起来。RedPanda Connect软件在中央位置持续运行,接收数据负载并通过TimescaleDB数据库进行存储。Grafana用于从TimescaleDB数据库中查询数据,以实现实时监控和可视化。


结果

实时系统架构无缝集成,为I-65现场试验提供了一个强大的实时数据处理系统。基于Avena框架的案例研究系统实现了低延迟的传感器数据交换,TimescaleDB支持实时数据存储,Grafana实现了有效的数据可视化和实时传感器监控。静态数据管理解决方案为项目数据管理提供了灵活性,如案例研究中包含的项目性质多样化。Oracle等关系数据库在管理大型数据库的关键摘要时保证了ACID属性,而Blob存储解决方案则以低成本或无成本的方式经济地存档了大量未处理的传感器数据。ArcGIS等专业数据可视化工具满足了研究人员的项目特定数据可视化需求。


结论

本文深入分析了从I-65和I-69 Greenfield地区仪器路段的现场测试中收集的传感器数据的最佳管理实践。研究提出了针对大规模历史数据集的管理建议,包括将摘要和指标数据存储在关系数据库中,未处理数据存储在Blob存储中。研究人员更倾向于传感器指标而非原始传感器数据本身,他们通过应用分析方法将数据存储在Oracle等关系数据库中,并在现有的INDOT数据系统中使用。最后,提出了一个完整的端到端系统架构,用于通过远程数据采集系统实时收集嵌入式传感器数据。案例研究系统使用了太阳能供电的Campbell设备,主要用于自动但本地的数据采集。数据管理解决方案利用Avena框架,现代化了实时远程数据采集的设计,并在数据流上启用了边缘计算。因此,传感器可以24/7监控,实时生成有用的指标并推送到集中存储,大大减少了测量与INDOT数据驱动决策之间的延迟。然而,Campbell DAQ硬件的限制促使进一步探索在路边DAQ中引入Avena的可能性,以实现更开放的数据流。系统提案为交通研究中的静态和实时数据管理提供了全面的端到端解决方案。案例研究验证了提案的功能性和有效性,并增强了其操作的信心。该工作将鼓励研究人员在交通研究领域内和跨领域的各种实际项目中采用和整合提案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23889.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

简讯:Rust 2024 edition and v1.85.0 已发布

详见 https://blog.rust-lang.org/2025/02/20/Rust-1.85.0.html 升级方法:rustup update stable

clickhouse-介绍、安装、数据类型、sql

1、介绍 ClickHouse是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),使用C语言编写,主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。 OLAP(On-Line A…

pycharm技巧--鼠标滚轮放大或缩小 Pycharm 字体大小

1、鼠标滚轮调整字体 设置 Ctrl 鼠标滚轮调整字体大小 备注: 第一个是活动窗口,即缩放当前窗口 第二个是所有编辑器窗口,即缩放所有窗口的字体 2、插件 汉化包: Chinese Simplified 包

R语言安装教程(附安装包)R语言4.3.2版本安装教程

文章目录 前言一、安装包下载二、R-4.3.2安装步骤三、rtools43安装步骤四、RStudio安装步骤 前言 本教程将详细、全面地为你介绍在 Windows 系统下安装 R 语言 4.3.2 的具体步骤。无论你是初涉数据领域的新手,还是希望更新知识体系的专业人士,只要按照本…

从零开始玩转TensorFlow:小明的机器学习故事 5

图像识别的挑战 1 故事引入:小明的“图像识别”大赛 小明从学校里听说了一个有趣的比赛:“美食图像识别”。参赛者需要训练计算机,看一张食物照片(例如披萨、苹果、汉堡等),就能猜出这是什么食物。听起来…

01 冲突域和广播域的划分

目录 1、冲突域和广播域的划分 1.1、冲突域 1.2、广播域 1.3、对比总结 1.4、冲突域与广播域个数计算例题 2、交换机和路由器的结构 2.1、交换机的结构 2.2、路由器的结构 1、冲突域和广播域的划分 1.1、冲突域 冲突域是指网络中可能发生数据帧冲突的物理范围。当多…

[C++]使用纯opencv部署yolov12目标检测onnx模型

yolov12官方框架:sunsmarterjie/yolov12 【算法介绍】 在C中使用纯OpenCV部署YOLOv12进行目标检测是一项具有挑战性的任务,因为YOLOv12通常是用PyTorch等深度学习框架实现的,而OpenCV本身并不直接支持加载和运行PyTorch模型。然而&#xff…

神经网络八股(3)

1.什么是梯度消失和梯度爆炸 梯度消失是指梯度在反向传播的过程中逐渐变小,最终趋近于零,这会导致靠前层的神经网络层权重参数更新缓慢,甚至不更新,学习不到有用的特征。 梯度爆炸是指梯度在方向传播过程中逐渐变大,…

zyNo.26

[GXYCTF2019]Ping Ping Ping(Web) 传/?ip1有ping回显,说明后端可能通过php参数接受了ip参数,并且拼接到了最终执行的命令里形成了ping -c 3$ip,这样可能存在一个命令注入漏洞 要判断是否符合 ping -c 3$ip …

轻量级SDK,大能量:EasyRTC重塑嵌入式设备音视频体验

在智能硬件与物联网迅猛发展的今天,嵌入式设备的音视频通讯能力正变得愈加关键。然而,受限于硬件资源,尤其是Flash存储空间的不足,传统的音视频通讯方案往往难以在嵌入式设备上实现高效集成。EasyRTC凭借其轻量级SDK和先进的技术架…

算法日常刷题笔记(2)

为保持刷题的习惯 计划一天刷3-5题 然后一周总计汇总一下 这是第二篇笔记 笔记时间为2月17日到2月23日 第一天 找到初始输入字符串 找到初始输入字符串 Ihttps://leetcode.cn/problems/find-the-original-typed-string-i/ Alice 正在她的电脑上输入一个字符串。但是她打字技…

[实现Rpc] 客户端 | Requestor | RpcCaller的设计实现

目录 Requestor类的实现 框架 完善 onResponse处理回复 完整代码 RpcCaller类的实现 1. 同步调用 call 2. 异步调用 call 3. 回调调用 call Requestor类的实现 (1)主要功能: 客户端发送请求的功能,进行请求描述对服务器…

WPS计算机二级•文档的页面设置与打印

听说这是目录哦 纸张大小页边距和装订线❤️‍🔥打印界面讲解❤️缩印💕打印作文稿纸💞将文档打印成书籍💓限制编辑设置💗给文字文档加密💖文档导出为 PDF格式💘协作编辑模式💝能量站…

hackmyvm-buster

题目地址 信息收集 主机发现 ┌──(root㉿kali)-[/home/kali] └─# arp-scan -I eth1 192.168.56.0/24 Interface: eth1, type: EN10MB, MAC: 00:0c:29:34:da:f5, IPv4: 192.168.56.103 WARNING: Cannot open MAC/Vendor file ieee-oui.txt: Permission denied WARNING: C…

【入门音视频】音视频基础知识

🌈前言🌈 这个系列在我学习过程中,对音视频知识归纳总结的笔记。因为音视频相关讲解非常稀少,所以我希望通过这个音视频系列,跟大家一起学习音视频,希望减少初学者在学习上的压力。同时希望也欢迎指出文章的…

将Ubuntu操作系统的安装源设置为阿里云

在使用Ubuntu操作系统时,默认的软件源通常是国外的仓库,这可能会导致软件安装和更新速度较慢。为了提高下载速度和稳定性,我们可以将Ubuntu的安装源设置为阿里云镜像源。以下是详细步骤: 一、准备工作 在开始之前,请确保您的Ubuntu系统可以正常上网,并且您拥有管理员权…

基于 Python 的项目管理系统开发

基于 Python 的项目管理系统开发 一、引言 在当今快节奏的工作环境中,有效的项目管理对于项目的成功至关重要。借助信息技术手段开发项目管理系统,能够显著提升项目管理的效率和质量。Python 作为一种功能强大、易于学习且具有丰富库支持的编程语言&…

LabVIEW C编译支持工具库CCompileSupp.llb

路径:C:\Program Files (x86)\National Instruments\LabVIEW 2019\vi.lib\Platform\CCompileSupp.llb ​ 1. 工具库概述 定位:LabVIEW内置的C语言编译支持工具库,用于处理LabVIEW与C/C代码的混合编程接口,涵盖编译器配置、代码生成…

JVM之JVM的组成

Java 虚拟机(JVM)是 Java 程序的运行核心,它主要由类加载系统、运行时数据区、执行引擎和本地方法接口这几个关键部分组成。 类加载系统(Class Loading System) 类加载系统负责在程序运行时动态地将 Java 类加载到 J…

pycharm 调试 debug 进入 remote_sources

解决办法1: pycharm函数跳转到remote_sources中的文件中_pycharm修改remotesource包存放地址-CSDN博客 file->settings->project structure将项目文件夹设为"Sources"(此时文件夹会变为蓝色)。 解决方法2 Debug:使用Pychar…