2024 行远自迩，笃行不怠

2024年是充满变化与挑战的一年，我的开发方向经历了从智能驾驶到工业智能检测，再到机器人感知交互与决策的不断演进。

这一年，我不断拓宽技术视野，深入探索不同领域的技术挑战和应用场景。

最初，我希望专注于单一领域深耕，但随着行业趋势的快速变化，我逐渐意识到跨领域知识融合和持续学习的重要性。

面对这些转变，我学会了保持开放的心态，主动拥抱新技术，也在挑战中不断成长。

一、工业检测：从探索到落地

在工业智能检测领域，我深刻体会到工业场景对算法的高精度、高可靠性和高适应性的严格要求。

工业环境的复杂性远超预期，算法需要具备强的泛化能力，以适应不同的生产环境和产品型号的变化，这对算法的稳定性和鲁棒性提出了更高的挑战。

通过不断的优化和迭代，我在工程落地过程中积累了丰富的实践经验，逐步掌握了如何在工业应用场景中平衡算法性能与业务需求。

学习了最新的YOLO11，从常规目标检测到旋转目标检测和实例分割等多个任务。

此外，我还学习研究了多种工业异常检测方法，例如：

RealNet（CVPR 2024）：基于合成异常数据的工业异常检测方法，进一步拓展了检测的泛化能力。
DiAD（AAAI 2024）：基于扩散模型，针对多类别工业异常检测的最新研究成果。
3D工业视觉技术：学习了激光线扫、结构光等技术，探索其在工业检测中的应用潜力。

二、机器人技术探索：从6D位姿估计到具身智能

机器人技术的发展让我深感兴趣，从最初接触6D位姿估计，到深入研究抓取点估计，再到尝试物体重建，一步步加深了对机器人技术的理解。

随着对领域的深入了解，我发现，当前技术已逐渐实现端到端的6D位姿估计、抓取预测及物体重建，这些技术的发展让我对未来充满期待。

在研究过程中，我接触到了多个前沿技术和研究成果，例如：

SceneGrasp：支持多目标3D物体重建、6DoF位姿估计和抓取预测的综合框架。
Graspness：端到端的抓取点估计算法，提供更精准的抓取策略。
SAM-6D（CVPR 2024）：结合实例分割，提升6D位姿估计的准确性。
FoundationPose（CVPR 2024）：统一支持6D位姿估计与跟踪，增强系统的稳定性和泛化能力。
ZebraPose：采用层次化分组策略，实现从粗到细的表面编码，提升位姿估计的精度。
GDR-Net：基于单目输入的几何引导直接回归模型，简化了6D位姿估计的流程。

在机器人具身智能方面，我正在学习如何通过多模态融合技术，使机器人具备更强的动态交互和环境感知能力。

通过强化学习、模仿学习以及ISAAC Lab的仿真平台，我逐步探索机器人在复杂环境下的智能决策和自主操作能力。

三、智能驾驶：从感知到决策

在智能驾驶方向，我重点学习了多模态融合与视图变换技术，以提升感知精度和系统鲁棒性。其中，以下技术让我印象深刻：

BEV视图变换：
- Fast-Ray：基于查找表（LUT）的多视角到单个三维体素转换，极大提升了计算效率。
多模态融合：
- MetaBEV：解决传感器故障问题，实现高精度3D检测与BEV分割。
- SuperFusion（ICRA 2024）：多层次融合激光雷达与相机数据，提供远距离高清地图预测。
- CRN（ICCV 2023）：结合多视角相机与雷达，实现3D目标检测、跟踪及BEV分割。
4D毫米波雷达：
- CRN（ICCV2023）：使用雷达与多视角相机融合，实现3D目标检测、3D目标跟踪、道路环境BEV分割。
- ADCNet（2023）：利用原始雷达数据，实现高效的目标检测和环境感知。
- FFT-RadNet（CVPR 2022）：用于目标检测与可行驶区域分割。
占用网络：
- VoxFormer（CVPR 2023）：基于视觉的3D语义场景理解方案。
- SurroundOcc（ICCV 2023）：环视相机实现3D语义占用预测，提供更全面的环境建模能力。

四、学习方式的进化：AI辅助让一切更高效

面对快速变化的行业环境，我意识到持续学习的重要性。

以往，阅读论文是获取新知识的主要途径，而现在，借助AI工具，学习效率得到了极大的提升。（GPT4o、Kimi、通义千问、元宝等）

AI不仅帮助我快速提取论文的核心要点，还能辅助进行技术归纳与方案对比，让我更高效地吸收新技术，并将其应用到实际项目中。

五、持续学习

在专注技术学习的同时，我也希望提升自己的管理能力，于是报名了清华大学经管学院的创新能力提升。

这些课程涵盖了清华MBA数字化战略、公司治理20讲、商学导论、财务分析等，让我对管理有了更系统的认识。

通过学习，我逐渐意识到，技术与管理相辅相成，掌握管理思维有助于更好地推动项目落地，也能在未来的职业发展中走得更稳、更远。

六、2024年度文章推荐

1）YOLO11目标检测主题，下面是编写的博客，欢迎大家查看和学习：

一篇文章快速认识YOLO11 | 关键改进点 | 安装使用 | 模型训练和推理_yolov11改进-CSDN博客

YOLO11模型推理 | 目标检测与跟踪 | 实例分割 | 关键点估计 | OBB旋转目标检测_yolov11推理-CSDN博客

YOLO11模型训练 | 目标检测与跟踪 | 实例分割 | 关键点姿态估计_yolo11训练-CSDN博客

YOLO11 目标检测 | 导出ONNX模型 | ONNX模型推理_yolo11 onnx-CSDN博客

一篇文章快速认识 YOLO11 | 目标检测 | 模型训练 | 自定义数据集_yolo11n.yaml-CSDN博客

YOLO11 目标检测 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_目标检测自动标注-CSDN博客

2）YOLO11-旋转目标检测主题，下面是编写的博客，欢迎大家查看和学习：

YOLO11 旋转目标检测 | OBB定向检测 | ONNX模型推理 | 旋转NMS_yolov11 obb-CSDN博客

YOLO11 旋转目标检测 | 数据标注 | 自定义数据集 | 模型训练 | 模型推理-CSDN博客

一篇文章快速认识YOLO11 | 旋转目标检测 | 原理分析 | 模型训练 | 模型推理_旋转框目标检测-CSDN博客

3）YOLO11-实例分割主题，下面是编写的博客，欢迎大家查看和学习：

一篇文章快速认识 YOLO11 | 实例分割 | 模型训练 | 自定义数据集_yolo11分割-CSDN博客

YOLO11 实例分割 | 导出ONNX模型 | ONNX模型推理_yolov11分割-CSDN博客

YOLO11 实例分割 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_yolov11实例分割-CSDN博客

4）机器人系列主题，下面是编写的博客，欢迎大家查看和学习：

【机器人】SceneGrasp 同时支持3D物体重建、6D位姿估计、抓取点估计-CSDN博客

【机器人】复现SceneGrasp 同时支持多目标 3D物体重建、6DoF位姿估计、抓取预测-CSDN博客

【机器人】ATM 用于策略学习的任意点轨迹建模 RSS 2024 | 论文精读-CSDN博客

【机器人】Graspness 端到端抓取点估计 | 环境搭建 | 模型推理测试-CSDN博客

【机器人】01 强化学习、模仿学习和运动规划仿真平台ISAAC Lab安装与使用_isaaclab-CSDN博客

【6D位姿估计】FoundationPose 支持6D位姿估计和跟踪 CVPR 2024-CSDN博客

【6D位姿估计】FoundationPose 跑通demo 训练记录_foundationpose demo-CSDN博客

5）智能驾驶主题，下面是编写的博客，欢迎大家查看和学习：

【多模态融合】MetaBEV 解决传感器故障 3D检测、BEV分割任务-CSDN博客

【多模态融合】SuperFusion 激光雷达与相机多层次融合远距离高清地图预测 ICRA 2024-CSDN博客

【多模态融合】CRN 多视角相机与Radar融合实现3D检测、目标跟踪、BEV分割 ICCV2023_多相机雷达拼接-CSDN博客

4D毫米波雷达——原理、对比、优势、行业现状-CSDN博客

6）高效工具主题，下面是编写的博客，欢迎大家查看和学习：

标注工具 X-AnyLabeling | AI 推理引擎 | 自动标注 | 支持多种视觉任务_x anylabeling ai-CSDN博客

Python 应用程序 | 打包为| .exe可执行文件-CSDN博客

PCL从理解到应用【02】PCL环境安装 | PCL测试| Linux系统_pcl安装-CSDN博客

回顾这一年，从最初的不适应，到逐渐找到节奏并适应不同的技术领域，我在变化中成长，在挑战中进步。

2024年让我更加明确，保持学习、勇于探索才是持续成长的关键。

分享完成~

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/6159.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！