2024年是充满变化与挑战的一年,我的开发方向经历了从智能驾驶到工业智能检测,再到机器人感知交互与决策的不断演进。
这一年,我不断拓宽技术视野,深入探索不同领域的技术挑战和应用场景。
最初,我希望专注于单一领域深耕,但随着行业趋势的快速变化,我逐渐意识到跨领域知识融合和持续学习的重要性。
面对这些转变,我学会了保持开放的心态,主动拥抱新技术,也在挑战中不断成长。
一、工业检测:从探索到落地
在工业智能检测领域,我深刻体会到工业场景对算法的高精度、高可靠性和高适应性的严格要求。
工业环境的复杂性远超预期,算法需要具备强的泛化能力,以适应不同的生产环境和产品型号的变化,这对算法的稳定性和鲁棒性提出了更高的挑战。
通过不断的优化和迭代,我在工程落地过程中积累了丰富的实践经验,逐步掌握了如何在工业应用场景中平衡算法性能与业务需求。
学习了最新的YOLO11,从常规目标检测到旋转目标检测和实例分割等多个任务。
此外,我还学习研究了多种工业异常检测方法,例如:
- RealNet(CVPR 2024):基于合成异常数据的工业异常检测方法,进一步拓展了检测的泛化能力。
- DiAD(AAAI 2024):基于扩散模型,针对多类别工业异常检测的最新研究成果。
- 3D工业视觉技术:学习了激光线扫、结构光等技术,探索其在工业检测中的应用潜力。
二、机器人技术探索:从6D位姿估计到具身智能
机器人技术的发展让我深感兴趣,从最初接触6D位姿估计,到深入研究抓取点估计,再到尝试物体重建,一步步加深了对机器人技术的理解。
随着对领域的深入了解,我发现,当前技术已逐渐实现端到端的6D位姿估计、抓取预测及物体重建,这些技术的发展让我对未来充满期待。
在研究过程中,我接触到了多个前沿技术和研究成果,例如:
- SceneGrasp:支持多目标3D物体重建、6DoF位姿估计和抓取预测的综合框架。
- Graspness:端到端的抓取点估计算法,提供更精准的抓取策略。
- SAM-6D(CVPR 2024):结合实例分割,提升6D位姿估计的准确性。
- FoundationPose(CVPR 2024):统一支持6D位姿估计与跟踪,增强系统的稳定性和泛化能力。
- ZebraPose:采用层次化分组策略,实现从粗到细的表面编码,提升位姿估计的精度。
- GDR-Net:基于单目输入的几何引导直接回归模型,简化了6D位姿估计的流程。
在机器人具身智能方面,我正在学习如何通过多模态融合技术,使机器人具备更强的动态交互和环境感知能力。
通过强化学习、模仿学习以及ISAAC Lab的仿真平台,我逐步探索机器人在复杂环境下的智能决策和自主操作能力。
三、智能驾驶:从感知到决策
在智能驾驶方向,我重点学习了多模态融合与视图变换技术,以提升感知精度和系统鲁棒性。其中,以下技术让我印象深刻:
-
BEV视图变换:
- Fast-Ray:基于查找表(LUT)的多视角到单个三维体素转换,极大提升了计算效率。
-
多模态融合:
- MetaBEV:解决传感器故障问题,实现高精度3D检测与BEV分割。
- SuperFusion(ICRA 2024):多层次融合激光雷达与相机数据,提供远距离高清地图预测。
- CRN(ICCV 2023):结合多视角相机与雷达,实现3D目标检测、跟踪及BEV分割。
-
4D毫米波雷达:
- CRN(ICCV2023):使用雷达与多视角相机融合,实现3D目标检测、3D目标跟踪、道路环境BEV分割。
- ADCNet(2023):利用原始雷达数据,实现高效的目标检测和环境感知。
- FFT-RadNet(CVPR 2022):用于目标检测与可行驶区域分割。
-
占用网络:
- VoxFormer(CVPR 2023):基于视觉的3D语义场景理解方案。
- SurroundOcc(ICCV 2023):环视相机实现3D语义占用预测,提供更全面的环境建模能力。
四、学习方式的进化:AI辅助让一切更高效
面对快速变化的行业环境,我意识到持续学习的重要性。
以往,阅读论文是获取新知识的主要途径,而现在,借助AI工具,学习效率得到了极大的提升。(GPT4o、Kimi、通义千问、元宝等)
AI不仅帮助我快速提取论文的核心要点,还能辅助进行技术归纳与方案对比,让我更高效地吸收新技术,并将其应用到实际项目中。
五、持续学习
在专注技术学习的同时,我也希望提升自己的管理能力,于是报名了清华大学经管学院的创新能力提升。
这些课程涵盖了清华MBA数字化战略、公司治理20讲、商学导论、财务分析等,让我对管理有了更系统的认识。
通过学习,我逐渐意识到,技术与管理相辅相成,掌握管理思维有助于更好地推动项目落地,也能在未来的职业发展中走得更稳、更远。
六、2024年度文章推荐
1)YOLO11目标检测主题,下面是编写的博客,欢迎大家查看和学习:
一篇文章快速认识YOLO11 | 关键改进点 | 安装使用 | 模型训练和推理_yolov11改进-CSDN博客
YOLO11模型推理 | 目标检测与跟踪 | 实例分割 | 关键点估计 | OBB旋转目标检测_yolov11推理-CSDN博客
YOLO11模型训练 | 目标检测与跟踪 | 实例分割 | 关键点姿态估计_yolo11训练-CSDN博客
YOLO11 目标检测 | 导出ONNX模型 | ONNX模型推理_yolo11 onnx-CSDN博客
一篇文章快速认识 YOLO11 | 目标检测 | 模型训练 | 自定义数据集_yolo11n.yaml-CSDN博客
YOLO11 目标检测 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_目标检测自动标注-CSDN博客
2)YOLO11-旋转目标检测主题,下面是编写的博客,欢迎大家查看和学习:
YOLO11 旋转目标检测 | OBB定向检测 | ONNX模型推理 | 旋转NMS_yolov11 obb-CSDN博客
YOLO11 旋转目标检测 | 数据标注 | 自定义数据集 | 模型训练 | 模型推理-CSDN博客
一篇文章快速认识YOLO11 | 旋转目标检测 | 原理分析 | 模型训练 | 模型推理_旋转框目标检测-CSDN博客
3)YOLO11-实例分割主题,下面是编写的博客,欢迎大家查看和学习:
一篇文章快速认识 YOLO11 | 实例分割 | 模型训练 | 自定义数据集_yolo11分割-CSDN博客
YOLO11 实例分割 | 导出ONNX模型 | ONNX模型推理_yolov11分割-CSDN博客
YOLO11 实例分割 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_yolov11实例分割-CSDN博客
4)机器人系列主题,下面是编写的博客,欢迎大家查看和学习:
【机器人】SceneGrasp 同时支持3D物体重建、6D位姿估计、抓取点估计-CSDN博客
【机器人】复现SceneGrasp 同时支持多目标 3D物体重建、6DoF位姿估计、抓取预测-CSDN博客
【机器人】ATM 用于策略学习的任意点轨迹建模 RSS 2024 | 论文精读-CSDN博客
【机器人】Graspness 端到端抓取点估计 | 环境搭建 | 模型推理测试-CSDN博客
【机器人】01 强化学习、模仿学习和运动规划 仿真平台ISAAC Lab安装与使用_isaaclab-CSDN博客
【6D位姿估计】FoundationPose 支持6D位姿估计和跟踪 CVPR 2024-CSDN博客
【6D位姿估计】FoundationPose 跑通demo 训练记录_foundationpose demo-CSDN博客
5)智能驾驶主题,下面是编写的博客,欢迎大家查看和学习:
【多模态融合】MetaBEV 解决传感器故障 3D检测、BEV分割任务-CSDN博客
【多模态融合】SuperFusion 激光雷达与相机多层次融合 远距离高清地图预测 ICRA 2024-CSDN博客
【多模态融合】CRN 多视角相机与Radar融合 实现3D检测、目标跟踪、BEV分割 ICCV2023_多相机 雷达 拼接-CSDN博客
4D毫米波雷达——原理、对比、优势、行业现状-CSDN博客
6)高效工具主题,下面是编写的博客,欢迎大家查看和学习:
标注工具 X-AnyLabeling | AI 推理引擎 | 自动标注 | 支持多种视觉任务_x anylabeling ai-CSDN博客
Python 应用程序 | 打包为| .exe可执行文件-CSDN博客
PCL从理解到应用【02】PCL环境安装 | PCL测试| Linux系统_pcl安装-CSDN博客
回顾这一年,从最初的不适应,到逐渐找到节奏并适应不同的技术领域,我在变化中成长,在挑战中进步。
2024年让我更加明确,保持学习、勇于探索才是持续成长的关键。
分享完成~