2024 行远自迩,笃行不怠

2024年是充满变化与挑战的一年,我的开发方向经历了从智能驾驶工业智能检测,再到机器人感知交互与决策的不断演进。

这一年,我不断拓宽技术视野,深入探索不同领域的技术挑战和应用场景。

最初,我希望专注于单一领域深耕,但随着行业趋势的快速变化,我逐渐意识到跨领域知识融合持续学习的重要性。

面对这些转变,我学会了保持开放的心态,主动拥抱新技术,也在挑战中不断成长。

一、工业检测:从探索到落地

在工业智能检测领域,我深刻体会到工业场景对算法的高精度、高可靠性和高适应性的严格要求。

工业环境的复杂性远超预期,算法需要具备强的泛化能力,以适应不同的生产环境和产品型号的变化,这对算法的稳定性和鲁棒性提出了更高的挑战。

通过不断的优化和迭代,我在工程落地过程中积累了丰富的实践经验,逐步掌握了如何在工业应用场景中平衡算法性能与业务需求

学习了最新的YOLO11,从常规目标检测旋转目标检测实例分割等多个任务。

此外,我还学习研究了多种工业异常检测方法,例如:

  • RealNet(CVPR 2024):基于合成异常数据的工业异常检测方法,进一步拓展了检测的泛化能力。
  • DiAD(AAAI 2024):基于扩散模型,针对多类别工业异常检测的最新研究成果。
  • 3D工业视觉技术:学习了激光线扫、结构光等技术,探索其在工业检测中的应用潜力。

二、机器人技术探索:从6D位姿估计到具身智能

机器人技术的发展让我深感兴趣,从最初接触6D位姿估计,到深入研究抓取点估计,再到尝试物体重建,一步步加深了对机器人技术的理解。

随着对领域的深入了解,我发现,当前技术已逐渐实现端到端的6D位姿估计、抓取预测及物体重建,这些技术的发展让我对未来充满期待。

在研究过程中,我接触到了多个前沿技术和研究成果,例如:

  • SceneGrasp:支持多目标3D物体重建、6DoF位姿估计和抓取预测的综合框架。
  • Graspness:端到端的抓取点估计算法,提供更精准的抓取策略。
  • SAM-6D(CVPR 2024):结合实例分割,提升6D位姿估计的准确性。
  • FoundationPose(CVPR 2024):统一支持6D位姿估计与跟踪,增强系统的稳定性和泛化能力。
  • ZebraPose:采用层次化分组策略,实现从粗到细的表面编码,提升位姿估计的精度。
  • GDR-Net:基于单目输入的几何引导直接回归模型,简化了6D位姿估计的流程。

在机器人具身智能方面,我正在学习如何通过多模态融合技术,使机器人具备更强的动态交互和环境感知能力。

通过强化学习、模仿学习以及ISAAC Lab的仿真平台,我逐步探索机器人在复杂环境下的智能决策和自主操作能力。

三、智能驾驶:从感知到决策

在智能驾驶方向,我重点学习了多模态融合与视图变换技术,以提升感知精度和系统鲁棒性。其中,以下技术让我印象深刻:

  • BEV视图变换

    • Fast-Ray:基于查找表(LUT)的多视角到单个三维体素转换,极大提升了计算效率。
  • 多模态融合

    • MetaBEV:解决传感器故障问题,实现高精度3D检测与BEV分割。
    • SuperFusion(ICRA 2024):多层次融合激光雷达与相机数据,提供远距离高清地图预测。
    • CRN(ICCV 2023):结合多视角相机与雷达,实现3D目标检测、跟踪及BEV分割。
  • 4D毫米波雷达

    • CRN(ICCV2023):使用雷达与多视角相机融合,实现3D目标检测、3D目标跟踪、道路环境BEV分割。
    • ADCNet(2023):利用原始雷达数据,实现高效的目标检测和环境感知。
    • FFT-RadNet(CVPR 2022):用于目标检测与可行驶区域分割。
  • 占用网络

    • VoxFormer(CVPR 2023):基于视觉的3D语义场景理解方案。
    • SurroundOcc(ICCV 2023):环视相机实现3D语义占用预测,提供更全面的环境建模能力。

四、学习方式的进化:AI辅助让一切更高效

面对快速变化的行业环境,我意识到持续学习的重要性。

以往,阅读论文是获取新知识的主要途径,而现在,借助AI工具,学习效率得到了极大的提升。(GPT4o、Kimi、通义千问、元宝等)

AI不仅帮助我快速提取论文的核心要点,还能辅助进行技术归纳与方案对比,让我更高效地吸收新技术,并将其应用到实际项目中。

五、持续学习

在专注技术学习的同时,我也希望提升自己的管理能力,于是报名了清华大学经管学院的创新能力提升

这些课程涵盖了清华MBA数字化战略、公司治理20讲、商学导论、财务分析等,让我对管理有了更系统的认识。

通过学习,我逐渐意识到,技术与管理相辅相成,掌握管理思维有助于更好地推动项目落地,也能在未来的职业发展中走得更稳、更远。

六、2024年度文章推荐

1)YOLO11目标检测主题,下面是编写的博客,欢迎大家查看和学习:

一篇文章快速认识YOLO11 | 关键改进点 | 安装使用 | 模型训练和推理_yolov11改进-CSDN博客

YOLO11模型推理 | 目标检测与跟踪 | 实例分割 | 关键点估计 | OBB旋转目标检测_yolov11推理-CSDN博客

YOLO11模型训练 | 目标检测与跟踪 | 实例分割 | 关键点姿态估计_yolo11训练-CSDN博客

YOLO11 目标检测 | 导出ONNX模型 | ONNX模型推理_yolo11 onnx-CSDN博客

一篇文章快速认识 YOLO11 | 目标检测 | 模型训练 | 自定义数据集_yolo11n.yaml-CSDN博客

YOLO11 目标检测 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_目标检测自动标注-CSDN博客 

2)YOLO11-旋转目标检测主题,下面是编写的博客,欢迎大家查看和学习:

YOLO11 旋转目标检测 | OBB定向检测 | ONNX模型推理 | 旋转NMS_yolov11 obb-CSDN博客

YOLO11 旋转目标检测 | 数据标注 | 自定义数据集 | 模型训练 | 模型推理-CSDN博客

一篇文章快速认识YOLO11 | 旋转目标检测 | 原理分析 | 模型训练 | 模型推理_旋转框目标检测-CSDN博客

3)YOLO11-实例分割主题,下面是编写的博客,欢迎大家查看和学习:

一篇文章快速认识 YOLO11 | 实例分割 | 模型训练 | 自定义数据集_yolo11分割-CSDN博客

YOLO11 实例分割 | 导出ONNX模型 | ONNX模型推理_yolov11分割-CSDN博客

YOLO11 实例分割 | 自动标注 | 预标注 | 标签格式转换 | 手动校正标签_yolov11实例分割-CSDN博客

4)机器人系列主题,下面是编写的博客,欢迎大家查看和学习:

【机器人】SceneGrasp 同时支持3D物体重建、6D位姿估计、抓取点估计-CSDN博客

【机器人】复现SceneGrasp 同时支持多目标 3D物体重建、6DoF位姿估计、抓取预测-CSDN博客

【机器人】ATM 用于策略学习的任意点轨迹建模 RSS 2024 | 论文精读-CSDN博客

【机器人】Graspness 端到端抓取点估计 | 环境搭建 | 模型推理测试-CSDN博客

【机器人】01 强化学习、模仿学习和运动规划 仿真平台ISAAC Lab安装与使用_isaaclab-CSDN博客

【6D位姿估计】FoundationPose 支持6D位姿估计和跟踪 CVPR 2024-CSDN博客

 【6D位姿估计】FoundationPose 跑通demo 训练记录_foundationpose demo-CSDN博客

5)智能驾驶主题,下面是编写的博客,欢迎大家查看和学习:

【多模态融合】MetaBEV 解决传感器故障 3D检测、BEV分割任务-CSDN博客

【多模态融合】SuperFusion 激光雷达与相机多层次融合 远距离高清地图预测 ICRA 2024-CSDN博客

【多模态融合】CRN 多视角相机与Radar融合 实现3D检测、目标跟踪、BEV分割 ICCV2023_多相机 雷达 拼接-CSDN博客

 4D毫米波雷达——原理、对比、优势、行业现状-CSDN博客

6)高效工具主题,下面是编写的博客,欢迎大家查看和学习:

标注工具 X-AnyLabeling | AI 推理引擎 | 自动标注 | 支持多种视觉任务_x anylabeling ai-CSDN博客

Python 应用程序 | 打包为| .exe可执行文件-CSDN博客

PCL从理解到应用【02】PCL环境安装 | PCL测试| Linux系统_pcl安装-CSDN博客

回顾这一年,从最初的不适应,到逐渐找到节奏并适应不同的技术领域,我在变化中成长,在挑战中进步。

2024年让我更加明确,保持学习、勇于探索才是持续成长的关键。

分享完成~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6159.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】19.基础IO(1)

文章目录 1. 基础IO1. 文件2. 回顾C文件接口2.1 hello.c写文件2.2 hello.c读文件2.3 接口介绍 3. open函数返回值3.1 文件描述符fd3.2 文件描述符的分配规则3.2.1 代码13.2.2 代码23.2.3 重定向底层原理代码示例3.2.4 使用 dup2 系统调用 3.3 缓冲区刷新问题3.4 FILE 1. 基础IO…

客户案例:向导ERP与金蝶云星空集成方案

一、客户背景 该客户公司主要致力于黄金、铂金、金镶玉首饰的研发设计、生产加工、批发及直营加盟业务。公司总部占地面积目前已达6000多平方米,拥有标准生产厂房和现代化生产设施,拥有一支完善的企业管理团队和专业技工队伍。 该企业目前同时采用向导 E…

RabbitMQ 在实际应用时要注意的问题

1. 幂等性保障 1.1 幂等性介绍 幂等性是数学和计算机科学中某些运算的性质,它们可以被多次应⽤,⽽不会改变初始应⽤的结果. 应⽤程序的幂等性介绍 在应⽤程序中,幂等性就是指对⼀个系统进⾏重复调⽤(相同参数),不论请求多少次,这些请求对系统的影响都是相同的效果. ⽐如数据库…

Cesium特效——城市白模的科技动效的各种效果

最终效果图如下: 实现方法: 步骤一:使用cesiumlib生产白模,格式为3dtiles 注意事项:采用其他方式可能导致白模贴地,从而导致不能实现该效果,例如把步骤二的服务地址改为Cesium Sandcastle 里的…

4_高并发内存池项目_高并发池内存释放设计_ThreadCache/CentralCache/PageCache回收并释放内存

高并发池内存释放设计 对各缓存层释放内存的设计,不仅仅是从上一层回收内存,还包括对回收回来的内存怎样处理更有利于下一缓存层的回收,提高效率。 高并发内存池内存释放步骤: 线程对象释放内存 ↓↓↓↓↓ ThreadCache(1.回收线…

centos9编译安装opensips 二【进阶篇-定制目录+模块】推荐

环境:centos9 last opensips -V version: opensips 3.6.0-dev (x86_64/linux) flags: STATS: On, DISABLE_NAGLE, USE_MCAST, SHM_MMAP, PKG_MALLOC, Q_MALLOC, F_MALLOC, HP_MALLOC, DBG_MALLOC, CC_O0, FAST_LOCK-ADAPTIVE_WAIT ADAPTIVE_WAIT_LOOPS1024, MAX_RE…

分子动力学模拟里的术语:leap-frog蛙跳算法和‌Velocity-Verlet算法

分子动力学模拟(Molecular Dynamics Simulation,简称MD)是一种基于经典力学原理的计算物理方法,用于模拟原子和分子在给定时间内的运动和相互作用‌。以下是关于分子动力学模拟的一些核心术语和概念: ‌定义系统‌&am…

iOS开发设计模式篇第二篇MVVM设计模式

目录 一、什么是MVVM 二、MVVM 的主要特点 三、MVVM 的架构图 四、MVVM 与其他模式的对比 五、如何在iOS中实现MVVM 1.Model 2.ViewModel 3.View (ViewController) 4.双向绑定 5.文中完整的代码地址 六、MVVM 的优缺点 1.优点 2.缺点 七、MVVM 的应用场景 八、结…

【C++图论 并集查找】2492. 两个城市间路径的最小分数|1679

本文涉及知识点 C图论 并集查找(并查集) LeetCode2492. 两个城市间路径的最小分数 给你一个正整数 n ,表示总共有 n 个城市,城市从 1 到 n 编号。给你一个二维数组 roads ,其中 roads[i] [ai, bi, distancei] 表示城市 ai 和 …

Linux应用编程(五)USB应用开发-libusb库

一、基础知识 1. USB接口是什么? USB接口(Universal Serial Bus)是一种通用串行总线,广泛使用的接口标准,主要用于连接计算机与外围设备(如键盘、鼠标、打印机、存储设备等)之间的数据传输和电…

⽤vector数组实现树的存储(孩⼦表示法)c++

在我们遇到的算法题中, ⼀般给出的树结构都是有编号的,这样会简化我们之后存储树的操作 ,⼀般提供两个信息; 结点的个数 n;n-1条x结点与y结点相连的边 题⽬描述: ⼀共9个结点셈 1号结点为根节点,接下来8⾏&#xff…

一个基于Python+Appium的手机自动化项目~~

本项目通过PythonAppium实现了抖音手机店铺的自动化询价,可以直接输出excel,并带有详细的LOG输出。 1.excel输出效果: 2. LOG效果: 具体文件内容见GitCode: 项目首页 - douyingoods:一个基于Pythonappium的手机自动化项目,实现了…

基于微信小程序的童装商城的设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

方便快捷的软件展示平台查找和下载所需的软件

## 软件展示平台项目概述 背景: 随着互联网的发展,软件的数量日益增长,用户需要一款方便快捷的软件展示平台来查找和下载所需的软件。本软件展示平台旨在为用户提供一个集中展示各类软件的平台,方便用户快速找到所需的软件并进行…

进程、线程和协程的区别

进程、线程和协程的区别 在操作系统中,进程、线程 和 协程 是并发编程中的核心概念。 1. 进程 定义 进程是程序的一次执行过程,是操作系统进行资源分配和调度的基本单位。每个进程都有自己独立的地址空间和系统资源。 特点 独立性:每个…

MinIO的安装与使用

目录 1、安装MinIO 1.1 下载 MinIO 可执行文件 1.2 检查 MinIO 是否安装成功 1.3 设置数据存储目录 1.4 配置环境变量(可选) 1.5 编写启动的脚本 1.6 开放端口 1.7 访问 2、项目实战 2.1 引入依赖 2.2 配置yml文件 2.3 编写Minio配置类 2.4…

CSDN 博客之星 2024:默语的技术进阶与社区耕耘之旅

CSDN 博客之星 2024:默语的技术进阶与社区耕耘之旅 🌟 默语,是一位在技术分享与社区建设中坚持深耕的博客作者。今年,我有幸再次入围成为 CSDN 博客之星TOP300 的一员,这既是对过往努力的肯定,也是对未来探…

土壤墒情中土壤 pH 值的监测方法与意义

土壤,作为农作物生长的根基,其质量对农业生产有着深远影响。在衡量土壤质量的众多指标中,土壤 pH 值是极为关键的一项。它不仅反映了土壤的酸碱度,还直接或间接地影响着土壤中养分的有效性、微生物的活性以及农作物的生长发育。因…

Trimble三维激光扫描-地下公共设施维护的新途径【沪敖3D】

三维激光扫描技术生成了复杂隧道网络的高度详细的三维模型 项目背景 纽约州北部的地下通道网络已有100年历史,其中包含供暖系统、电线和其他公用设施,现在已经开始显露出老化迹象。由于安全原因,第三方的进入受到限制,在没有现成纸…

开发环境搭建-1:配置 WSL (类 centos 的 oracle linux 官方镜像)

一些 Linux 基本概念 个人理解,并且为了便于理解,可能会存在一些问题,如果有根本上的错误希望大家及时指出 发行版 WSL 的系统是基于特定发行版的特定版本的 Linux 发行版 有固定组织维护的、开箱就能用的 Linux 发行版由固定的团队、社…