参考【Jetson】Jetson Orin NX纯系统配置环境-CSDN博客
一 系统环境配置:
1.更换源:
sudo vi /etc/apt/sources.list.d/nvidia-l4t-apt-source.list
2.更新源:
sudo apt upgrade
sudo apt update
sudo apt dist-upgrade
sudo apt-get update --fix-missing
sudo reboot
3.安装jetpack
sudo apt install nvidia-jetpack
4.安装jtop
sudo apt install python3-pip
sudo -H pip3 install -U pip
sudo -H pip install jetson-stats
jtop查看:
sudo jtop
5.安装超级终端 terminator
sudo apt-get install terminator -y
6.配置CUDA和CUDNN
(1)配置环境变量:
gedit ~/.bashrc
添加以下内容:
export LD_LIBRARY_PATH=/usr/local/cuda/lib64
export PATH=/usr/local/cuda/bin:$PATH
export CUDA_HOME=/usr/local/cuda
(2)更新环境变量
source ~/.bashrc
(3)复制文件到cuda目录
cd /usr/include && sudo cp cudnn* /usr/local/cuda/include
cd /usr/lib/aarch64-linux-gnu && sudo cp libcudnn* /usr/local/cuda/lib64
(4)查看cuda
nvcc -V
(5)修改文件权限
sudo chmod 777 /usr/local/cuda/include/cudnn.h
sudo chmod 777 /usr/local/cuda/lib64/libcudnn*
(6)重新软链接
#这里的8.6.0和8对应安装的cudnn版本号和首数字
cd /usr/local/cuda/lib64sudo ln -sf libcudnn.so.8.6.0 libcudnn.so.8sudo ln -sf libcudnn_ops_train.so.8.6.0 libcudnn_ops_train.so.8
sudo ln -sf libcudnn_ops_infer.so.8.6.0 libcudnn_ops_infer.so.8sudo ln -sf libcudnn_adv_train.so.8.6.0 libcudnn_adv_train.so.8
sudo ln -sf libcudnn_adv_infer.so.8.6.0 libcudnn_adv_infer.so.8sudo ln -sf libcudnn_cnn_train.so.8.6.0 libcudnn_cnn_train.so.8
sudo ln -sf libcudnn_cnn_infer.so.8.6.0 libcudnn_cnn_infer.so.8sudo ldconfig
(7)查看cudnn
dpkg -l libcudnn8
二.安装pytorch、torchvision
1、安装pytorch
下载文档根据下载文档选择jetpack对应的pytorch版本,我的jetpack是5.1.3,下载pytorch2.0
下载地址 下载python3.8 对应的pytorch2.0的whl文件 到home目录下
安装依赖环境
sudo apt-get install libhdf5-serial-dev hdf5-tools libhdf5-dev zlib1g-dev zip libjpeg8-dev
sudo apt-get install liblapack-dev libblas-dev gfortransudo apt-get install libopenblas-base libopenmpi-dev
sudo pip3 install mpi4py
sudo pip3 install Cython
安装pytorch
pip install torch-2.0.0+nv23.05-cp38-cp38-linux_aarch64.whl
2、安装torchvision
torchvision 自己下对应版本 或者gitclone
torch2.0.0
对应torchvision0.15.1
git clone --branch v0.15.1 https://github.com/pytorch/vision torchvision
export BUILD_VERSION=0.15.1
进入torchvision文件夹编译
cd torchvision
python3 setup.py install --user
验证:
import torch
import torchvision
import tensorrt as trttorch.cuda.is_available() # 检查cuda是否可用
torch.version.cuda # 查看Pytorch运行时使用的cuda版本
torch.backends.cudnn.enabled # 查看cudnn是否可用
torch.backends.cudnn.version() # 查看cudnn版本
print(trt.__version__)
print(torchvision._version_)
# '/usr/local/cuda'pip3 show tensorrt # 查看tensorrt版本
import torch
torch.__version__
torch.cuda.is_available()
torch.cuda.current_device()
torch.cuda.get_device_name()
python
import torch
import torchvision
print(torch.cuda.is_available()) # 这一步如果输出True那么就成功了!
quit() # 最后退出python编译
三:安装anaconda
下载镜像Index of /
Anaconda3-2024.02-1-Linux-aarch64.sh
chmod +x Anaconda3-2024.2-1-Linux-aarch64.sh ./Anaconda3-2024.2-1-Linux-aarch64.sh
yes
四:安装vscode
下载vscode1.85.2
https://update.code.visualstudio.com/1.85.2/linux-deb-arm64/stable
安装:
sudo dpkg -i code_1.85.2-1705560689_arm64.deb
打开文件夹: code .
五.配置yolov8环境
conda create -n yolov8 python=3.8
pip install ultralytics
六.安装ros
Jetson Orin NX 开发指南(3): 安装 ROS 系统_jetson orin nano是ros吗-CSDN博客
七.安装mavros
sudo apt-get install ros-noetic-mavros ros-noetic-mavros-extras
wget https://raw.githubusercontent.com/mavlink/mavros/master/mavros/scripts/install_geographiclib_datasets.sh
chmod +x install_geographiclib_datasets.sh
sudo ./install_geographiclib_datasets.sh
八.安装功能包
启动yolov8环境编译 conda activate yolov8
删除build和devel后catkin_make 报错
1、pip install empy==3.3.4
2、pip install catkin_pkg
3.改yolomsg 地址 、 改视觉节点sys.ultralytics路径
九.测试视觉启动代码
roscore
cd yolov8_ws
conda activate yolov8
source ./devel/setup.bash
rosrun communication_yolo yolo_stablesend.py
25w 无RT加速 无int8量化大概35ms一帧
报错:
1、pip install rospkg
2、pip install lap
十.TensorRT加速 + int8 量化 量化代码见最后
预处理:
将jetpack安装的tensorrt 软连接至你的虚拟环境
1)退出虚拟环境查看tensorrt地址
python3.8 -c "import tensorrt; print(tensorrt.__file__)"
2)建立软连接
ln -s /usr/lib/python3.8/dist-packages/tensorrt /home/zzb/anaconda3/envs/yolov8_trt/lib/python3.8/site-packages/tensorrt
1、转onnx
pip install onnx==1.12.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install onnxruntime -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install polygraphy
2、量化
修改:
L289 onnx路径
L291 标定数据图片 一般用train图片
L300 模型验证图片 一般用val图片
L266数据集yaml路径 验证模型
L56 改数据集yaml路径 获取name类型
L13修改ultralytics路径
报错:
1)numpy has no attribute bool
找到报错文件
/home/zzb/anaconda3/envs/yolov8_trt/lib/python3.8/site-packages/tensorrt/__init__.py
L166修改bool为bool_
11.执行量化过的新模型
1)tips:删除ros功能包中build、devel重新编译功能包,使rosrun .py 为新建的yolov8_trt中的python。否则还会环境报错
int8 code:
#! /usr/bin/env python3import json
import os
import pathlib
from datetime import datetime
import cv2 as cv
import numpy as np
import onnxruntime
# 注意!必须先导入 YOLO,然后再导入 trt,否则在运行 validate_model 函数时,程序会被中断,并
# 报错 “Process finished with exit code 139 (interrupted by signal 11: SIGSEGV)”
import sys
sys.path.append("/home/zzb/yolov8_ws/src/communication_yolo/yolov8_main/ultralytics")
from ultralytics import YOLO
import tensorrt as trt
from tqdm import tqdmfrom polygraphy.backend.trt import NetworkFromOnnxPath, CreateConfig, EngineFromNetwork
from polygraphy.backend.trt import Calibrator
import yamldef _yolo8_2_onnx(pt_model_path):"""把 YOLOv8 模型从 .pt 格式转换为 ONNX 模型。Arguments:pt_model_path (str): 训练好的 YOLOv8 detection (.pt)模型的权重路径。"""# check up wheather this pt_path exists '''expanduser():路径中包含~,它会被替换为当前用户的主目录的绝对路径pathlib.Path(pt_model_path):这里使用了pathlib库中的Path类来创建一个Path对象.resolve():resolve()方法将路径转换为其绝对形式'''pt_model_path = pathlib.Path(pt_model_path).expanduser().resolve()if not pt_model_path.exists():raise FileNotFoundError(f'Model not found: {pt_model_path}')print(f'{pt_model_path= }')model = YOLO(pt_model_path)model.export(format='onnx',opset=12)onnx_model_name = pt_model_path.stem + '.onnx'onnx_model = pt_model_path.parent / onnx_model_nameprint(f'Done! Model is exported as {onnx_model}')def _get_metadata():"""生成 metadata,这个 metadata 将被用于 YOLOv8 的 TensorRT 模型。如果是在 Anaconda 虚拟环境中安装的 YOLOv8 ,可以参考官方源码 exporter.py:~/.conda/envs/yolo8/lib/python3.10/site-packages/ultralytics/engine/exporter.py:return:metadata (dict): 一个字典,包含了 YOLOv8 的 TensorRT 模型所需的元数据。"""description = f'Ultralytics YOLOv8n model'# names: 表示类型与名字的对应关系,记得路径参数以获得names数据,如:E:\\ultralytics\\ultralytics\\cfg\\datasets\\coco128.yaml'with open("//home/zzb/yolov8_ws/src/communication_yolo/yolov8_main/Datasets/target_train/Dataset.yaml", 'r', encoding="utf-8") as f:name = yaml.safe_load(f.read())names = name['names']metadata = {'description': description,'author': 'Ultralytics','license': 'AGPL-3.0 https://ultralytics.com/license','date': datetime.now().isoformat(),'version': '8.0.186','stride': 32,'task': 'detect','batch': 1,'imgsz': [640, 640],'names': names}return metadatadef _calib_data_yolo8(onnx_input_name, onnx_input_shape,calibration_images_quantity, calibration_images_folder):"""生成标定数据,用于对 YOLOv8 模型进行 int8 量化。为了有更好的量化效果,得到更好的比例值 scale,需要进行标定。标定时一般有 2 个要求:a. 标定数据是经过前处理之后的图片(通常是归一化之后的 [0, 1] 之间的数)。b. 标定数据应该使用实际的图片,比如训练集的图片。Arguments:onnx_input_name (str): 一个字符串,是 ONNX 模型输入的名字。onnx_input_shape (tuple(int, int, int, int)): 一个元祖,是 ONNX 模型的输入张量的形状。calibration_images_quantity (int): 一个整数,是标定时使用的图片数量。calibration_images_folder (str): 一个字符串,指向一个文件夹,该文件夹内的图片将被用于标定。:returnone_batch_data (Generator[dict[str, ndarray]]): 一个字典,包含了一个批次的标定数据。"""print(f' {onnx_input_shape= }') #if onnx_input_shape[1] != 3: # ONNX 输入的形状可以是:1, 3, 1504, 1504。第一维度是深度通道。raise ValueError(f'Error, expected input depth is 3, 'f'but {onnx_input_shape= }')calibration_images_folder = pathlib.Path(calibration_images_folder).expanduser().resolve()if not calibration_images_folder.exists():raise FileNotFoundError(f'{calibration_images_folder} does not exist.')print(f'{calibration_images_folder= }')batch_size = onnx_input_shape[0]required_height = onnx_input_shape[2]required_width = onnx_input_shape[3]# 初始化第 0 批数据。标定时必须给 engine 输入 FP32 格式的数据。output_images = np.zeros(shape=onnx_input_shape, dtype=np.float32)# 如果图片总数不够,则使用所有图片进行标定。calibration_images_quantity = min(calibration_images_quantity,len(os.listdir(calibration_images_folder)))print(f'Calibration images quantity: {calibration_images_quantity}')print(f'Calibrating ...')# 创建一个进度条。tqdm_images_folder = tqdm(calibration_images_folder.iterdir(),total=calibration_images_quantity, ncols=80)for i, one_image_path in enumerate(tqdm_images_folder):# 只有一个循环完整结束后,tqdm 进度条才会前进一格。因此要在 for 循环的开头# 使用 i == calibration_images_quantity 作为停止条件,才能看到完整的 tqdm 进度条if i == calibration_images_quantity:breakbgr_image = cv.imread(str(one_image_path)) # noqa# 改变图片尺寸,注意是宽度 width 在前。bgr_image = cv.resize(bgr_image, (required_width, required_height)) # noqaone_rgb_image = bgr_image[..., ::-1] # 从 bgr 转换到 rgbone_image = one_rgb_image / 255 # 归一化,转换到 [0, 1]one_image = one_image.transpose(2, 0, 1) # 形状变为 depth, height, widthbatch_index = i % batch_size # 该批次数据中的索引位置output_images[batch_index] = one_image # 把该图片放入到该批次数据的对应位置。if batch_index == (batch_size - 1): # 此时一个 batch 的数据已经准备完成one_batch_data = {onnx_input_name: output_images}yield one_batch_data # 以生成器 generator 的形式输出数据output_images = np.zeros_like(output_images) # 初始化下一批次数据。def onnx_2_trt_by_polygraphy(onnx_file, optimization_level=2,conversion_target='int8', engine_suffix='engine',calibration_method='min-max', calibration_images_quantity=64,calibration_images_folder=None,onnx_input_shape=None):"""把 onnx 模型转换为 TensorRT 模型。可以进行 int8 量化,也可以转换为 FP16 格式的模型。Arguments:onnx_file (str | pathlib.Path): 一个字符串或 Path 对象,指向一个 ONNX 文件。optimization_level (int): 一个整数,代表优化等级。level 越大,则会花更多时间对 engine 进行优化,得到的 engine 性能有可能会更好。conversion_target (str): 一个字符串,是 'int8', 'fp16' 或者 'fp32'。int8 表示进行 int8 量化,而 fp16、fp32 则表示转换为 FP16 或 FP32 格式的 TensorRT 模型。engine_suffix (str): 是输出的 TensorRT 模型的文件名后缀,可以是 'plan' 、'engine' 或 'trt'。calibration_method (str): 是进行 int8 量化时的标定方法。如果输入 None,则使用默认的entropy 方法,如果输入 min-max,则使用 min-max 标定方法。calibration_images_quantity (int): 一个整数,是标定时使用的图片数量,只在 int8 量化时有效。onnx_input_shape (tuple(int, int, int, int) | None): 一个元祖,是 ONNX 模型的输入张量的形状。:returnconverted_trt (str): 一个字符串,是生成的 TensorRT 模型的绝对路径。"""if conversion_target.lower() not in ['int8', 'fp16', 'fp32']:raise ValueError(f"The conversion_target must be one of ['int8', 'fp16', 'fp32'], "f"but get {conversion_target= }")if engine_suffix not in ['plan', 'engine', 'trt']:raise ValueError(f"The engine_suffix must be one of ['plan', 'engine', 'trt'], "f"but get {engine_suffix= }")onnx_file = pathlib.Path(onnx_file).expanduser().resolve()if not onnx_file.exists():raise FileNotFoundError(f'Onnx file not found: {onnx_file}')print(f"Succeeded finding ONNX file! {onnx_file= }")print(f'Polygraphy inspecting model:')os.system(f"polygraphy inspect model {onnx_file}") # 用 polygraphy 查看 ONNX 模型network = NetworkFromOnnxPath(str(onnx_file)) # 必须输入字符串给 NetworkFromOnnxPath# 1. 准备转换 engine 文件时的配置。包括 optimization_level 和 flag 等。#builder_config = CreateConfig(builder_optimization_level=optimization_level)builder_config = CreateConfig()print(f'{builder_config.builder_optimization_level= }')converted_trt_name = (f"{onnx_file.stem}_optimization_level_{optimization_level}"f"_{conversion_target}")if conversion_target.lower() == 'fp16':builder_config.fp16 = Trueprint(f'{builder_config.fp16= }')elif conversion_target.lower() == 'int8':# 2. 准备 int8 量化所需的 5 个配置。# 2.1 设置 INT8 的 flagbuilder_config.int8 = Trueprint(f'{builder_config.int8= }')# 2.2 用 onnxruntime 获取模型输入的名字和形状.session = onnxruntime.InferenceSession(onnx_file, providers=['CPUExecutionProvider'])onnx_input_name = session.get_inputs()[0].nameif onnx_input_shape is None: # 查询 ONNX 中的输入张量形状。onnx_input_shape = session.get_inputs()[0].shape# 2.3 准备标定用的 cache 文件。if conversion_target.lower() == 'fp16':calibration_cache_file = f"./{onnx_file.stem}_fp16.cache"else :calibration_cache_file = f"./{onnx_file.stem}_int8.cache"calibration_cache_file = pathlib.Path(calibration_cache_file).expanduser().resolve()if calibration_cache_file.exists(): # 始终使用一个新的 cache,才能每次都生成新的 TensorRT 模型。os.remove(calibration_cache_file)# 2.4 设置标定方法。实际验证发现,对于 YOLOv8 模型,IInt8MinMaxCalibrator 标定的效果最好。if calibration_method == 'min-max':calibrator_class = trt.IInt8MinMaxCalibratorelse:# 默认使用 entropy 方法,该方法通过减少量化时的信息损失 information loss,对模型进行标定。calibrator_class = trt.IInt8EntropyCalibrator2# 2.5 在 Calibrator 类中,传入标定方法,标定数据和 cache 等。builder_config.calibrator = Calibrator(BaseClass=calibrator_class,data_loader=_calib_data_yolo8(onnx_input_name=onnx_input_name, onnx_input_shape=onnx_input_shape,calibration_images_quantity=calibration_images_quantity,calibration_images_folder=calibration_images_folder),cache=calibration_cache_file)int8_suffix = f'_{calibration_method}_images{calibration_images_quantity}'converted_trt_name = converted_trt_name + int8_suffixconverted_trt = onnx_file.parent / (converted_trt_name + f'.{engine_suffix}')print('Building the engine ...')# 3. 按照前面的配置 config,设置 engine。注意 EngineFromNetwork 返回的是一个可调用对象 callable。build_engine = EngineFromNetwork(network, config=builder_config)# 4. 调用一次 build_engine,即可生成 engine,然后保存 TensorRT 模型即可。with build_engine() as engine, open(converted_trt, 'wb') as t:yolo8_metadata = _get_metadata() # 需要创建 YOLOv8 的原数据 metadatameta = json.dumps(yolo8_metadata) # 转换为 json 格式的字符串# 保存 TensorRT 模型时,必须先写入 metadata,然后再写入模型的数据。t.write(len(meta).to_bytes(4, byteorder='little', signed=True))t.write(meta.encode())t.write(engine.serialize())engine_saved = ''if not pathlib.Path(converted_trt).exists():engine_saved = 'not 'print(f'Done! {converted_trt} is {engine_saved.upper()}saved.')return str(converted_trt)def validate_model(model_path, conf, iou, imgsz, dataset_split, agnostic_nms,batch_size=1, **kwargs):"""验证 YOLOv8 模型的指标。可以是 TensorRT 模型或 PyTorch 的模型。Arguments:model_path (str): 一个字符串,是一个训练好的 YOLOv8 detection 模型的路径。conf (float): 一个范围在 [0, 1] 的浮点数,表示在预测时,使用的置信度阈值。iou (float): 一个范围在 [0, 1] 的浮点数,表示在预测时,使用的交并比。imgsz (int): 一个整数,是预测时,使用的图片最大高度和最大高度。dataset_split (str): 一个字符串,是 val 或 test,分别代表验证集或测试集。如果使用 val_test,必须把标签和图片都放入同一个文件夹 val_test 中。agnostic_nms (bool): 一个布尔值,如果为 True,则在进行 NMS 时,不区分类别,即把所有类别都看做同一个类别。而如果为 False,则只有相同类别的框,才会用来进行 NMS。batch_size (int): 一个整数,是预测时的 batch 大小。"""model_path = pathlib.Path(model_path).expanduser().resolve()if not model_path.exists():raise FileNotFoundError(f'Model not found: {model_path}')print(f'{model_path= }')print(f'{conf= }, {iou= }, {imgsz= }')model = YOLO(model_path, task='detect') # 须在创建模型时设置 task。detect_data = "/home/zzb/yolov8_ws/src/communication_yolo/yolov8_main/Datasets/target_train/Dataset.yaml"metrics = model.val(split=dataset_split, save=False,data=detect_data,agnostic_nms=agnostic_nms, batch=batch_size,conf=conf, iou=iou, imgsz=imgsz,**kwargs)map50 = round(metrics.box.map50, 3)print(f'{dataset_split} mAP50= {map50}')def main():"""把 YOLOv8 模型进行 int8 量化,然后用验证集、测试集的数据,验证量化后模型的指标。一共有 3 个步骤,第一个步骤是把 pt 模型转换为 ONNX 模型,第二个步骤是进行 int8 量化,第三个步骤是验证量化模型的指标。注意第一个步骤要和后面两个步骤分开执行。即先注释第二步和第三步,执行第一步转换 ONNX 模型。然后将第一步注释掉,再次运行 main 程序,执行后面的第二步和第三步。"""# 1. 先用下面 2 行,把 PyTorch 模型转换为 ONNX 模型。# pt_model_path = ('/home/zzb/yolov8_ws/src/communication_yolo/yolov8_main/Datasets/target_train/12.19_GM_best.pt')# _yolo8_2_onnx(pt_model_path=pt_model_path)# 2. 用 ONNX 模型进行 int8 量化,生成 TensorRT 的模型。onnx_file = ("/home/zzb/yolov8_ws/src/communication_yolo/yolov8_main/Datasets/target_train/12.19_GM_best.onnx")calibration_images = 64 # 也可以尝试 100, 32 等其它图片数量进行标定。calibration_images_folder = "/home/zzb/yolov8_ws/src/communication_yolo/yolov8_main/Datasets/target_train/images/train" # 使用训练集的图片进行标定。saved_engine = onnx_2_trt_by_polygraphy(onnx_file=onnx_file, optimization_level=2, conversion_target='int8',engine_suffix='engine', calibration_images_quantity=calibration_images,calibration_images_folder=calibration_images_folder)# 3. 用验证集和测试集,检查 int8 量化后的模型指标。# 也可以输入 pt_model_path 验证 PyTorch 模型的指标。validate_model(model_path=saved_engine,dataset_split="val_test", imgsz=640,conf=0.5, iou=0.7, agnostic_nms=True)if __name__ == '__main__':main()