NVIDIA JetPack 6.0(现已正式发布)

NVIDIA JetPack 6.0(现已正式发布)

NVIDIA JetPack SDK 为 NVIDIA Jetson 模块提供支持,为构建端到端加速 AI 应用程序提供全面的解决方案。JetPack 6 通过微服务和一系列新功能扩展了 Jetson 平台的灵活性和可扩展性。它是 2024 年下载次数最多的 JetPack 版本。

随着 JetPack 6.0 生产版本的普遍可用,开发人员可以放心地将这些新功能带入最先进的嵌入式 AI 和机器人应用程序。这篇文章重点介绍了主要功能和新的 AI 工作流程。

JetPack 6 功能亮点

JetPack 6 在 Jetson 上支持越来越多的基于 Linux 的发行版。其中包括 Canonical 的 Ubuntu 服务器、Redhat 的 RHEL 9.4、SUSE、Wind River Linux、Redhawk Real Time OS 和各种基于 Yocto 的发行版。这些基于 Linux 的发行版在 Jetson 上提供商业支持的企业产品,可放心部署和管理基于 Jetson 的产品。

运行任何 Linux 内核的能力使 Jetson 客户能够使用他们选择的内核版本,并避免花费资源将其驱动程序反向移植到特定的 Jetson Linux 内核。Jetson 客户可以独立于 JetPack 路线图维护他们的内核。

使用 JetPack 6,您可以自由升级计算堆栈,而无需升级 Jetson Linux BSP。此功能在社区中特别受欢迎。

此外,JetPack 6 将 Jetson 平台服务添加到 Jetson Linux BSP 和 Jetson AI Stack。Jetson 平台服务是一套预构建和可定制的服务,旨在加速 Jetson 设备上的 AI 应用程序开发。这些模块化服务集合支持真正的 API 驱动和分解的云原生应用程序。

具有 Jetson 平台服务的模块化、分解式、可互换架构

Jetson 平台服务现已作为 JetPack 6 的一部分提供,它提供了一种模块化架构,其中包含大量可定制软件和可重复使用的微服务,可用于构建视觉 AI 应用程序。它提供用于基础设施功能的基础服务、用于洞察生成的 AI 服务以及用于安全的边缘到云连接的参考云。

多样化的微服务包括视频存储工具包 (VST)、基于 NVIDIA DeepStream 的 AI 感知服务、生成 AI 推理服务、分析服务等。每个微服务都提供 API 来配置和访问微服务的功能。

这些 API 使用 IoT 网关基础服务在系统外部呈现,基于云原生架构中使用的标准模式,使用单个网关在系统内公开 API。客户端应用程序通过 API 网关服务调用相应的 API 来行使微服务功能。

Jetson 平台服务还提供了一个 IoT 云模块,使客户端在远程访问这些 API 时能够进行身份验证和授权。此 IoT 云模块与云无关,可以从任何公共云或私有云运行。

AI 服务

AI 服务集合利用 AI 模型、多对象跟踪和流式分析技术的组合提供优化的视频处理和 AI 推理功能。这些是具有标准化 API 的容器化软件,可以集成到最终应用程序中,如参考工作流程所示。

VLM 的 AI 推理服务

视觉语言模型 (VLM) 通过将视觉模态与 LLM 相结合,实现对图像和视频的语义理解。VLM 的 AI 推理服务支持通过标准化 API 访问 VLM 功能。可以使用两种受支持的模型(VILA 或 LLaVA)之一实例化该服务,并提供两种主要功能:

  • 通过自然语言提示设置从流式视频创建警报的条件
  • 查询(提示)视频并使用自然语言获得响应

VLM 通常需要相当大的 GPU 和内存需求。它们的大小根据参数数量而不同。VILA 有 13B、7B 和 2.7B 版本。随着参数数量的增加,模型在掌握图像语义方面的能力的准确性会提高,但代价是更高的 GPU 使用率和内存利用率。用户需要根据他们对 Jetson 平台的选择以及基于工作负载的可用系统资源来选择正确的模型。

此服务可以集成到生成式 AI 工作流程中,如下一节所述。

AI 分析服务

视频分析应用程序通常涉及分析人或物体在摄像机视野范围内的移动。AI 分析服务对推理服务(例如检测或跟踪)生成的元数据进行操作。此服务获取流式元数据并生成对象移动的空间和时间洞察。此服务的核心功能包括:

  • 越线(绊线):在摄像机视野范围内定义虚拟折线,并维护一段时间内越过该线的物体数量。

  • 感兴趣区域:定义封闭多边形并维护该区域内物体的时间序列计数。例如,这可用于检测结账队伍中等待的人数何时达到一定限制。

  • 行为分析:帮助检索物体在摄像头视野范围内的移动轨迹。此功能可用于通过创建热图可视化来了解物体移动的趋势(图 3)。

这里重点介绍的所有分析都可以使用 API 生成和提取。有关 AI 分析服务的更多信息,请参阅 Jetson 平台服务发布文档。

基础服务

基础服务提供与领域无关的功能,用于组装生产级 AI 系统,包括摄像头管理、存储管理、物联网、API 网关和消息总线。相关服务可以通过 SDK 管理器方便地安装(从 Jetpack 6.0 GA 版本开始),然后将其部署为 Linux 服务。基础服务包括:

视频存储工具包 (VST) 服务:支持自动发现符合 ONVIF 标准的摄像头,以及从摄像头提取、存储和流式传输视频流。下游 AI 服务或任何应用程序都可以通过标准流式传输协议(如 RTSP 或 webRTC)从 VST 使用这些流。VST 针对处理大量连接的摄像头进行了优化,并利用 Jetson 中底层硬件加速支持进行视频解码和编码、缩放和预处理以及叠加生成。

  • 存储服务:存储配置和管理支持自动配置连接到 Jetson 设备的 SATA 和 NVMe 存储,以补充板载存储和各种微服务之间的存储分配。存储服务通过 Jetson Linux 提供的标准 LUKS 功能支持跨多个驱动器的逻辑卷(包括随时间添加驱动器)和磁盘加密(用于静态数据保护)。

  • 网络服务:支持使用板载或外部 POE 交换机配置用于连接到 IP 摄像机的以太网接口,并在摄像机启动期间设置 DHCP 以分配 IP 地址。

  • Redis 服务:Jetson 上的统一系统消息总线,支持各种微服务之间的消息传递和同步,同时用作分析的时间序列数据库。

  • API 网关(Ingress):大多数微服务发布 API 供其他服务和应用程序调用。Ingress 服务提供了一种标准机制来呈现这些 API 端点。传入的请求根据配置的路由路由到适当的微服务,从而使底层微服务架构远离 API 消费者。

  • 监控:为了监控您的应用程序和设备上运行的服务,监控服务提供了使用 prometheus 收集这些数据的钩子。它还包括一个用于可视化的 grafana 仪表板,可以使用 Ingress 或 API 网关服务远程访问。它包括一个系统监控服务,用于跟踪系统利用率,包括 CPU 和 GPU、内存和磁盘(使用节点导出器收集)。

  • IoT 网关:对于使用任何云服务的应用程序,IoT 网关服务提供了一个配置代理来验证设备并安全地连接到云。它与云建立双向 TCP 连接,使设备(可能位于防火墙后面)能够与云通信。传入流量通过 Ingress 服务转发到已注册的内部端点。它还支持通过云将来自各种微服务的事件推送到外部客户端,并且可以扩展以支持从用户创建的微服务派生的自定义事件。

  • 防火墙:如果您需要防火墙来保护您的设备,特别是对于生产情况,此服务会设置 UFW(简单防火墙)和一些默认规则,您可以根据需要进行修改以控制系统的进出网络流量。

启用生成式 AI 工作流

借助 Jetson 平台服务,您可以快速构建边缘 AI 应用程序。为了进一步加速这一旅程,您可以使用多个参考工作流,包括生成式 AI 工作流。这些工作流说明了配置和实例化各种 Jetson 服务的最佳实践。它提供了使用 API 和前面概述的服务构建复杂视觉 AI 应用程序的方法。您可以使用 API 自定义或基于这些工作流进行构建。工作流打包为 Docker Compose 文件,并附带一个参考移动应用程序,以展示如何利用 API。

AI-NVR

AI-NVR(网络视频录像机)是一个端到端参考应用程序,用于构建基于 AI 的 NVR 解决方案。它配备了许多令人惊叹的功能,例如视频管理和存储、人员占用和热图指标、用户身份验证和授权、设备安全和加密存储以及参考移动应用程序。通过利用 Jetson 平台上的所有不同加速器,此工作流针对通道吞吐量和性能进行了优化。参考工作流程使用 DeepStream AI 感知服务,该服务具有高度准确的 NVIDIA PeopleNet 模型和多对象跟踪器。您可以灵活地使用自己的 AI 模型自定义感知服务,也可以使用自己的感知服务。要了解有关此工作流程的更多信息,请观看 AI-NVR 概述。

边缘生成式 AI 警报

借助生成式 AI 警报,您可以使用 VLM 从视频中提取见解并使用自然语言生成警报。这些模型结合了视觉和语言模式,在由文本、图像和视频组成的大型数据集上进行训练,可以理解自然语言提示并执行视觉问答。

VLM 超越了基本的对象检测和分类,并提供对场景的更深入的上下文理解。使用此工作流程,您可以使用自然语言在输入视频流上使用 API 设置警报。例如,“发生火灾时发出警报”。其次,您可以对视频进行问答。

使用生成式 AI 进行零样本检测

零样本检测工作流程使用 NanoOwl 模型,这是一种可以检测任意数量对象的开放词汇模型。与在固定数量的类别上训练的传统对象检测模型不同,开放词汇模型是在互联网规模数据上训练的,这使得它能够检测最常见的对象,而无需明确训练这些类别的模型。使用此工作流程,用户可以通过使用 API 提示类别的模型进行检测来动态检测任何对象。要了解有关此工作流程的更多信息,请参阅使用 NVIDIA Metropolis 微服务将生成式 AI 带到 Jetson 的边缘。

扩展的 Jetson 支持

Jetson 平台服务兼容 Orin 系列中的所有设备,从 Orin Nano 到 AGX。基础服务在所有这些设备上都受支持,并且可以使用 SDK Manager 安装。同样,AI-NVR 工作流程在所有设备上都受支持,但流的数量会因硬件配置而异。

对于 VLM 参考工作流程,需要考虑到 Jetson 平台来选择模型。有关 Jetson Orin AGX 和 Nano 上预期流计数的信息,请参阅 Jetson AI Lab 上的 VLM 参考页面。在决定模型时,还要考虑您的案例中可能需要 GPU 和内存资源的任何其他工作负载。

启用生产部署

生产系统需要强大、可靠的硬件。NVIDIA 与许多 OEM 建立了深厚的合作伙伴关系,可以提供生产质量的载板和封装。我们的一些合作伙伴还集成并验证了上述工作流程和 Jetson 平台服务。这保证了所有服务都能在他们的平台上开箱即用。集成了 JetPack 6 和 Jetson 平台服务的合作伙伴包括:

  • Yuan

  • Aetina

  • Aaeon

  • Advantech

  • AVermedia

  • Seeed Studio

  • CRG
    构建系统并创建应用程序后,产品化的最后一步是应用程序的部署和管理。应用程序可能还需要在现场频繁更新,这需要远程无线 (OTA) 更新。我们很高兴与几家领先的车队管理公司合作,这些公司已集成 Jetson 平台服务,并可提供一站式解决方案来部署和更新您的边缘应用程序。合作伙伴包括:

  • Namla

  • Allxon

  • Mender

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/341096.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CodeMirror 创建标签计算编辑器

在日常开发中对于一些数据计算场景可能会遇到标签计算的需求&#xff0c;下面关于如何使用CodeMirror实现标签计算编辑功能。 1&#xff0c;结果图 2&#xff0c;主体代码逻辑 大家只需要复制粘贴主要codeMirror使用逻辑即可 <template><el-dialogref"dialogRe…

python——网络编程

流程图 面向连接的套接字 面向连接的通信提供序列化的、可靠的和不重复的数据交付&#xff0c;而没有记录边界。主要的协议是传输控制协议&#xff08;TCP&#xff09;; TCP套接字&#xff0c;在python中&#xff0c;必须使用SOCK_STREAM作为套接字类型 tcp的特点 面向连接…

AI大模型应用开发实践:5.快速入门 Assistants API

快速入门 Assistants API Assistants API 允许您在自己的应用程序中构建人工智能助手。一个助手有其指令,并可以利用模型、工具和知识来回应用户查询。 Assistants API 目前支持三种类型的工具: 代码解释器 Code Interpreter检索 Retrieval函数调用 Function calling使用 P…

数据结构学习笔记

参考教材&#xff1a;数据结构C语言版&#xff08;严蔚敏&#xff0c;杨伟民编著&#xff09; 参考课程&#xff1a;青岛大学王卓老师&#xff1a;数据结构与算法基础 思维导图&#xff1a;XMind、幕布 正在备考&#xff0c;结合自身空闲时间&#xff0c;不定时更新&a…

Three.js的阴影技术,创建逼真效果的必备!

three.js是一个流行的用于创建和展示3D图形的JavaScript库&#xff0c;它提供了多种阴影技术来增强3D场景的真实感和视觉效果。 一、常用阴影技术 1. 基于光线的阴影&#xff08;Raytraced Shadows&#xff09;&#xff1a;通过跟踪光线的路径来计算阴影&#xff0c;产生非常…

大数据之CDH对Hdfs做Balance数据均衡/数据平衡/数据倾斜

问题的来源: 由于在hive工具运行sql,出现sql卡顿的情况,去cdh上查看yarn资源的分布情况,发现了整个cdh平台中hdfs和yarn资源分布不均匀,大量的爆红显示: 以下 DataNode 数据目录 位于小于其可用空间 10.0 吉字节 的文件系统中。 /data1/dfs/dn&#xff08;可用&#xff1a;7.2 …

Python爬虫协程批量下载图片

import aiofiles import aiohttp import asyncio import requests from lxml import etree from aiohttp import TCPConnectorclass Spider:def __init__(self, value):# 起始urlself.start_url value# 下载单个图片staticmethodasync def download_one(url):name url[0].spl…

SpringCloud 微服务中网关如何记录请求响应日志?

在基于SpringCloud开发的微服务中&#xff0c;我们一般会选择在网关层记录请求和响应日志&#xff0c;并将其收集到ELK中用作查询和分析。 今天我们就来看看如何实现此功能。 日志实体类 首先我们在网关中定义一个日志实体&#xff0c;用于组装日志对象 Data public class …

第九十七节 Java面向对象设计 - Java Object.Finalize方法

Java面向对象设计 - Java Object.Finalize方法 Java提供了一种在对象即将被销毁时执行资源释放的方法。 在Java中&#xff0c;我们创建对象&#xff0c;但是我们不能销毁对象。 JVM运行一个称为垃圾收集器的低优先级特殊任务来销毁不再引用的所有对象。 垃圾回收器给我们一个…

函数计数和跟踪 --- console的count和trace方法

新学到一个小方法&#xff0c;分享一下哦。 使用 console 对象的 trace ⽅法在控制台上输出当前的调用栈&#xff0c;可以追踪⼀个函数的执⾏过程。 当我们想要了解一个函数是如何被其他函数调用的&#xff0c;或者想要查看调用栈中的其他信息时&#xff0c;这个方法非常有用…

Cadence Virtuoso IC617 系统内存清理

1、清空simelation和垃圾箱下的文件 2、在虚拟机磁盘路径下&#xff0c;例如/home下面输入 cat /dev/zero > zero.fill;sync;sleep 1;sync;rm -f zero.fill 3、在windows下winR ->cmd 找到VMware安装目录和系统存放目录 Microsoft Windows [版本 10.0.19045.4412] (c…

/etc/fstab、/etc/mtab 文件详解及永久挂载(文件系统、ISO镜像、文件网络共享)

/etc/mtab /etc/mtab 是当前的分区挂载情况&#xff0c;记录的是当前系统已挂载的分区。每次挂载/卸载分区时会更新 /etc/mtab 文件中的信息&#xff08;执行 mount 命令会改变 /etc/mtab 的信息&#xff09;。 文件样例 /etc/fstab 系统开机时会主动读取 /etc/fstab 这个文…

网络服务ftp实验

网络服务之ftp vsftpd的安装和配置 rpm -qc vsftpd #检查vsftpd安装包是否存在&#xff0c;存在即不需要安装 yum install -y vsftpd #yum 安装vsftpdcd /etc/vsftpd ls #切换到安装好vsftpd目录下查看文件cp vsftpd.conf vsftpd.conf.bak.20240604 #将vsftpd的…

数据库开发-Mysql03

目录 1. 多表查询 1.1 概述 1.1.1 数据准备 1.1.2 介绍 1.1.3 分类 1.2 内连接 1.3 外连接 1.4 子查询 1.4.1 介绍 1.4.2 标量子查询 1.4.3 列子查询 1.4.4 行子查询 1.4.5 表子查询 1.5 案例 2. 事务 2.1 介绍 2.2 操作 2.3 四大特性 3. 索引 3.1 介绍 3…

算法人生(18):从神经网络的“剪枝策略”看“怎么找回时间”

IT人的工作和生活难平衡这事&#xff0c;到底要怎么解决呢&#xff0c;让我们从神经网络的“剪枝策略”中找点灵感吧&#xff01; 剪枝策略是指训练和优化深度神经网络时采取的一种技术&#xff0c;从名字就知道&#xff0c;它就像修剪树木一样&#xff0c;去除不必要的枝叶&a…

《平渊》· 捌 —— 「庄子」山木篇中的 “空船效应”

《平渊》 捌 "若能虚己以游世&#xff0c;其孰能害之&#xff1f;" "方舟而济于河&#xff0c;有虚船来触舟&#xff0c;虽有惼心之人而不怒&#xff1b;有一人子其上&#xff0c;则呼张歙之&#xff1b;一呼而不闻&#xff0c;再呼而不闻&#xff0c;于是三呼邪…

Linux C语言学习:数据类型

一、 为什么要引入数据类型 • 计算机中每个字节都有一个地址&#xff08;类似门牌号&#xff09; • CPU通过 地址 来访问这个字节的空间 0x20001103 1 0 0 1 0 0 1 1 0x20001102 1 1 1 0 1 1 1 0 0x20001101 1 1 1 1 0 1 0 1 0x20001100 0 …

STM32 MDK Keil5软件调试功能使用(无需连接硬件)

MDK Keil5 在线仿真STM32&#xff08;无需连接硬件&#xff09; 首先点击工具栏的魔术棒配置一下&#xff1a;&#xff08;记得选择自己的STM32芯片类型&#xff09; 开启调试 使用逻辑分析仪查看IO输出 会打开这个界面&#xff0c;点击左边的setup按钮 会打开这个窗口&am…

Golang | Leetcode Golang题解之第119题杨辉三角II

题目&#xff1a; 题解&#xff1a; func getRow(rowIndex int) []int {row : make([]int, rowIndex1)row[0] 1for i : 1; i < rowIndex; i {row[i] row[i-1] * (rowIndex - i 1) / i}return row }

npm install pubsub-js报错的解决汇总

我在练习谷粒商城P83时&#xff0c;选择分类时触发向后端请求选择分类catId绑定的品牌数据&#xff0c;发现前端控制台报错&#xff1a; "PubSub is not definded",找不到pubsub。 因为缺少pubsub包&#xff0c;所以开始安装此包。 于是在网上一顿搜索猛如虎&…