ViT-Reg:面向tinyML平台的回归聚焦型硬件感知微调Vision Transformer

论文标题:ViT-Reg: Regression-Focused Hardware-Aware Fine-Tuning for ViT on tinyML Platforms

作者信息:Md Ragib Shaharear、Arnab Neelim Mazumder 和 Tinoosh Mohsenin,分别来自约翰霍普金斯大学电气与计算机工程系和马里兰大学巴尔的摩分校计算机科学与电气工程系。

论文出处:IEEE DESIGN AND TEST

摘要: 本文介绍了一种名为ViT-Reg的方法,它是一种基于回归的、针对tinyML平台上Vision Transformers(ViTs)的硬件感知微调方法。ViTs在图像分类任务中表现出显著的性能提升,但在资源受限的tinyML平台上部署时面临挑战,因为它们对计算需求高且动态功耗大。ViT-Reg通过多项式回归缩小搜索空间,同时将准确性作为约束条件,有效探索配置空间,显著降低了与架构搜索相关的计算开销。在CIFAR-10和Tiny-ImageNet数据集上的实验表明,ViT-Reg在Nvidia Jetson Nano上的部署相较于基线ViT模型,动态功耗分别减少了55.6%和37.4%,能效提高了65%和60%,并且相对于VGG模型的硬件实现,能效提升了8倍。

引言: 深度学习的最新进展,尤其是使用自注意力机制的ViTs,显著提高了图像识别、分类和语义分割等计算机视觉任务的性能。然而,ViTs架构的设计尚未充分探索,需要在模型准确性和硬件资源消耗之间找到平衡。ViT-Reg提出了一种基于回归的微调技术,通过训练具有不同变量配置的多个模型,使用回归分析准确性和动态功耗,从而发现给定目标和约束的近优解。

相关工作: ViTs通过将图像划分为固定大小的块,将它们转换为平面向量,并使用位置嵌入投影到高维空间中来处理图像。ViTs的自注意力机制使模型能够关注分类的相关块。尽管ViTs在tinyML设备上的部署尚未充分探索,但本文的方法避免了依赖于传统暴力算法的NAS方法,而是基于多项式回归,使搜索过程更加轻量级。

背景与提出的架构: ViTs通过自监督方法基于两个关键变量:补丁数量(n)和嵌入维度(d)进行训练。训练完成后,将ViT配置部署到目标设备上,如Nvidia Jetson Nano,以测量推理期间的动态功耗。ViT-Reg方法通过多项式回归分析不同ViT配置对准确性和动态功耗的影响,从而得到两个不同的性能轮廓,并执行单目标优化以识别近优配置。

软件和硬件实验设置: 实验使用了CIFAR-10和Tiny-ImageNet数据集,分别包含32x32像素和64x64像素的图像。ViTs在小数据集上训练时表现不佳,因此本文采用了自监督权重学习训练过程。评估了ViT的9种不同配置的准确性,并使用PyTorch库进行了100个周期的训练。将软件模型转换为ONNX格式,并在Nvidia Jetson Nano SDK GPU上进一步转换为TensorRT表示,以创建GPU可加速的推理引擎。

基于回归的建模: 为了预测准确性,开发了一个准确性多项式,使用最小二乘误差方法来近似ViT的准确性水平。动态功耗多项式取决于计算、特征图和杂项组件的功耗。通过在TensorRT引擎中运行推理并使用tegrastats实用工具来测量GPU在模型推理期间的平均动态功耗和延迟。

近优解: 近优解涉及开发数学模型,将参数与准确性和动态功耗联系起来。通过设置目标准确性,解决在这些条件下实现目标准确性的d和n的值,并确保在这些条件下最小化功耗,来识别近优配置。

与现有工作的比较: ViT-Reg模型与最近在Jetson Nano上实现的VGG网络和DeiT-small模型相比,显示出显著的效率和性能提升。ViT-Reg在CIFAR-10数据集上消耗的动态功率仅为886毫瓦,比VGG的3900毫瓦低4.4倍。此外,ViT-Reg在延迟和能效方面也有显著改进。

结论: ViT-Reg提供了一种轻量级搜索方法,用于确定适合在tinyML设备上低功耗部署的ViT配置。该方法引入了动态功耗多项式,通过考虑设备趋势,使过程具有硬件感知能力。ViT-Reg方法显著降低了动态功耗,提高了延迟和能效,与最近的VGG实现和DeiT-small模型相比具有优势。未来的工作可以将单一目标优化问题扩展为多目标方法,考虑动态功耗和推理速度等多个指标作为目标,将准确性或峰值内存作为约束条件。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/495966.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于OpenCV和Python的人脸识别系统_django

开发语言:Python框架:djangoPython版本:python3.7.7数据库:mysql 5.7数据库工具:Navicat11开发软件:PyCharm 系统展示 管理员登录 管理员功能界面 用户管理 公告信息管理 操作日志管理 用户登录界面 用户…

【原创学习笔记】近期项目中使用的西门子V20变频器总结(上篇)

现场V20 22kW变频器如图所示 进线分别为L1,L2,L3,PE线,出现分别为U,V,W接电机 在西门子官网查询手册后,查询可知可以通过多种方式控制变频器,比如:面板(BOP)控制,端子(NPN/PNP&…

spring专题笔记(六):bean的自动装配(自动化注入)-根据名字进行自动装配、根据类型进行自动装配。代码演示,通俗易懂。

目录 一、根据名字进行自动装配--byName 二、根据类型进行自动装配 byType 本文章主要是介绍spring的自动装配机制, 用代码演示spring如何根据名字进行自动装配、如何根据类型进行自动装配。代码演示,通俗易懂。 一、根据名字进行自动装配--byName Us…

实战分享:开发设计文档模版及编写要点

总框架 一、需求类开发设计文档模版 1、PRD链接 PRD文档链接 2、后端设计 1)流程图/代码逻辑描述 描述代码逻辑,要求清晰准确,尽量用图表描述 超过3人天工作量的需求必须有流程图 2)库表设计 涉及数据库的改动&#xff0c…

Edge Scdn是用来干什么的?

酷盾安全Edge Scdn,即边缘式高防御内容分发网络,主要是通过分布在不同地理位置的多个节点,使用户能够更快地访问网站内容。同时,Edge Scdn通过先进的技术手段,提高了网上内容传输的安全性,防止各种网络攻击…

牛客周赛73B:JAVA

链接:登录—专业IT笔试面试备考平台_牛客网 来源:牛客网 题目描述 \hspace{15pt}小红拿到了正整数 xxx ,她希望你找到一个长度为 kkk 的区间,满足区间内恰好有 nnn 个数是 xxx 的倍数。你能帮帮她吗? 输入描述: …

微信小程序中遇到过的问题

记录微信小程序中遇到的问题(持续更新ing) 问题描述:1. WXML中无法直接调用JavaScript方法。2. css中无法直接引用背景图片。3. 关于右上角胶囊按钮。4. 数据绑定问题。5. 事件处理问题。 问题描述: 1. WXML中无法直接调用JavaSc…

Docker 安装mysql ,redis,nacos

一、Mysql 一、Docker安装Mysql 1、启动Docker 启动:sudo systemctl start dockerservice docker start 停止:systemctl stop docker 重启:systemctl restart docker 2、查询mysql docker search mysql 3、安装mysql 3.1.默认拉取最新版…

Leecode刷题C语言之字符串及其反转中是否存在同一子字符串

执行结果:通过 执行用时和内存消耗如下&#xff1a; bool isSubstringPresent(char* s) {int i,lenstrlen(s),end;for(i0;i<len-1;i){if(s[i]s[i1]) return true;for(endlen-1;end>1;end--){if(s[i]s[end]&&s[i1]s[end-1]) return true;}}return false; }解…

uniapp登录

第一步整登录 先整个appid APPID和APPSecret https://developers.weixin.qq.com/community/develop/article/doc/000ca4601b8f70e379febac985b413 一个账号只能整一个小程序 正确流程 调用uni.login https://juejin.cn/post/7126553599445827621 https://www.jb51.net/a…

【开源免费】基于SpringBoot+Vue.JS安康旅游网站(JAVA毕业设计)

本文项目编号 T 098 &#xff0c;文末自助获取源码 \color{red}{T098&#xff0c;文末自助获取源码} T098&#xff0c;文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…

AIGC:生成图像动力学

文章目录 前言一、介绍二、方法2.1、运动预测模块运动纹理 2.2、图像渲染模块 三、数据集实验总结 前言 让静态的风景图能够动起来真的很有意思&#xff0c;不得不说CVPR2024 best paper实质名归&#xff0c;创意十足的一篇文章&#xff01;&#xff01;&#xff01; paper&a…

cesium入门学习二

之前学习了cesium的一些基本操作&#xff0c;现在学习cesium怎么加载模型&#xff0c;以及一些其他操作。 1.学习汇总目录 第一篇&#xff1a;cesium入门学习一-CSDN博客 2.cesium效果显示以及代码 2.1 加载模型并显示 效果&#xff1a; js代码&#xff1a; // 创建 Ces…

路由策略

控制层流量 --- 路由协议传递路由信息时产生的流量 数据层流量 --- 设备访问目标地址时产生的流量 所谓的路由策略----在控制层面转发流量的过程中&#xff0c;截取流量&#xff0c;之后修改流量再转发或不转发的技术&#xff0c;最终达到影响路由器路由表的生成&#xff0c…

网络安全 - Cross-site scripting

1.1.1 摘要 在本系列的第一篇博文中&#xff0c;我向大家介绍了SQL Injection常用的攻击和防范的技术。这个漏洞可以导致一些非常严重的后果&#xff0c;但幸运的是我们可以通过限制用户数据库的权限、使用参数化的SQL语句或使用ORM等技术来防范SQL Injection的发生&#xff0c…

一、Hadoop概述

文章目录 一、Hadoop是什么二、Hadoop发展历史三、Hadoop三大发行版本1. Apache Hadoop2. Cloudera Hadoop3. Hortonworks Hadoop四、Hadoop优势1. 高可靠性2. 高扩展性3. 高效性4. 高容错性五、Hadoop 组成1. Hadoop1.x、2.x、3.x区别2. HDFS 架构概述3. YARN 架构概述4. MapR…

信息安全管理与评估赛题第9套

全国职业院校技能大赛 高等职业教育组 信息安全管理与评估 赛题九 模块一 网络平台搭建与设备安全防护 1 赛项时间 共计180分钟。 2 赛项信息 竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 第一阶段 网络平台搭建与设备安全防护 任务1 网络平台搭建 XX:XX- XX:XX 50 任务2…

低代码开发中 DDD 领域驱动的页面权限控制

在低代码开发的领域中&#xff0c;应用安全与灵活性是两大关键考量因素。领域驱动设计&#xff08;DDD&#xff09;作为一种在软件设计领域广泛应用且颇具影响力的方法论&#xff0c;正逐渐在低代码开发的页面权限控制方面展现出其独特的价值与潜力。本文旨在客观地探讨如何借助…

目录jangow-01-1.0.1靶机

靶机 ip&#xff1a;192.168.152.155 把靶机的网络模式调成和攻击机kali一样的网络模式&#xff0c;我的kali是NAT模式, 在系统启动时(长按shift键)直到显示以下界面 ,我们选第二个&#xff0c;按回车。 继续选择第二个&#xff0c;这次按 e 进入编辑页面 接下来&#xff0c;…

微信小程序 不同角色进入不同页面、呈现不同底部导航栏

遇到这个需求之前一直使用的小程序默认底部导航栏&#xff0c;且小程序默认入口页面为pages/index/index&#xff0c;要使不同角色呈现不同底部导航栏&#xff0c;必须要在不同页面引用不同的自定义导航栏。本篇将结合分包&#xff08;subPackages&#xff09;展开以下三步叙述…