睿眼(Realeye)视觉识别模型训练全流程心得分享

睿眼(Realeye)是一款集智能采集、识别、定位、抓取、视控全流程为一体的 AI 产品, 以其 AI 算法结合机械臂硬件实现对万事万物的定位抓取功能,能够实现对任意目标物从图 片采集、标注到模型训练和抓取。通过人性化的交互方式、易操作的界面,将原本复杂的数据采集、模型训练、模型部署、机械臂适配、机械臂操作、视控等功能简单、易懂地呈现给用户,降低用户学习和使用成本。

睿眼的模型训练功能是其亮点之一,无需复杂的理论和操作,也无需专业的设备,在笔记本电脑上就能够训练出一个自己想要的识别模型。经过一段时间的试用,在此与大家分享在使用睿眼进行模型训练时的一点心得。

1.图像采集

要自己训练一个新模型,第一步便是采集包含识别目标的图像。在睿眼中,这一步名为:采集数据。其页面如图1.1所示:

图1.1:“采集数据”页面

进入这一页面后,单击最左侧的功能按钮开始流程(整个操作流程就是从左到右使用这些功能按键即可)。点击最左侧的新增数据集后,在弹出的窗口中输入数据集名称以及识别物体的标签名称。输入完成后,系统会弹出窗口,需要在其中选择一个图像来源,如图1.2所示:

图1.2:视频源选择

这一步需要根据实际需要选择,这里选择camera作为视频源。那么,睿眼就会使用摄像头来拍摄画面,并截取画面生成图片,作为后续训练的素材。这里需检查摄像头是否成功连接,可查看右上角图标,从左到右第二个图标显示了摄像头的连接状态,图1.2中的状态即是连接正常。

图1.3:选择camera作为视频源后的确认窗口

选择camera作为视频源后,会弹出一个窗口,其中显示的画面即为当前摄像头所拍的画面。若画面中没有要识别训练的目标物体,请拖动机械臂末端以移动摄像头,使目标物体出现在画面中,并点击“S”键(“s”亦可)。

完成以上步骤后,便可以开始图像采集。如图1.4、1.5所示,点击“顺序播放画面“按键,睿眼便会从摄像头画面中不断截取图像(采集过程中文件列表不会立刻更新,需要点击停止采集后文件列表才会更新。

图1.4:开始顺序播放画面

图1.5:停止采集后的文件列表

睿眼的图像采集速度为5帧/秒,所以采集的时间越长,所得到的图像数量就越多。图像更多,则训练得到的模型效果更好,但也会相应的使训练时间变长。大家在实践的过程中可自行衡量。

2.图片标注

图像采集完成后就需要进行标注,以告知睿眼目标物体的轮廓和在图像中的位置。标注方式又分为手动标注和自动标注两种。自动标注可以一键自动标注物体轮廓,只需点击一下物体在画面中的所在位置即可。但是自动标注只能大致根据物体与背景的轮廓分界来标注其形状,在一些时候存在误识别等问题,此时就需要重新自动标注或手动标注。

图2.1:自动标注物体轮廓(识别有误)

此时便可使用手动标注方法:取消自动标注的选择,然后用鼠标左键点击物体轮廓边缘,使画面上的点围绕物体。若过程中有点错的点,可用鼠标右键取消。如图2.2所示:

图2.2:手动标注物体边缘

若完成了边缘标注,即可按空格键,生成一个绿色图案覆盖住目标物体,如此便完成了一张图片的标注流程。如图2.3所示:

图2.3:点击空格键生成轮廓

如果一张一张地标注,操作上非常繁琐,因此睿眼提供了一个自动标注多张图片的功能。如图2.4:

图2.4:正向追踪目标

在前面,我们标注了序号为11的图片,此时点击正向追踪目标,睿眼便会以11为示范,自动完成序号12至最后的所有图片的标注。在我的使用过程中,一般是先手动标注一两张图,尽可能精确,这样使用自动追踪得到的标注效果就会较好。自动追踪目标的过程中,可以看到页面右下角的图片编号变化,主画面窗口的图像也会逐张切换,并显示标注出的轮廓。当自动追踪结束后,可找出其中标注效果不好的进行重新标注。反向追踪同理,不过它是从当前序号向前标注,功能相同,序号方向相反。

标注完所有图像后,点击“数据增强“按钮,睿眼将会自动处理数据集,向其中添加一定数量的图像,使得训练效果更好,如图2.5:

图2.5:数据增强

需要注意,数据增强产生的图像会添加到整个数据集中,便会使得图像张数变多,造成训练的时间延长。

3.识别训练

获得数据集并处理完成后,即可开始模型训练,如图3.1:

图3.1:识别训练页面

首先选择训练的轮次,即训练过程中整个训练数据集被模型使用的次数。默认为30轮,轮次越多,效果越好,但是花费的时间也将按倍数增加。

其次为训练批次选择,在机器学习中,训练批次即每次更新模型参数时使用多少训练数据。此值越大,对资源消耗占用越多,但相应的训练效果也更好。需要注意,训练批次的选择会极大的影响训练时的内存占用,若设置得过大,而硬件性能不足,会导致训练失败闪退。

最后则是选择参与本次训练的数据集,可以使用刚刚标注好的数据集,也可以用之前标注的数据集。查看当前的所有数据集可以点击左侧最下方的“设置管理“按钮,如图3.2:

图3.2:查看当前的所有数据集

选择完三个参数后,点击左侧的“开始训练“按钮即可开始模型训练,接下来只需要等待即可。如图3.3:

图3.3:开始训练(负担最小,速度最快的配置)

训练过程中,可以实时查看训练情况,如图3.4所示(之前训练时截的):

图3.4:训练过程中的页面

训练完成后,便得到了识别模型,可用于推理识别和识别抓取等一系列过程。日后会对这些操作过程进行分享,此处暂不赘述。

4.虚拟内存设置

整个训练过程中,电脑硬件配置、图片数量、训练轮次、训练批次都会影响训练速度。

有时候,可能一开始运行识别训练就会报错闪退,最可能的原因就是电脑内存不足。为了解决这个问题,可以通过设置虚拟内存来解决。

首先进入设置-系统-系统信息,如图4.1所示:(笔者电脑系统为win11)

图4.1:设置-系统-系统信息

进入系统信息页面后点击进入高级系统设置:

图4.2:系统信息页面

然后依次点击:高级-性能-设置-高级-虚拟内存-更改:

图4.3:高级系统设置页面

进入虚拟内存设置页面后,选择一个空间多的盘(最好是固态),自定义虚拟内存大小,最大值推荐为16*1024mb,如图4.4所示:

图4.4:虚拟内存设置

完成以上操作后点击确定,虚拟内存的设置便完成了。

接下来便可再次尝试模型的识别训练。

欢迎在评论区交流讨论。祝您顺利!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/285728.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自然语言处理: 第十九章LoRAQLoRA微调技巧

论文地址:使用低秩自适应 (LoRA) 进行参数高效LLM微调 - Lightning AI — Parameter-Efficient LLM Finetuning With Low-Rank Adaptation (LoRA) - Lightning AI 本篇文章是由位来自威斯康星大学麦迪逊分校的统计学助理教授Sebastian Raschk…

C++除了Qt还有什么GUI库?

C除了Qt还有什么GUI库? 先,不要折腾,不要想着用 C 来做 App 类的 GUI 开发。 所以你问用 c gui 库,本来确实有很多,但是经过几十年的沉淀,最后只留下一个 qt quick 和其他特殊需求的库(包括 qt…

西圣、漫步者、万魔开放式耳机如何?甄选机型实测对比测评

无论是通勤、工作还是休闲时光,耳机总能为我们带来沉浸式的音乐体验。近年来,开放式耳机以其独特的优势逐渐受到市场的青睐,其中西圣、漫步者、万魔等品牌在市场上相当火热,那这三款开放式耳机的实际到底如何,还是有许…

nodeJs中实现连表查询

nodeJs中实现连表查询 router.post(/getOrder, async function(req, res, next) {let userId req.body.phone;let sql select * from orders where userId?;let orders await new Promise((resolve, reject) > {connection.query(sql, [userId], function(error, resul…

Python灰帽子网络安全实践

教程介绍 旨在降低网络防范黑客的入门门槛,适合所有中小企业和传统企业。罗列常见的攻击手段和防范方法,让网站管理人员都具备基本的保护能力。Python 编程的简单实现,让网络运维变得更简单。各种黑客工具的理论和原理解剖,让人知…

详解“外卡收单”系统(1)

近年来,随着跨境贸易和服务的不断发展,外卡收单行业展现出新的发展态势。随着越来越多外国人在中国消费,中国商家为满足海外消费者需求开始接受国际信用卡支付。根据官方数据显示,截至2023年11月,上海的外卡POS机已超过…

【C++】vector容器初步模拟

送给大家一句话: 努力一点,漂亮—点,阳光一点。早晚有一天,你会惊艳了时光,既无人能替,又光芒万丈。 vector容器初步模拟 1 认识vector开始了解底层实现 2 开始实现成员变量构造函数 析构函数尾插迭代器插入…

集成学习 | 集成学习思想:Boosting思想 | XGBoost算法、LightGBM算法

目录 一. XGBoost 算法1. XGBoost 算法流程2. XGBoost 算法评价 二. LightGBM 算法2. LightGBM 算法优势 上一篇文章中,我们了解了Boosting思想的两种算法:Adboost和GBDT;其中对于GBDT算法,存在两种改进,即&#xff1a…

外包干了20天,技术退步明显.......

先说一下自己的情况,大专生,21年通过校招进入杭州某软件公司,干了接近2年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落! 而我已经在一个企业干了2年的功能测试…

1分钟带你学会使用Python操作 xlsx 文件绘制面积图

​我们工作中经常要处理海量的数据,如果没有一个直观的可视化工具,怎么可能一眼就看出数据背后的故事呢?数据可视化显得越来越重要,数据分析已经成了现代人必备的技能。 今天来和大家分享一个超有趣的数据可视化方法——绘制面积…

Redis中文乱码问题

最近排查问题,发现之前的开发将日志写在redis缓存中(不建议这样做),我在查看日志的时候发现没办法阅读,详细是这样的: 查阅资料后发现是进制问题,解决方法是启动客户端的时候将redis-cli改为red…

流畅的 Python 第二版(GPT 重译)(四)

第二部分:函数作为对象 第七章:函数作为一等对象 我从未认为 Python 受到函数式语言的重大影响,无论人们说什么或想什么。我更熟悉命令式语言,如 C 和 Algol 68,尽管我将函数作为一等对象,但我并不认为 Py…

【机器学习】机器学习是什么?

文章目录 前言 机器学习 序列学习和对抗学习有什么不同 总结 前言 在当今快速发展的科技时代,人工智能已经成为推动社会进步的重要力量。机器学习,作为人工智能领域的一个重要分支,它的核心能力在于使计算机系统能够从数据中学习规律&…

Python RPA简单开发实践(selenium登陆浏览器自动输入密码登陆)

打开csdn博客,简单版 class BS:def __init__(self, url):self.url url# self.password password# self.username usernamedef login_url(self):from selenium import webdriver# 不自动关闭浏览器option webdriver.ChromeOptions()option.add_experimental_opt…

Vue 若依框架 form-generator添加表格组件和动态表单组件

效果图: 在若依框架自带的流程表单配置基础上添加这两个组件 config.js // 表单属性【右面板】 export const formConf {formRef: elForm,formModel: formData,other: other,size: medium,labelPosition: right,labelWidth: 100,formRules: rules,gutter: 15,dis…

LeetCode每日一题[c++]-322.零钱兑换

题目描述 给你一个整数数组 coins ,表示不同面额的硬币;以及一个整数 amount ,表示总金额。 计算并返回可以凑成总金额所需的 最少的硬币个数 。如果没有任何一种硬币组合能组成总金额,返回 -1 。 你可以认为每种硬币的数量是无…

游戏提示steam_api64.dll丢失怎样修复?教你5种快速修复的方法

在计算机系统中,如果未能成功找到或加载steam_api64.dll文件,可能会引发一系列的问题和故障现象。这个特定的DLL文件是Steam平台的核心组件之一,对于运行基于Steam平台的游戏或应用至关重要。当系统提示“找不到steam_api64.dll”时&#xff…

抖音视频关键词爬虫批量采集软件|视频提取下载工具

视频关键词批量采集软件 — 助力您快速获取所需视频 主要功能: 关键词批量提取视频和单独视频提取,提取后下载功能。 功能解析: 1. 关键词批量提取视频的解析 通过输入关键词进行视频搜索和提取。例如,输入“汽车配件”&#x…

N9010B EXA 信号分析仪 10 Hz 至 44 GHz

N9010B EXA 信号分析仪 10 Hz 至 44 GHz 产品综述 <<<<频率范围&#xff1a;10 Hz 至 44 GHz>>> keysight N9010B EXA 信号分析仪&#xff0c;10 Hz 至 44 GHz无论是增强产品性能还是提高测试吞吐量&#xff0c;您的通用型信号分析仪都要有能力满足各…

为什么电商系统一定要跟企业ERP做数据对接?

一篇文章告诉你&#xff0c;为什么电商系统一定要跟企业ERP做数据对接&#xff1f; 在电商日益发展的情况下&#xff0c;每个电商企业的单量越来越大。但是电商系统对于财务来说并不友好&#xff0c;所以企业会另外上一套财务系统方便财务做账和企业内部管理。那如果还是按照之…