深眸科技革新升级OCR技术,与AI视觉实现有效融合赋能各行业应用

OCR即光学字符识别,是通过扫描仪或工业相机等电子设备检查打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

目前,随着机器视觉和人工智能技术的进一步升级,OCR技术实现了与AI视觉的有效融合,在工业领域的实际生产应用中发挥着越来越重要的作用,包括在食品、医药、电力、消费电子等众多行业中具备良好的应用效果。

字符识别流程

图像预处理

目的:提高图像质量,从而提高OCR的准确性。

常见的图像预处理操作包括灰度化、二值化、降噪和图像增强等。

文字分割

目的:将图像中的文字区域切割出来,便于后续的文字识别。

文字分割可通过基于连通区域的方法或基于深度学习的方法实现。

文字识别

目的:将区域中的文字内容转化为计算机可识别的字符编码。

文字识别可以通过模版匹配的方法或基于深度学习的方法实现。

后处理

目的:进一步提高OCR的准确性,去除识别结果中的错误信息。

常见的后处理操作包括纠错、排版和格式化等。

场景复杂多样 字符识别难题凸显

在实际生产中,众多场景需要用OCR技术实现对印刷字符的检测,包括自动化设备控制、产品品质控制和物流控制等识别场景,但由于这些识别场景复杂多样,想要进一步提升字符识别应用效果往往面临困难。

高效率难题

由于生产工艺的影响,字符标签往往存在印刷模糊、歪斜、污染、破损等问题,导致检测效率较低。

高通用性难题

对于字符的检测包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制。

生产环境难题

识别过程容易受生产环境、产品品质和工艺、拍摄角度等影响,从而出现字符图像不清晰、畸形、缺失等情况。

研发难题

OCR在复杂场景的应用部署需要研发人员的深度参与,还需要字符样本深度学习训练、反复调参,操作门槛较高。

综上所述,在复杂多样的识别场景中,传统OCR技术面临多重难题,为实现缺陷字符的进一步检出,各制造厂商开始运用AI+机器视觉检测技术,对出厂前产品进行更严格检测,包括根据不同的产品材料、缺陷情况和客户需求,使用不同的光源、不同照射角度和不同像素的工业相机,对被识别字符的缺陷和复杂背景进行区分,最后利用缺陷图像的颜色、灰度、形状、大小等来识别。

技术革新升级 深度学习与OCR有效融合

随着字符识别技术加速渗透工业领域,作为机器视觉前沿技术的引领者,深眸科技坚持对OCR技术的革新升级,通过将深度学习与字符识别技术有效融合,全面赋能各行业应用。

深眸科技创新研发的轻辙标注训练平台,通过字符识别模块配合具备较高精度的工业相机拍摄取图,集推、训、测、转一体,能够在字符复杂、环境干扰等情况下,实现全场景、复杂条件下的字符识别。

通过深度学习算法,轻辙标注训练平台能够助力OCR技术能实现更高的识别精度和速度,并精准且快速完成因生产工艺导致的字符标签印刷模糊、歪斜、污染、破损等缺陷的检出,从而满足字符识别的高效率要求;轻辙标注训练平台还能通过自主学习各类工业场景中不同类型的字符,包括不同种语言文字、数字、符号等繁杂的字符组合以及条形码、二维码等不同码制,进一步提升了在字符识别场景中的通用能力。

深眸落地案例 OCR技术在各行业的应用

医药行业 · 药盒OCR检测

项目背景:

对于小盒装产品医药行业往往会将数个产品用透明塑料薄膜先包裹在进行装箱。塑料薄膜存在反光、多层堆叠(降低了字符的对比度)现象,会对字符识别产生严重的干扰。

检测难点:

· 多个产品多行字符

· 需要实现较高的识别准确率

· 塑料薄膜存在反光、堆叠对识别产生影响

解决方案:

深眸科技在此项目中,通过工业相机拍摄取图,以OCR技术加持,系统能够排除反光、堆叠等因素的干扰,提取分析并比较药盒生产日期、二维码等字符的完整性、正确性和是否存在缺失,当检测到问题时,发出信号给剔除装置并警报提示。

医药行业 · 药盒OCR检测项目

电力行业 · 电力线路杆号牌分拣

项目背景:

线路塔杆的杆号牌是线路杆塔的“身份证”,担负着宣传电力知识、安全警示的作用,杆号牌的字迹模糊、脱落等现象,给线路巡视检修、故障抢修等工作带来许多潜在隐患。

检测难点:

· 杆号牌字符不确定,无法预置字符库方式建立图像字符模版

· 字符方向与来料多样,存在相近字符的干扰

· 字符存在挤压变形,影响字符输出

解决方案:

深眸科技自研的轻辙标注训练平台,能够通过搭配文本检测算法与优化SVTR文本识别、文本方向分类器、文本尺度修正等算法,规范字符在尺度处理上的统一性。同时满足客户快速换型生产要求,在部分字符缺损、漏检、小数点符号干扰的情况下,对所有字符联想检出。

电力行业 · 电力线路杆号牌分拣项目

消费电子行业 · OCR错漏检测

项目背景:

空调内机外壳的品牌LOGO以及商标丝印在生产时会有缺损和错误的情况,同时装配阶段也会发生混料现象。由于生产量巨大,人工质检已经不能满足生产效率。

检测难点:

· 多种不同型号产品

· 商标丝印各不相同,软件切换时间短

· 单位检测时间需要判断多个图像特征

· 缺陷类型多样,产品成像角度不稳定

解决方案:

深眸科技的轻辙标注训练平台通过自研算法,能够秒级切换不同产品型号生产,还能动态判断产品字符内容,并以高性能软件架构实现效率提升,实现空调内机外壳品牌LOGO和商标丝印等字符的精准识别。

消费电子行业 · OCR错漏检测项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/194676.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LayoutLMv3 : 基于统一文本和带Masking图像的文档AI预训练【论文翻译】

文章目录 专业名词统计文档智能多模态预训练模型LayoutLMv3:兼具通用性与优越性LayoutLMv3 : 基于统一文本和带Masking图像的文档AI预训练ABSTRACT1 INTRODUCTION2 LAYOUTLMV32.1 Model Architecture(模型架构)2.2 Pre-training O…

域控操作四:本地化统一壁纸切可随时更改

分两步 1,将壁纸发送到本地,2指向本地地址路径 将壁纸发送到本地 用户配置–首选项–Windows设置–文件 按图进行更改就可以将共享文件夹的图片发送到员工电脑上 2将壁纸指向刚刚设置的目的文件 用户配置–策略–管理模板–桌面–桌面 按图进行设置即…

休闲娱乐 - 挂耳咖啡

公司有一个小的茶歇间,平时去喝个咖啡、放松身心、锻炼下身体。咖啡机是现磨咖啡豆的,喝喝就习惯了。 而我旁边一位同事习惯每天早上来自己泡一杯挂耳咖啡,再配上牛奶,感觉挺高级的。 关于挂耳咖啡就查了一下资料,介绍…

扩散模型实战(九):使用CLIP模型引导和控制扩散模型

推荐阅读列表: 扩散模型实战(一):基本原理介绍 扩散模型实战(二):扩散模型的发展 扩散模型实战(三):扩散模型的应用 扩散模型实战(四&#xff…

01.智慧商城——项目介绍与初始化

智慧商城 - 授课大纲 接口文档:https://apifox.com/apidoc/shared-12ab6b18-adc2-444c-ad11-0e60f5693f66/doc-2221080 演示地址:http://cba.itlike.com/public/mweb/#/ 01. 项目功能演示 1.明确功能模块 启动准备好的代码,演示移动端面…

UITableView的style是UITableViewStyleGrouped

一般情况下,UITableViewStylePlain和UITableViewStyleGrouped是UITableView常用到的style, 之前都是用到的时候,遇到问题直接用度娘,差不多就够用了,今天在修复UI提出的间隙问题,来回改,总觉得…

MathType2024最新word公式编辑器

使用word进行论文编写时,常需要使用公式编辑器,但有些word中并没有公式编辑器,这时应该怎么办呢?本文将围绕word里没有公式编辑器怎么办,word中的公式编辑器怎么用的内容进行介绍。 一、word里没有公式编辑器怎么办 …

【ES6标准入门】JavaScript中的模块Module语法的使用细节:export命令和imprt命令详细使用,超级详细!!!

😁 作者简介:一名大四的学生,致力学习前端开发技术 ⭐️个人主页:夜宵饽饽的主页 ❔ 系列专栏:JavaScript进阶指南 👐学习格言:成功不是终点,失败也并非末日,最重要的是继…

SpringBoot实现IP地址归属地查询

SpringBoot实现IP地址归属地查询 功能特性 标准化的数据格式 每个 IP 数据段的 region 信息都固定了格式: 国家|区域|省份|城市|ISP,只有中国的数据绝大部分精确到了城市,其他国家部分数据只能定位到国家,后前的选项全部是 0。…

OpenCV图像纹理

LBP描述 LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikinen, 和D. Harwood 在1994年提出,用于纹理特征提取…

第四代智能井盖传感器:万宾科技助力城市安全

在繁华喧嚣的城市里人来人往,井盖作为基础设施的一个组成部分在路面上分布范围广。然而这些看似普通的井盖却存在着位移、水浸的风险,可能给我们的生活带来诸多不便,更会威胁到我们的人身安全。如何有效监测和管理井盖的状态,成为…

【云原生-Kurbernetes篇】K8s的存储卷/数据卷+PV与PVC

这是一个目录标题 一、Kurbernetes中的存储卷1.1 为什么需要存储卷?1.2 存储卷概述1.2.1 简介1.2.2 volume字段 1.3 常用的存储卷类型1.3.1 emptyDir(临时存储卷)1.3.2 hostPath(节点存储卷)1.3.3 nfs1.3.4 cephfs 二、…

RocketMQ的适用场景有哪些?

程序员的公众号:源1024,获取更多资料,无加密无套路! 最近整理了一波电子书籍资料,包含《Effective Java中文版 第2版》《深入JAVA虚拟机》,《重构改善既有代码设计》,《MySQL高性能-第3版》&…

UE基础篇六:音频

导语: 通过实现一个小游戏,来学会音频,最后效果 入门 下载启动项目并解压缩。通过导航到项目文件夹并打开SkywardMuffin.uproject来打开项目。 按播放开始游戏。游戏的目标是在不坠落的情况下触摸尽可能多的云。单击鼠标左键跳到第一朵云。 游戏很放松,不是吗?为了强调…

php接口api数据签名及验签

api数据签名作用&#xff1a;通过使用签名可以验证数据在传输过程中是否被篡改或修改。接收方可以使用相同的签名算法和密钥对接收到的数据进行验证&#xff0c;如果验证失败则表明数据被篡改过 1、数据发送方进行接口签名并传输签名字段 <?php // 请求URL $url "h…

Python采集某网站数据实现简单可视化效果, webpack Js逆向解密

嗨喽&#xff0c;大家好呀~这里是爱看美女的茜茜呐 环境使用 : Python 3.8 Pycharm nodejs 模块使用: requests --> pip install requests execjs --> pip install PyExecJS csv 采集网站的数据如何去实现: 一. 数据来源分析 <√> 明确需求: 明确采集的网…

如何使用ArcGIS Pro制作粉饰效果

在地图上&#xff0c;如果某个部分比较重要&#xff0c;直接的制图不能将其凸显出来&#xff0c;如果想要突出显示重要部分&#xff0c;可以通过粉饰效果来实现&#xff0c;这里为大家介绍一下方法&#xff0c;希望能对你有所帮助。 数据来源 本教程所使用的数据是从水经微图…

vue2项目修改编译巨慢

前言&#xff1a;我们的一个vue项目在给新同事后他说编译贼慢&#xff0c;一个小修改项5分钟才能自动编译成功&#xff0c;我把项目放到新电脑上也巨慢&#xff0c;升级了nodejs好使了一些&#xff0c;但还是慢&#xff0c;最后引入webpack后巨快&#xff0c; 在项目的package…

如何在 Linux 上部署 RabbitMQ

如何在 Linux 上部署 RabbitMQ 文章目录 如何在 Linux 上部署 RabbitMQ安装 Erlang从预构建的二进制包安装从源代码编译 Erlang RabbitMQ 的安装使用 RabbitMQ Assistant 连接 RabbitMQ Assistant 是一款优秀的RabbitMQ 可视化管理工具&#xff0c;提供丰富的管理功能。下载地址…

ClickHouse的表引擎

1 表引擎的使用 表引擎是ClickHouse的一大特色。可以说&#xff0c; 表引擎决定了如何存储表的数据。包括&#xff1a; 数据的存储方式和位置&#xff0c;写到哪里以及从哪里读取数据。支持哪些查询以及如何支持。并发数据访问。索引的使用&#xff08;如果存在&#xff09;。是…