OCR二次开发宝典:飞桨联合多家企业和高校发布《OCR产业范例20讲》

9de83739b930ffa51facac65c45317a8.gif

文字识别(Optical Character Recognition,OCR)作为AI领域发展较成熟的一种技术方向,已经在各种产业场景得到落地应用。除了文档电子化、卡证识别等典型的应用场景,还存在大量长尾场景,如工业场景的PCB文字识别、电表识别等。由于训练数据分布问题,通用OCR能力一般无法直接在长尾场景达到满意的效果,而一套通用的OCR能力经过微调往往能够在垂类场景中获得显著的性能提升。

193848fc623d68d1bf4d86c20ebf7264.png

OCR的长尾应用场景:自然场景

0a8acb90a34165b576a5bbab3a02a5ff.jpeg

OCR的长尾应用场景:文档场景

对于不熟悉OCR领域的开发者来说,基于通用OCR能力的微调方法与落地步骤显得十分繁杂且无从下手。同时,市面上也没有系统性介绍OCR落地经验的材料。

针对以上问题,PaddleOCR联合北京师范大学副教授柯永红、云南省能源投资集团财务有限公司智能化项目经理钟榆星、信雅达科技股份有限公司高级研发工程师张少华、郑州三晖电气股份有限公司工程师郭媛媛、福建中烟工业有限责任公司工程师顾茜、内蒙古阿尔泰电子信息技术有限公司CTO欧日乐克、安科私(北京)科技有限公司创始人柯双喜等产学研同仁共同开源《OCR产业范例20讲》电子书,通过Notebook的形式系统展示OCR在产业界应用的具体场景的调优过程与落地经验。该书包含以下特点:

  • 20例OCR在工业、金融、教育、交通等行业的关键场景应用范例;

  • 覆盖从问题抽象、数据处理、训练调优、部署应用的全流程AI落地环节,为开发者提供常见的OCR优化思路;

  • 每个范例配有交互式Notebook教程,通过代码展示获得实际结果,便于学习修改与二次开发;

  • GitHub和AI Studio上开源本书中涉及的范例内容和代码,方便开发者学习和使用。

756f9e09bb340ad397d5e662823f9fa7.jpeg

b6b6c326815e77f591f5b7fbdb6c6510.png

1a221f6145440c120483696208250d6e.png

141e9940991d565278b6d7eb8c49e41f.png

<<< 滑动查看更多图片 >>>

扫描文末二维码,入群后免费领取!

GitHub传送门

https://github.com/PaddlePaddle/PaddleOCR

3428587b59007a39a4537e29bdf5cb5a.png内容结构

如下图所示,基于PaddleOCR完成一个范例的完整流程一般包含数据准备、模型训练、推理部署三个部分,具体来说:

d137829b7e8eccf0114db2f50100b449.png

数据准备

数据是保证模型效果的关键。而真实场景中往往存在数据不足的问题,因此在数据准备的部分,我们一般可以通过收集开源数据、数据增广、数据挖掘等手段来丰富训练数据。例如,在产品包装生产日期识别的范例中,我们利用现有的高精度大模型进行数据挖掘,补充真实场景训练数据,来优化小模型的效果。

模型训练

PP-OCR和PP-Structure系列模型都使用了大量训练数据,在通用场景可以一定程度地保证精度和泛化性,因此一般建议基于飞桨PP系列模型进行模型微调(finetune),从而实现使用较少的业务数据达到预期效果。基于不同场景业务数据训练的模型,有时需要针对前后处理进行任务适配,往往能进一步提升整体效果,偶尔甚至有“奇效”。如车牌识别范例中,通过后处理优化特殊符号的识别结果,大幅提升了整体识别精度。

推理部署

产业落地的最后一步是推理部署,如果在端侧部署,往往还需要做模型量化。我们在不同的范例中演示了不同的部署场景和方式,包括服务化部署、端侧部署等。

下表给出了本书20例的优化点汇总,方便查询阅读。

431fd64d5e9d1e044c1d4c81e7eeef62.png

4d3582234146c1b763d537875767f362.png

向下滑动查看所有优化点内容

4dba7ae9eb5579d5c352a2745a46f1d0.png范例介绍

b02fe2e6d10586dc07aa9aa915924516.png智能电表缺陷检测

郑州三晖电气股份有限公司

智能电表的外观检测是其质量检测的重要内容。液晶显示屏上的字符大小不一、密度大、种类多,特殊字符训练有难度。以往采用人工检测,耗费时间长、检测效率低下,传统机器视觉的模板匹配法上线新电表需要重新制作。采用深度学习的方法,基于PaddleOCR开发套件与PPOCRLabel半自动标注工具标注数据,微调PP-OCRv3检测与识别模型,最终在流水线上测试检测模型的准确率可达99%以上,识别模型的准确率达到96%以上

c266b65a65712d27744831c143d05b03.png

baabcc389a2798c6c49f46be5afb28c3.png甲骨文识别 

北京师范大学

当前甲骨文尚未完成国际编码,甲骨文字形多以图片而非矢量字体呈现,这给甲骨文的研究、应用和传播带来了诸多不便。利用计算机对甲骨文字形进行自动检测和识别,具有重要的现实意义。传统研究多是基于小样本的训练集,不能满足实用的需要。针对该场景,本案例构建了一个包括1,000个单字、374,161个字样的甲骨文已识字数据集,基于PaddleOCR和PaddleClas进行检测和识别训练。实验结果显示,本范例的检测精度为98%,识别精度为94%,帮助实现甲骨文已识字的快速检索和广泛传播。

71469e185e17e757db1c5c26347c1e31.png

9a8a938ca57ce46656ef50b125883a44.png蒙文识别

内蒙古阿尔泰电子信息技术有限公司

蒙古文文字识别技术在蒙古文信息处理领域是一个亟待解决的问题。由于蒙古文字符复杂、排版方向与简体中文不同、行宽的不一致等问题,导致目前产品化蒙古文文字识别仍有很多阻碍。针对以上问题,本例选用PP-OCRv3这一开源超轻量OCR系统进行蒙古文文本识别系统的开发,加入250万合成数据,在现有模型基础上进行微调,通过修正训练集,设定评估标准,最终将蒙古文识别精度从42%提升至75%。

a86c7f96af842fbbd1556c72f5b64c65.png

c25900e2ca03226edc0d1fc47509bc1d.png银行回单关键信息识别

安科私(北京)科技有限公司

银行回单是企业财务记账的重要原始凭证之一。目前是由财务人员进行人工读取,提取账单中的收付款人、流水单号、金额等关键信息,结合财务记账规则进行处理,加工成记账凭证、资产负债表、开具发票。针对该场景,本范例基于PP-Structure训练命名实体识别、关系抽取模型并基于Hub Serving完成关键信息抽取的服务化部署,实现代替记账公司实现自动化记账报税功能。

c691297aff6c763d960c3a70a2d30339.png

95679128787c4041964d687995627c81.png更多内容

除了《OCR产业范例20讲》以外,深度学习和理解OCR的理论知识也必不可少。《动手学OCR》覆盖文本检测识别、文档分析等OCR全栈技术,配套电子书与教学视频,是开发者在OCR领域夯实理论基础、动手代码实践的另一本必不可少的书籍!

01ba49ec711dc78bf210f05759c4b65a.jpeg

bef1ccad80bba5f6033aed84fbe55bd7.png

6dc57e83219a0575666a93bf96dc123f.jpeg

<<< 滑动查看更多图片 >>>

【获取方式】

9cd57b31e64b1ee266e6efb1999e6990.png

更多内容可参考以下链接

  • 飞桨官网

https://www.paddlepaddle.org.cn

  • PaddleOCR项目地址(Github)

https://github.com/PaddlePaddle/PaddleOCR

  • Gitee

https://gitee.com/PaddlePaddle/PaddleOCR

a693052f83c65807f8f8ae6e8e9dc777.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/69498.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

程序员学炒股(3) 个股和大盘的关系之二

有了前一节的基础&#xff0c;这一节就简单多了&#xff0c;无非就是把所有股票遍历一下&#xff0c;我这里为了代码简单起见&#xff0c;就没有考虑停牌天数的影响。 下面就直接上代码了&#xff0c;我这里只是计算了一下沪市所有股票与上证指数的关系。 using System; using …

干货-任正非号召华为员工学习:认识5G,发展5G

华为创始人任正非近日签发的一份电子邮件号召华为全体员工学习一份名为《认识5G&#xff0c;发展5G》的PPT&#xff0c;该PPT是根据王喜文博士的文章缩编的&#xff0c;而王喜文博士是国内第一本“工业4.0”方面专著的作者。 该PPT主要围绕以下几个方面展开&#xff1a; 什么…

任正非号召华为员工学习的一份5G PPT(附下载)

今天&#xff0c;华为创始人任正非签发的一份邮件曝光。该邮件公布了一份名为《认识5G&#xff0c;发展5G》的PPT&#xff0c;号召供公共关系、接待经理、非市场与技术人员学习。 原来&#xff0c;这份PPT就是根据我们之前分享给大家的来自王喜文博士的《5G为人工智能与智能制造…

干货!任正非对话美国科技思想家,都说了些什么

https://www.toutiao.com/a6703424788846608903/ 2019-06-17 17:11:48 2019年6月17日下午2点&#xff0c;华为创始人兼CEO任正非在深圳与数字时代三大思想家的其中两位&#xff0c;《福布斯》著名撰稿人乔治吉尔德和美国《连线》杂志专栏作家尼古拉斯内格罗蓬特&#xff08;也…

华为又收天才少女,进华为的标准是什么?

昨天在华为官网刷到一个蛮有意思的事情&#xff0c;华为官网显示年仅 22 岁的瓦莱里娅 里亚布奇科娃&#xff0c;已正式加入华为俄罗斯下诺夫哥罗德研究所&#xff0c;任职高级工程师&#xff0c;从事智能计算应用加速技术方面的研究。行外的朋友可能不了解&#xff0c;这个女…

任正非,就会折腾

“兄弟们&#xff0c;好好干&#xff0c;未来的电信市场&#xff0c;华为三分天下有其一。” “兄弟们&#xff0c;好好地干&#xff01;我们的市场前景广阔得很&#xff0c;到那时大家的钱多得不得了&#xff0c;多到什么程度呢&#xff1f;就是钱在衣柜里面装不下&#xff0…

任正非与美国思想家的咖啡对话全文

来源&#xff1a;华为心声、蓝血研究 美国的所作所为促成了华为的觉醒&#xff0c;现在是华为的“人造卫星”时代&#xff01; ——尼古拉斯尼葛洛庞帝 美国学者与任正非的咖啡对话 2019年6月17日 田薇&#xff1a;“一杯咖啡吸收宇宙能量”&#xff0c;我是田薇。有人说&#…

【微信机器人】可做自动回复,自动接收转账,群聊机器人。

前言&#xff1a; 目前市面上的微信机器人项目少之又少&#xff0c;并且大多数的不可用。比如用抓取网页微信接口&#xff0c;但大多数人的账号没有使用网页微信的权限。又或者价格昂贵&#xff0c;如使用微信pad协议。于是便开发一个通过Hook微信的DLL文件&#xff0c;修改其…

计算机软件著作权法保护的内容不包括,计算机著作权保护法中的软件著作权包括哪些权限...

二、侵犯软件著作权 (软件的标准是什么&#xff1f;软件著作权不一定要注册&#xff0c;3.侵犯软件著作权的刑事处罚标准是什么&#xff1f;其实除了软件著作权&#xff0c;扩展阅读:计算机软件著作权如何申请注册&#xff0c;(作品没收侵权行为复制品&#xff0c;软件著作权注…

Python推送消息到钉钉群(从定义钉钉机器人到开发部署测试)

一、任务需求 此次的任务需求相对简单&#xff0c;思路也很清晰。就是从生产的库中读取数据&#xff0c;定时推送到钉钉群中用以消息通知&#xff0c;整个过程可以了解到如何自定义钉钉机器人、如何在Linux环境下部署python脚本并设置定时任务。 二、自定义钉钉机器人 1. 首…

创建钉钉群聊机器人,使用Python发送消息,使用DolphinScheduler发送告警

文章目录 获取自定义机器人Webhook使用Python发送消息使用curl发送消息使用DolphinScheduler发送告警 获取自定义机器人Webhook 1.1、创建群&#xff08;然后将别人移出群聊&#xff09; 1.2、单击群设置 > 智能群助手 1.3、在机器人管理页面选择自定义机器人 1.4、输入…

钉钉群机器人开发接口

钉钉群机器人开发接口 获取自定义机器人webhook 步骤一&#xff0c;在机器人管理页面选择“自定义”机器人&#xff0c;输入机器人名字并选择要发送消息的群。如果需要的话&#xff0c;可以为机器人设置一个头像。点击“完成添加”&#xff0c;完成后会生成Hook地址&#xff0…

干货|Webhook配置钉钉/飞书机器人告警

马嘉炜 | Zabbix开源社区签约专家 SRE运维工程师&#xff0c;六年Zabbix监控系统使用经验。在Zabbix架构设计及性能优化领域有丰富的经验&#xff0c;擅长监控模板制作及Zabbix API的二次开发。 官方使用手册《Zabbix标准模板指南》译者 简介 自 Zabbix 4.4.4 版本开始&…

钉钉群聊机器人.go

来源于个人博客&#xff1a;https://agou-ops.cn 最近需要做一个钉钉群聊机器人&#xff0c;需求是&#xff1a;艾特该机器人并发送相应关键字&#xff0c;机器人会进行相应的自动回复。 通过钉钉开放平台钉钉机器人的企业自建机器人官方文档以及网络上其他语言&#xff08;Ja…

python操作钉钉机器人推送消息

群里面设置 使用关键词&#xff0c;必须要携带这个关键词才能调用这个机器人 下一步&#xff0c;这个就是操作这个钉钉机器人的接口 allure测试报告 关键词一定要写在 content字段里面 import jsonimport requestsdef dd_robot():HEADERS {"Content-Type": …

Python - 接入钉钉机器人

背景 想将 Python 爬下来的内容通知到钉钉 钉钉群聊机器人概述 所谓群聊机器人&#xff0c;指可以在群内使用的机器人&#xff0c;目前主要为 webhook 机器人和企业自建机器人两大类&#xff0c;另外通过场景群模板的方式&#xff0c;也可以预先配置好机器人并通过启用模板的方…

钉钉机器人怎么使用?钉钉机器人如何设置自动发送消息

在企业中&#xff0c;需要使用许多CRM系统&#xff0c;例如交易系统、监控报警系统等应用支撑着公司的核心业务流程&#xff1b;有时候也需要行政人事定时发送一些企业人文关怀、疫情通知等信息。通过钉钉的自定义机器人&#xff0c;可以将这些系统事件或消息自动发送至聊天群。…

开通与使用钉钉群机器人、企业微信等消息推送 [附API代码]

目录 开通方式 参考代码 使用示范 其他的 企业微信 TG Plusplus Server Server酱 开通方式 免费&#xff0c;有群就能开&#xff0c;任何用户都可开 官方文档&#xff1a;自定义机器人接入 - 钉钉开放平台 注意事项&#xff1a;用电脑版钉钉来开通&#xff0c;手机上…

前端 sentry 接入钉钉机器人

sentry 接入钉钉机器人 打开钉钉,添加机器人 此时会得到Webhook地址,记录一下,以后会用到 sentry 端设置 看看这里有木有钉钉插件,有的话开启插件,并配置这里我说一下没有的情况下,我们何如设置 这里需要填写webhook url 这个的url 需要是一个公网的地址,不可以是本地…

让服务器实时跟你报告 —— 钉钉机器人 企业微信机器人

写在前面 一入炼丹深似海&#xff0c;希望天下没有空闲的GPU 每次训练开始跑起来总是要不断看什么时候结束&#xff0c;永远副屏都要开着终端实时查看GPU占用情况 原本想着能不能服务器有空闲时给我发邮件提醒呢&#xff0c;简单搜索了一番发现了更优雅的解决方案 最终效果…