【halcon】halcon字符识别——OCR

前言

OCR(Optical Character Recongnition)光学字符识别。
halcon 的OCR,提供了几种方式,我们应该如何选择?

  1. 自动文本阅读器(find_text)
  2. 手动文本阅读器(find_text)
  3. 自己分割再识别

自动文本阅读器

只需要指定一段字符的区域,然后指定一些参数,他就能自动识别!非常标准化的流程。

read_image (Image, 'numbers_scale')
* 创建模型,注意这里自动文本阅读器,第一个参数使用auto
create_text_model_reader ('auto', 'Document_Rej.omc', TextModel)
* 设置模型参数
set_text_model_param (TextModel, 'min_char_height', 20)
* 根据设置好的模型进行识别
find_text (Image, TextModel, TextResultID)
* 获取字符分割的区域
get_text_object (Characters, TextResultID, 'all_lines')
* 获取分类结果
get_text_result (TextResultID, 'class', Class)

自动文本阅读器对应的set_text_model_param

set_text_model_param,对模型参数进行设置,用于对字符图像的分割。
OCR本质是需要将每个字符分割成单个区域,单个单个的识别的。所以分割每个字符是识别的必要的前奏。

“min_contrast”(最小对比度):字符与周围背景之间必须具有的最小对比度。
“polarity”(极性):文本与背景的对比度关系,可以是"dark_on_light"(文本比背景暗),“light_on_dark”(文本比背景亮)或"both"(两种情况都处理)。
“eliminate_border_blobs”(排除边界区域):是否排除与图像边界接触的区域。
“add_fragments”(添加片段):是否将文本中的片段(如’i’上的点)添加到分割的字符中。
“separate_touching_chars”(分离相邻字符):控制如何处理相邻字符的分割。
“min_char_height”(字符最小高度):字符的最小高度。 “max_char_height”(字符最大高度):字符的最大高度。
“min_char_width”(字符最小宽度):字符的最小宽度。 “max_char_width”(字符最大宽度):字符的最大宽度。
“min_stroke_width”(最小笔画宽度):字符的最小笔画宽度。
“max_stroke_width”(最大笔画宽度):字符的最大笔画宽度。
“return_punctuation”(返回标点符号):是否返回与文本行基线接近的小标点符号。
“return_separators”(返回分隔符):是否返回分隔符,如减号或等号。
“dot_print”(点印刷):文本中是否包含点印刷字符。
“dot_print_tight_char_spacing”(点印刷字符的字符间距是否较小)。
“dot_print_min_char_gap”(点印刷字符的最小字符间距)。
“dot_print_max_dot_gap”(点印刷字符的最大点间距)。
“text_line_structure”(文本行结构):定义文本行的结构,用于简化文本搜索。

在自动文本阅读器里,set_text_model_param 有这些参数可以帮助我们进行更精细的分割,其实大多数的值默认都是auto
所以在图片比较清晰的情况下,使用自动文本阅读器一般不用设置什么参数就能达到比较好的识别效果。
最后,自动文本阅读器通过 get_text_result 就可以拿到 识别的结果,识别的结果会放到一个字符串数组中!

手动文本阅读器

在自动文本阅读中,我们使用是:

create_text_model_reader ('auto', 'Document_Rej.omc', TextModel)

手动文本阅读器,我们使用:

create_text_model_reader ('manual', [], TextModel)

区别在于,第一次参数改传 ‘manual’ 表示手动, 第二个参数和自动文本阅读器不同,没有传OCR分类器,而是一个空的数组。这是因为手动文本阅读器,只是完成分割这个步骤,而自动分割和识别是一起完成。

手动文本阅读器对应的set_text_model_param

“manual_char_height”(字符高度):字符的高度。
“manual_char_width”(字符宽度):字符的宽度。
“manual_stroke_width”(笔画宽度):字符的笔画宽度。
“manual_base_line_tolerance”(基线容差):字符的基线最大偏差。
“manual_polarity”(极性):文本与背景的对比度关系。
“manual_uppercase_only”(仅大写字符):文本是否仅包含大写字符或数字。
“manual_is_dotprint”(点印刷):文本是否是点印刷。
“manual_is_imprinted”(印记):文本是否受到反射引起的极性变化影响。
“manual_eliminate_horizontal_lines”(排除水平线):是否排除靠近文本的较长水平结构。
“manual_max_line_num”(最大行数):要查找的最大文本行数。
“manual_return_punctuation”(返回标点符号):是否返回标点符号。
“manual_return_separators”(返回分隔符):是否返回分隔符。
“manual_add_fragments”(添加片段):是否添加片段。
“manual_fragment_size_min”(片段的最小面积):要添加的片段的最小面积。
“manual_text_line_structure”(文本行结构):定义文本行的结构,用于简化文本搜索。

可以看到,手动文本阅读器对应的set_text_model_param 设置的参数 都是已 'manual_'开头的。(使用自动文本阅读器对应的参数将会报错!)

“auto"和"manual” 模式的分割逻辑

那,不同的模式"auto"和"manual" 他们分割的逻辑有什么不一样?

  1. 自动模式 (“auto” 模式):

    • “auto” 模式是基于字符的图像特征和背景对比度来执行文本分割的。它使用一种自适应的方法来检测字符之间的边界,并将文本分割成字符。
    • 在 “auto” 模式中,你需要设置一些参数,如最小对比度 (“min_contrast”)、字符最小高度 (“min_char_height”)、字符最大高度 (“max_char_height”)、字符最小宽度 (“min_char_width”)、字符最大宽度 (“max_char_width”)、最小笔画宽度 (“min_stroke_width”)、最大笔画宽度 (“max_stroke_width”) 等,以帮助分割算法确定字符的边界。
    • “auto” 模式通常适用于较通用的文本分割任务,其中文本的字符大小和外观可能会有所变化。它对于不需要精确控制字符属性的应用场景很有用。
  2. 手动模式 (“manual” 模式):

    • “manual” 模式允许用户手动设置字符的属性,如字符高度 (“manual_char_height”)、字符宽度 (“manual_char_width”)、笔画宽度 (“manual_stroke_width”) 等。这些参数将用于文本分割。
    • 在 “manual” 模式中,用户需要更详细地描述要分割的文本的特征。这种方式通常用于特定字符或特殊文本类型的分割任务,其中字符的属性已知并且相对一致。
    • “manual” 模式可以用于处理特定的印刷风格,如点印刷字符 (“dot_print”) 或具有特定笔画宽度 (“manual_stroke_width”) 的文本。

总之,“auto” 模式是一种更自适应的文本分割方法,适用于一般性的文本分割任务,而 “manual” 模式允许用户更精确地定义字符属性,适用于特殊字符或文本类型的分割任务。选择哪种模式取决于你的具体应用需求和文本样本的特性。
一般背景比较复杂,不容易区分的,比如镭雕的字符,就更适合使用手动模式区分!

手动文本阅读器的识别过程

那,手动文本阅读器分割之后,如何完成识别呢? 分割完成之后,其实手动文本阅读器的工作就完成了,
识别的过程和手动文本阅读器已经无关了。
在自动文本阅读中,我们创建的时候就传入的分类器的类型。

create_text_model_reader ('auto', 'Document_Rej.omc', TextModel)

因为自动文本阅读器,帮我们完成了识别过程,现在我们要单独的完成识别工程:
首先,我需要读取分类器:

read_ocr_class_mlp ('Industrial_0-9A-Z_Rej.omc', OcrHandle)

halcon 为我们提供了很多类型的训练好的分类器(就是这个.omc结尾的文件),选择合适的分类器可以提高我们的识别率。
如何选择合适的分类器,我们留到后面再说。

给出完成分割和识别的代码:

*//-------------分割部分
create_text_model_reader ('manual', [], TextModel)
*//参数设置
set_text_model_param (TextModel, 'manual_polarity', 'light_on_dark')
set_text_model_param (TextModel, 'manual_char_width', 104)
set_text_model_param (TextModel, 'manual_char_height', 105)
set_text_model_param (TextModel, 'manual_stroke_width', 21)
set_text_model_param (TextModel, 'manual_return_punctuation', 'false')
set_text_model_param (TextModel, 'manual_uppercase_only', 'true')
set_text_model_param (TextModel, 'manual_fragment_size_min', 100)
set_text_model_param (TextModel, 'manual_eliminate_border_blobs', 'true')
set_text_model_param (TextModel, 'manual_base_line_tolerance', 0.2)
set_text_model_param (TextModel, 'manual_max_line_num', 1)
*//-----------------识别部分
read_ocr_class_mlp ('Industrial_0-9A-Z_Rej.omc', OcrHandle)
//* 根据设置好的模型进行识别
find_text (Image, TextModel, TextResult)//* 获取字符分割的区域。 ps:这里和自动的不同,使用的是 manual_all_lines 不是 all_lines
get_text_object (Characters, TextResult, 'manual_all_lines')
//* 获取结果
get_text_result (TextResult, 'manual_num_lines', ResultValue)
dev_display (Characters)
do_ocr_multi_class_mlp (Characters, TmpInverted, OcrHandle, SymbolNames, Confidences)

get_text_result 结果获取

注意和get_text_object 区分哈,get_text_object 是获取分割的区域,get_text_result 是获取某个结果。
在自动文本阅读器中,我们也使用了get_text_result ,直接获取的分类的结果:

* 获取分类结果
get_text_result (TextResultID, 'class', Class)

但是,如果是手动文本阅读器,你使用 get_text_result (TextResultID, ‘class’, Class),就会报错!
这是因为手动文本阅读器得到是分割的结果不是分类的结果,具体我们可以看一下get_text_result的具体介绍。
get_text_result 是一个用于查询文本分割结果的操作符。它通过查询 find_text 返回的
TextResultID 中的 ResultName 控制结果。ResultName 的可能参数值取决于在
find_text 的文本分割过程中使用的文本模型。
Mode = ‘auto’ 和 Mode = ‘manual’ 时, get_text_result 获取的时不同的结果。(下面这段可以不看,知道原因即可!)

以下首先列出了在 Mode = ‘auto’ 的文本模型中的可能参数值,然后是 Mode = ‘manual’ 的文本模型中的参数值。

可以查询以下结果:

对于 Mode = ‘auto’ 的文本模型的文本分割结果:

对于每种极性,文本行都独立从上到下、从左到右排序。文本行内的字符从左到右排序。

  • ‘num_lines’(行数):找到的行数。
  • ‘num_classes’(类别数):为每个字符存储的最佳类别数。根据所使用分类器的类别数量,这个值可能小于在文本模型中设置的值,参见 set_text_model_param
  • ‘class’(类别):所有分割字符的分类结果,使用对应文本模型中的 OCR 分类器。请注意,如果分类器使用拒绝类进行训练,get_text_result 将返回拒绝类的第二高置信度的字符的第二高结果。
  • [‘class’, n](类别 n):类似于 ‘class’,但返回第 (n+1) 高置信度的类别。例如,[‘class’, 0] 返回每个字符的最高置信度的类别。此外,与 ‘class’ 不同,如果包含在对应文本模型中的分类器使用拒绝类进行训练,可以返回拒绝类。
  • [‘class_line’, LineIndex](行内类别):指定由 LineIndex 指定的文本行内字符的分类结果,使用对应文本模型中的 OCR 分类器。例如,[‘class_line’, 0]
    返回第一行内的字符类别。请注意,如果分类器使用拒绝类进行训练,get_text_result
    将返回拒绝类的第二高置信度的字符的第二高结果。
  • [‘class_line’, LineIndex, n](行内类别 n):类似于 [‘class_line’, LineIndex],但返回第 (n+1) 高置信度的类别。例如,[‘class_line’, LineIndex, 0] 返回
    LineIndex 指定的文本行内每个字符的最高置信度的类别。此外,与 [‘class_line’, LineIndex]
    不同,如果包含在对应文本模型中的分类器使用拒绝类进行训练,可以返回拒绝类。
  • [‘class_element’, Index](字符类别):字符在位置 Index 处的分类结果,使用对应文本模型中的 OCR 分类器。例如 [‘class_element’, 0] 返回第一个字符的 ‘num_classes’ 个最佳类别(按置信度排序)。
  • ‘confidence’(置信度):返回所有分割字符的类别的置信度,参见 ‘class’。
  • [‘confidence’, n](置信度 n):返回第 (n+1) 高置信度的类别的置信度,参见 [‘class’, n]。
  • [‘confidence_line’, LineIndex](行内置信度):返回指定由 LineIndex 指定的文本行内所有字符的类别的置信度,参见 [‘class_line’, LineIndex]。
  • [‘confidence_line’, LineIndex, n](行内置信度 n):返回指定由 LineIndex 指定的文本行内所有字符的第 (n+1) 高置信度的类别的置信度,参见 [‘class_line’, LineIndex, n]。
  • [‘confidence_element’, Index](字符置信度):返回与位置 Index 的字符的类别相对应的置信度,参见 [‘class_element’, Index]。
  • ‘polarity’(极性):返回所有分割字符的极性。
  • [‘polarity_line’, LineIndex](行内极性):返回指定由 LineIndex 指定的文本行内的字符的极性。例如,[‘polarity_line’, 0] 返回第一行内的极性。
  • [‘polarity_element’, Index](字符极性):返回在位置 Index 处的字符的极性。例如 [‘polarity_char’, 0] 返回第一个字符的极性。

对于 Mode = ‘manual’ 的文本模型的文本分割结果:

  • ‘manual_num_lines’(行数):找到的行数。
  • 如果为创建 TextResultID 的文本模型激活了 ‘manual_persistence’,则可以查询以下额外的值:
  • ‘manual_thresholds’(阈值):用于分割的阈值。

请注意,这些参数允许你查询文本分割结果的各个方面,包括字符分类、置信度、极性等。根据你的应用需求,你可以选择查询适合你的结果。

也就是,在手动模式下,get_text_object 只能获取到两种结果:
‘manual_num_lines’(行数):找到的行数。
‘manual_thresholds’(阈值):用于分割的阈值。
所以在手动模式下,是无法获取到分类的结果的!

do_ocr_multi_class_mlp 分类结果的获取

那真正获取到分类结果,我需要通过函数:

do_ocr_multi_class_mlp (Characters, img, OcrHandle, SymbolNames, Confidences)

参数介绍:
1 Characters,是通过get_text_object 获取到的分割区域,
2 img 是识别的图片。
3 OcrHandle 是读取halcon提供的分类器时返回的句柄。
4 SymbolNames 就是分类的结果
5 Confidences 是每个字符对应的置信度!

这里一个问题要注意,img 这个图片必须是白底黑字的图片,你可能会说我不是已经设置过极性了啊!
set_text_model_param (TextModel, ‘manual_polarity’, ‘light_on_dark’) 已经告诉他是黑底白字啊!
不行的,因为这是分割参数,和识别无关了,识别就必须是白底黑字!
如果你的图片是’light_on_dark’,你们请使用 invert_image (Image, TmpInverted),将图片进行反转再传给
do_ocr_multi_class_mlp 进行识别!

阶段小结
通过这些参数,发现只有一个参数是来自,手动文本阅读器,就是 Characters :分割区域。
所以识别和分割时完全分开的! 我们也可以通过其他的方式,比如blob分析,图像滤波,形态学等操作获取到字符的分割区域
字符分割区域
然后直接进行识别!

另一个识别函数 do_ocr_word_mlp

函数参数解读:
函数参数解读
参数介绍:
1 Characters,是通过get_text_object 获取到的分割区域,
2 Image 是识别的图片。
3 OcrHandle 是读取halcon提供的分类器时返回的句柄。
4 Expression 预设匹配内容表达式,如:使用正则表达式
5 NumAlternatives 参数用于指定在执行 OCR 时考虑每个字符的备选类别数量。具体来说,它决定了在 do_ocr_word_mlp 操作中执行单词校正时,每个字符的备选类别数量。

do_ocr_word_mlp 无法通过原始分类结果生成与给定表达式匹配的单词时,它会考虑使用备选类别来进行校正。备选类别是按照置信度排名的备选字符分类结果。

NumAlternatives 参数控制了要考虑多少个备选类别。更具体地说,对于每个字符,DoOcrWordMlp 将考虑排名前 NumAlternatives 的备选类别。这意味着它将尝试将每个字符的分类结果更正为这些备选类别之一,以生成与表达式( Expression )匹配的单词。

6 NumCorrections 参数用于指定在执行 OCR 时最多允许的字符校正数量。具体来说,它决定了在 DoOcrWordMlp 操作中,如果生成的单词与给定的表达式不匹配,允许对多少个字符进行校正。NumCorrections 参数限制了在校正过程中允许的最大校正数量。如果 NumCorrections 设置为2,那么在校正单词时,最多允许对两个字符进行校正。

7 Class 就是分类的结果放到一个字符串数组
8 Confidences 是每个字符对应的置信度!
9 Word 字符串结果,不是数组的形式,结果的另一种展现形式
9 Score 用于衡量校正后的单词与未校正的分类结果之间的相似性。它是一个度量值,表示校正的质量,可以帮助您了解校正过程的效果。
Score 的取值范围通常在0.0到1.0之间,其中:

  • 0.0 表示未进行任何校正,校正后的单词与未校正的分类结果完全不匹配。
  • 1.0 表示校正后的单词与未校正的分类结果完全匹配,没有进行任何校正。
    Score 的计算方式通常考虑以下因素:
  • 校正的字符数量:校正了更多的字符可能会降低 Score
  • 放弃的备选类别数量:如果在校正过程中放弃了多个备选类别以使单词匹配表达式,也可能会降低 Score

从参数数量上看,do_ocr_word_mlpdo_ocr_multi_class_mlp 复杂很多。
从一个叫 word, 一个叫 multi_class 就可以看出来一些问题。do_ocr_word_mlp 是对一组相关字符进行分类的操作符。
do_ocr_multi_class_mlp 不同,do_ocr_word_mlp 将字符组视为一个实体,通过连接每个字符区域的类别名称来生成一个单词。这允许通过指定描述期望单词的表达式来在文本级别上限制允许的分类结果。

那么整个函数的关键在于参数, Expression!利用好这个参数,能帮我们提高识别的准确度!举个例子:
4orA
这个图片其实是4,但是识别过程中有时会识别成A,那此时 Expression 就能发挥作用了!

这是halcon自带的一个例子:

* Process Date Text
sort_region (CharactersDate, SortedDate, 'character', 'true', 'row')
* Classify the data string without restriction (for comparison)
do_ocr_word_mlp (SortedDate, ImageOCR, OCRHandle, '.*', 5, 5, Class, Confidence, OriginalDateText, DateScore)
* Classify the data string using a regular expression
do_ocr_word_mlp (SortedDate, ImageOCR, OCRHandle, '^([0-2][0-9]|30|31)/(0[1-9]|10|11|12)/0[0-5]$', 10, 5, Class, Confidence, DateText, DateScore)

意再对比使用正则约束和不使用正则约束的区别!
在这里插入图片描述
这个例子,表示如果使用正则 “ .* ” 的时候(就是没有约束匹配任何字符),原本的11被识别为了41,此时DataScore分数是满分1分。
如果使用正则 ‘^([0-2][0-9]|30|31)/(0[1-9]|10|11|12)/0[0-5]$’ 识别出了正确结果。此时DataScore分数是0.829分。
这就是说正则有一定的纠错能力。
但是这个是有一个前提的
正确的结果确实在识别的备选方案之中,比如这里如果1就不在halcon识别结果的备选方案中,那么正则就不会纠错,而且此时的DataScore会等于0,因为正则匹配的结果和识别的结果不一致

还需要注意的是:

do_ocr_word_mlp (SortedDate, ImageOCR, OCRHandle, '^([0-2][0-9]|30|31)/(0[1-9]|10|11|12)/0[0-5]$', 10, 5, Class, Confidence, DateText, DateScore)

Class,中输出的是没有经过纠正的字符数组,而DateText中输出的是经过正则纠正的字符串。

我遇到的一个例子
在这里插入图片描述
这个区域就被识别成了7,而我通过正则想将其纠正成1,但是根本没有作用,打分始终为0.
这其 就说明 1 根本就不在备选方案里面!(作为人的直觉1应该在备选方案啊!但是halcon识别结果里没有,我当时错还以为正则无效,其实就是不在备选方案)

do_ocr_single_class_mlp

do_ocr_multi_class_mlp 我们之前已经讲过了
do_ocr_single_class_mlp 和 do_ocr_multi_class_mlp 对比
很好理解:
do_ocr_single_class_mlp 一次识别一个区域 (一个区域对应一个字符)
do_ocr_multi_class_mlp 一次性识别多个区域(一个区域对应一个字符)

sort_region (RegionTrans, SortedRegions1, 'first_point', 'true', 'column')
for i := 1 to Number by 1select_obj (SortedRegions, ObjectSelected, i)do_ocr_single_class_mlp (ObjectSelected, Image, OCRHandle, 1, Class, Confidence)* 显示相应的识别内容在区域上方disp_message (WindowHandle, Class, 'image', MeanRow-10, Column[i-1]-10, 'red', 'true')
endfor

这里的排序,是为了识别的类容和识别的区域,在观感上是一一对应的。
有时,我们可能需要一个一个区域的处理(比如需要额外处理每个字符瑕疵),就可以使用do_ocr_single_class_mlp 。

OCR的识别过程总结

那整个OCR的识别过程就是:
1 获取到训练好的OCR识别句柄
2 将字符分割到单个的区域中
3 调用相应的方式识别。

1 获取到训练好的OCR识别句柄

我们可以通过 create_text_model_reader ('auto', 'Document_Rej.omc', OCRHandle)的方式获取到(这是自动阅读器的方式)
或者直接通过函数read_ocr_class_mlp 读取:read_ocr_class_mlp ('DotPrint_0-9A-Z_NoRej.omc', OCRHandle)

2 将字符分割到单个的区域中

一是,通过使用create_text_model_reader ('manual', [], TextModel) 得到一个分割的句柄,设置相应的参数,对字符图片进行的自动分割。
二是,通过blob分析,图像滤波,形态学操作,对字符图片进行分割。
分割,其实是整个OCR识别的关键!

3 调用相应的方式识别

目前介绍了三种方式:

  1. do_ocr_multi_class_mlp
  2. do_ocr_single_class_mlp
  3. do_ocr_word_mlp

使用心得总结

手动文本阅读器和自动文本阅读器的好处在于,可以将识别的过程标准化,我们只需要配置一些参数就OK了。
但是会有一些限制:
1 要求图片比较清晰
2 子母大小间隔都差不多,最好不含有一些特殊字符。
在这里插入图片描述![在这里插入图片描述]
在这里插入图片描述
比如这里,就把3-识别成了X。(就是因为两个区域没分开导致的)
还有,这里两个A挨得很近,图像处理的时候,要注意得到的区域是否将其分割成了两个区域。
如果区域连接到了一起,注意要调整参数了

我使用下来的感觉是:自己通过blob分析,图像滤波,形态学操作,对字符图片进行分割。然后使用
支持正则的do_ocr_word_mlp进行识别,我愿称之为最强组合。普适性还是更好,识别更为准确,适合更为苛刻的识别需求。

预训练字符库的选择

预训练字符库就是.omc的文件,可以在安装HALCON的文件夹的子目录ocr中访问它们。预训练字体是使用在亮背景下的暗字符进行训练的。这就是为啥

  • do_ocr_multi_class_mlp
  • do_ocr_single_class_mlp
  • do_ocr_word_mlp
    都需图片输入必须是白底黑字的原因。

NoRej和 Rej

所有预训练的OCR字体都有两个版本。以_NoRej结尾的字体名称具有正则化权重但没有拒绝类,以_Rej结尾的字体名称具有正则化权重及拒绝类。由于正则化,预训练的OCR字体提供了更有意义的置信度。使用拒绝类的字体,可以区分字符与杂乱背景。带有拒绝类的字体返回ASCII Code 26。

如果出现:字符串包含数字 “\032”(也可以显示为 “\0x1A”),表示该区域已分类为拒绝类,也就是表示不判断了,拒绝给出判断。

OCR字体的命名法

  • 0-9:OCR字体包含数字0到9。
  • A-Z:OCR字体包含大写字符A到Z.
  • +:OCR字体包含特殊字符。特殊字符列表与单个OCR字体略有不同。
  • _NoRej:OCR字体没有拒绝类。
  • _Rej:OCR字体有拒绝类。

以下列出,halcon所有的预训练字符库

"Document_A-Z+_Rej.omc",
"Document_NoRej.omc",
"Document_Rej.omc",
"DotPrint_0-9_NoRej.omc",
"DotPrint_0-9_Rej.omc",
"DotPrint_0-9+_NoRej.omc",
"DotPrint_0-9+_Rej.omc",
"DotPrint_0-9A-Z_NoRej.omc",
"DotPrint_0-9A-Z_Rej.omc",
"DotPrint_A-Z+_NoRej.omc",
"DotPrint_A-Z+_Rej.omc",
"DotPrint_NoRej.omc",
"DotPrint_Rej.omc",
"HandWritten_0-9_NoRej.omc",
"HandWritten_0-9_Rej.omc",
"Industrial_0-9_NoRej.omc",
"Industrial_0-9_Rej.omc",
"Industrial_0-9+_NoRej.omc",
"Industrial_0-9+_Rej.omc",
"Industrial_0-9A-Z_NoRej.omc",
"Industrial_0-9A-Z_Rej.omc",
"Industrial_A-Z+_NoRej.omc",
"Industrial_A-Z+_Rej.omc",
"Industrial_NoRej.omc",
"Industrial_Rej.omc",
"OCRA_0-9_NoRej.omc",
"OCRA_0-9_Rej.omc",
"OCRA_0-9A-Z_NoRej.omc",
"OCRA_0-9A-Z_Rej.omc",
"OCRA_A-Z+_NoRej.omc",
"OCRA_A-Z+_Rej.omc",
"OCRA_NoRej.omc",
"OCRA_Rej.omc",
"OCRB_0-9_NoRej.omc",
"OCRB_0-9_Rej.omc",
"OCRB_0-9A-Z_NoRej.omc",
"OCRB_0-9A-Z_Rej.omc",
"OCRB_A-Z+_NoRej.omc",
"OCRB_A-Z+_Rej.omc",
"OCRB_NoRej.omc",
"OCRB_passport_NoRej.omc",
"OCRB_passport_Rej.omc",
"OCRB_Rej.omc",
"Pharma_0-9_NoRej.omc",
"Pharma_0-9_Rej.omc"

Document

’Document’可用于读取以Arial,Courier或Times New Roman等字体打印的字符。这些是用于打印文档或字母的典型字体。请注意,无法区分字体Arial的字符I和l。这意味着l可能被误认为是I,反之亦然。
可用的特殊字符:- = + < > . # $ % & ( ) @ * e £ ¥

DotPrint

有的点式打印机还有喷墨机,打印出的效果,字符是小点组成。它不包含小写字符。
可用的特殊字符:- / . * :
字符是小点组成

Industrial

‘Industrial’可用于读取以Arial,OCR-B或其他sans-serif字体等打印的字符。例如,这些字体通常用于打印标签。
可用的特殊字符:- / + . $ % * e £

Industrial翻译为工业,我发现这个字符集,在识别I这个子母的时候更加准确

但是,貌似并不能识别到横杠。(可能是我使用了字符和数字的库,如果是单个数字库,也许就能识别了"Industrial_0-9+_Rej.omc" 因为如果是字符和数字的库,就没有带+号的了, 后续有空再求证吧!)
在这里插入图片描述

HandWritten

顾名思义,这个就是识别手写的字符,目前仅仅支持数字的手写。
在这里插入图片描述

OCR-A

‘OCR-A’可用于读取以字体OCR-A打印的字符。
可用的特殊字符: - ? ! / {} = + < > . # $ % & ( ) @ * e £ ¥
在这里插入图片描述

OCR-B

‘OCR-B’可用于读取以字体OCR-B打印的字符。

可用的特殊字符:- ? ! / {} = + < > . # $ % & ( ) @ * e £ ¥
在这里插入图片描述

Pharma

‘Pharma’可用于读取以Arial,OCR-B等字体打印的字符,以及制药行业通常使用的其它字体(见图18.18)。此OCR字体不包含小写字符。
在这里插入图片描述

SEMI

‘SEMI’可用于读取以SEMI字体打印的字符,该字体由易于彼此区分的字符组成。它有一组有限的字符,可以在图18.19中看到。此OCR字体不包含小写字符。
可用的特殊字符: - .
在这里插入图片描述

Universal

‘Universal’可用于读取各种不同的字符。这种基于CNN训练的字体的基于 ‘’Document’,“DotPrint”,“SEMI”和“Industrial’”等字符。
可用的特殊字符:- / = + : < > . # $ % & ( ) @ * e £ ¥
在这里插入图片描述

如果这些预训练的字符库都无法解决你现有的识别问题,那么你就需要训练自己的字符库了!关注一波我们下一篇见

参考文章

预训练字符库的选择主要参考Mr.Devin的文章:
https://blog.csdn.net/IntegralforLove/article/details/83756956
Mr.Devin 真乃神人也~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/129164.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android USB电源管理

The USB peripheral detects the lack of 3 consecutive SOF packets as a suspend request from the USB host. 1 驱动shutdown顺序 系统关机或重启的过程中&#xff0c;会调用设备驱动的shutdown函数来完成设备的关闭操作&#xff0c;有需要的设备可以在驱动中定义该函数。其…

Python一行命令搭建HTTP服务器并外网访问 - 内网穿透

文章目录 1.前言2.本地http服务器搭建2.1.Python的安装和设置2.2.Python服务器设置和测试 3.cpolar的安装和注册3.1 Cpolar云端设置3.2 Cpolar本地设置 4.公网访问测试5.结语 1.前言 Python作为热度比较高的编程语言&#xff0c;其语法简单且语句清晰&#xff0c;而且python有…

射频功率放大器的指标有哪些内容

射频功率放大器是射频系统中至关重要的组件&#xff0c;用于放大射频信号的功率。本文将详细介绍射频功率放大器的指标&#xff0c;包括功率增益、带宽、线性度、效率、稳定性等关键指标。 一、功率增益 功率增益是射频功率放大器最基本的指标之一&#xff0c;表示放大器将输入…

taro h5 点击页面任意地方关闭弹窗组件 --- findDOMNode 判断点击节点是否属于某个组件

场景&#xff1a;如图&#xff0c;弹窗在大组件中&#xff0c;点击小组件显示弹窗&#xff0c;要求点击除弹窗外的任何元素都能关闭弹窗并且能执行元素原有的逻辑 方法一 最简单的是弹窗背后有一个覆盖整个页面的透明的cover, 点击直接关闭&#xff0c;但是这样虽然点击页面…

Spring最佳实践: 构建高效可维护的Java应用程序

&#x1f337;&#x1f341; 博主猫头虎&#xff08;&#x1f405;&#x1f43e;&#xff09;带您 Go to New World✨&#x1f341; &#x1f984; 博客首页——&#x1f405;&#x1f43e;猫头虎的博客&#x1f390; &#x1f433; 《面试题大全专栏》 &#x1f995; 文章图文…

【docker】私有仓库搭建

Docker 私有仓库搭建 在 Docker 中&#xff0c;当我们执行 docker pull xxx 的时候 &#xff0c;它实际上是从 registry.hub.docker.com 这个地址去查找&#xff0c;这就是Docker公司为我们提供的公共仓库。在工作中&#xff0c;我们不可能把企业项目push到公有仓库进行管理。…

试图替代 Python 的下一代AI编程语言:Mojo

文章目录 为什么叫 Mojo &#xff1f;Python 家族的一员&#xff0c;MojoPython 的好处&#xff1a;Python 兼容性Python 的问题移动和服务器部署&#xff1a;Python 子集和其他类似 Python 的语言&#xff1a; Mojo 是一种创新的编程语言&#xff0c;结合了 Python 的可用性和…

浅谈redis未授权漏洞

redis未授权漏洞 利用条件 版本比较高的redis需要修改redis的配置文件&#xff0c;将bind前面#注释符去掉&#xff0c;将protected-mode 后面改为no 写入webshell config get dir #查看redis数据库路径 config set dir web路径# #修改靶机Redis数据库路径 config set dbfilen…

基于SSM的人事管理信息系统

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

【笔试强训选择题】Day39.习题(错题)解析

作者简介&#xff1a;大家好&#xff0c;我是未央&#xff1b; 博客首页&#xff1a;未央.303 系列专栏&#xff1a;笔试强训选择题 每日一句&#xff1a;人的一生&#xff0c;可以有所作为的时机只有一次&#xff0c;那就是现在&#xff01;&#xff01;&#xff01;&#xff…

数据集笔记 geolife (操作篇)

数据集介绍可看&#xff1a;数据集笔记:GeoLife GPS 数据 &#xff08;user guide&#xff09;_UQI-LIUWJ的博客-CSDN博客 1 读取数据 import os os.chdir(D:/Geolife Trajectories 1.3/Geolife Trajectories 1.3/Data/000/Trajectory)import pandas as pd data pd.read_csv(…

基于AHP模型指标权重分析python整理

一 背景介绍 日常会有很多定量分析的场景&#xff0c;然而也会有一些定性分析的场景针对定性分析的场景&#xff0c;预测者只能通过主观判断分析能力来推断事物的性质和发展趋势然而针对个人的直觉和虽然能够有一定的协助判断效果&#xff0c;但是很难量化到指标做后期的复用 …

windows服务器自带IIS搭建网站并发布公网访问【内网穿透】

文章目录 1.前言2.Windows网页设置2.1 Windows IIS功能设置2.2 IIS网页访问测试 3. Cpolar内网穿透3.1 下载安装Cpolar3.2 Cpolar云端设置3.3 Cpolar本地设置 4.公网访问测试5.结语 1.前言 在网上各种教程和介绍中&#xff0c;搭建网页都会借助各种软件的帮助&#xff0c;比如…

自动计算比例 计算属性 computed @input=“rate“

<el-col :span"12"><el-form-item label"当年累计实收租金:" prop"cumulativeRent"><el-inputv-model"createForm.cumulativeRent"input"rate"clearable:disabled"value 2"><template slot…

Gin项目实战

Gin项目实战 Gin博客项目-项目架构Gin博客项目-集成gormGin博客项目-集成Bootstrap创建用户表单Gin 博客项目-实现控制器和路由Gin 博客项目-设计静态页面Gin 博客项目-用户注册Gin 博客项目-用户登录Gin 博客项目-集成markdown编辑器Gin 博客项目-创建博客模型和DAOGin 博客项…

深入解析OLED透明屏的工作原理与优势,智能家居的未来之选

OLED透明屏作为一项突破性的显示技术&#xff0c;不仅具备出色的视觉效果&#xff0c;还带来了全新的功能和应用。 在这篇文章中&#xff0c;尼伽将深入探讨OLED透明屏的功能特点&#xff0c;介绍其在各个领域的广泛应用&#xff0c;并提供实用的案例和数据&#xff0c;希望看…

修复 ChatGPT 发生错误的问题

目录 ChatGPT 发生错误&#xff1f;请参阅如何修复连接错误&#xff01; 修复 ChatGPT 发生错误的问题 基本故障排除技巧 检查 ChatGPT 的服务器状态 检查 API 限制 检查输入格式 清除浏览数据 香港DSE是什么&#xff1f; 台湾指考是什么&#xff1f; 王湘浩 生平 …

upload-labs/Pass-07 未知后缀名解析漏洞复现

upload-labs/Pass-07 漏洞复现 页面&#xff1a; 我们看到有一个图片上传功能。 我们上传一个png文件发现能够成功上传&#xff0c;那其他文件呢&#xff0c;如php文件。 我们看一下是否能上传一个php文件&#xff1a; php文件内容&#xff1a; <?phpeval($_REQUEST[]…

MinIO集群模式信息泄露漏洞(CVE-2023-28432)

前言&#xff1a;MinIO是一个用Golang开发的基于Apache License v2.0开源协议的对象存储服务。虽然轻量&#xff0c;却拥有着不错的性能。它兼容亚马逊S3云存储服务接口&#xff0c;非常适合于存储大容量非结构化的数据。该漏洞会在前台泄露用户的账户和密码。 0x00 环境配置 …

《向量数据库》——都有哪些向量数据库,都有什么特点?

随着大数据和机器学习应用的崛起,对于存储和查询高维度向量数据的需求也逐渐增加。在这个背景下,向量数据库和传统的关系型数据库开始在不同的数据世界中崭露头角,它们分别以各自独特的方式解决了不同类型数据的存储和查询需求。本文将探讨向量数据库和关系型数据库之间的区…