【爬虫】8.1. 深度使用tesseract-OCR技术识别图形验证码

深度使用tesseract-OCR技术识别图形验证码

文章目录

  • 深度使用tesseract-OCR技术识别图形验证码
    • 1. OCR技术
    • 2. 准备工作
    • 3. 简单作用了解
      • 3.1. 验证码图片爬取-screenshot_as_png
      • 3.2. 识别测试-image_to_string
        • 3.2.1. 正确识别
        • 3.2.2. 错误识别
        • 3.2.3. 灰度调节
      • 3.3. 识别实战-使用image_to_string对象
    • 4. pytesseract库介绍
    • 5. image_to_string
    • 6. image_to_boxes
    • 7. image_to_data
    • 8. 参考博客

前言:本片文章是基于我之前发的一篇文章《【爬虫】8.1. 使用OCR技术识别图形验证码》而写的,链接为:
【爬虫】8.1. 使用OCR技术识别图形验证码,前面这篇文章比较基础。入门了tesseract-OCR技术之后对它比较感兴趣,故继续深度学习以下。为了衔接比较好,故本篇文章前面讲到的会和前面一篇文章有一些重复。

突然发现一个问题,csdn的图片有水印…不管了,凑合看吧,但是代码运行就要自己找图片了

1. OCR技术

OCR,即Optical Character Recognition,中文叫做光学字符识别,是指使用电子设备(例如扫描仪和数码相机)检查打印再纸上的字符,通过检查暗、亮的模式确定字符形状,然后使用字符识别方法将形状转化位计算机文字。现在OCR技术已经广泛应用于生产活动中,如文档识别,证件识别,字幕识别,文档搜索等。当然用来识别本节所述的图形验证码也没有问题。

2. 准备工作

我用的库是pytesseract,有的人用的是tesserocr,其实两者感觉差别不大:

  • 打开tesseract下载的网页 tesseract,下载最后一个(应该是)tesseract-ocr-w64-setup-v5.3.0.2.221214这个版本,接着就是安装,安装过程中自己记好自己安装在哪里!!!然后就是选择语言包,建议不要全选会下载很慢。
  • 将你记下来的安装路径的整个文件地址给添加到环境变量中去。
  • 接着python安装pytesseract,找到pytesseract.py文件,打开并找到tesseract_cmd这个变量(大约在30行左右)将里面的值修改为tesseract.exe文件的地址(这个文件在你一开始记下的文件地址里面,查找文件夹就找到了,不用进其他的文件夹,注意转义字符)。
  • 搞定上述之后在cmd窗口运行tesseract --list-langs可以看到你下载的语言包。
  • 重启,然后运行你的示例代码就行了,如果还不可以,那你去看其他下载教程。

以下是一篇在Ubuntu18.04安装Tesseract库的博客,需要的请跳转:
开源OCR识别库-tesseract介绍-平凡的编程者-博客园(cnblogs.com)

3. 简单作用了解

先简单了解下有啥用吧。

3.1. 验证码图片爬取-screenshot_as_png

这个网页使用JavaScript渲染出来的,我们进行爬取的时候使用selenium自动化测试工具。

from selenium import webdriver
from selenium.webdriver.common.by import By
from PIL import Image
from io import BytesIO
import timedef demo():browser = webdriver.Chrome()browser.get("https://captcha7.scrape.center")time.sleep(3)captcha = browser.find_element(By.CSS_SELECTOR,"#captcha")image = Image.open(BytesIO(captcha.screenshot_as_png))image.show()if __name__ == "__main__":demo()

这里使用了我很少见的BytesIO,这是一个类,它的功能是读取二进制数据流,而图片就是二进制数据流;还有就是captcha.screenshot_as_png这部分的功能就是将当前页面的内容捕获为一张图像,以bytes二进制数据保存;最后调用image的show方法来显式验证码的图像。

3.2. 识别测试-image_to_string

本小节的验证码案例网站为https://captcha7.scrape.center,使用的是image_to_string,当然还有其他的,等会再说。

3.2.1. 正确识别

首先我们选用两张图片来进行测试,第一张是有换行和明显空格,第二张是一张验证码。

在这里插入图片描述

在这里插入图片描述

我们运行下面代码:

import pytesseract
from PIL import Image
image1 = Image.open("tesseract_tt1.png")
result1 = pytesseract.image_to_string(image1)
image2 = Image.open("tesseract_tt2.png")
result2 = pytesseract.image_to_string(image2)
print(result1, end= '')
print("=========")
print(result2, end= '')
Demons
Lin
Ss ZzTU
=========
2034

我们可以看到在输出SZTU这部分时候出现了SsZz这样大小写都输出的情况,这是因为pytesseract库在识别大小写字母时候很难准确识别出大小写,你可以采取其他办法来执行,这里就不列出来。

3.2.2. 错误识别

我选取到了一张图片,如下所示:
在这里插入图片描述

import pytesseract
from PIL import Image
image = Image.open("error.png")
result = pytesseract.image_to_string(image)
print(result, end= '')
04-8 d.

可以看到这个输出结果明显不是我们想要的,这是因为OCR识别技术是通过检查暗、亮的模式确定字符形状,不是我们想当然的用脑子来看。所以,我们需要做一些额外处理,把干扰信息去掉,我们观察发现,图片里哪些造成干扰的点,其颜色大多比文本的颜色更浅,因此可以通过颜色将干扰点去掉。首先将保存的图片转化为数组,看一下维度:

from PIL import Image
import numpy as np
image = Image.open("error.png")
print(np.array(image).shape)
print(image.mode)
(38, 112, 4)
RGBA

从结果上可以看出,这个图片其实是一个三维数组,38和112代表图片的高和宽,4则是每个像素点的表示向量,那为什么是4呢?因为最后一维是一个长度为4的数组分别表示R(红)G(绿)B(蓝)A(透明度),即一个像素点由4个数字表示。那为什么是RGBA而不是RGB或者其他的呢?因为image.mode是RGBA,即由透明通道的真彩色。

mode属性定义了图片的类型和像素的位宽,一共由9种类型:

  • 1:像素用1位表示,Python中表示为True或False,即二值化。
  • L:像素用8位表示,取值位0-255,表示灰度图像,数字越小,颜色越黑。
  • P:像素用8位表示,即调色板数据。
  • RGB:像素用3X8位表示,即真彩色。
  • RGBA:像素用4X8位标识,即有透明通道的真彩色。
  • CMYK:像素用4X8位表示,即印刷四色模式。
  • YCbCr:像素用3X8位表示,即彩色视频格式。
  • I:像素用32位整型表示。
  • F:像素用32位浮点型表示。

3.2.3. 灰度调节

让识别更加准确,可以把RGBA转化位更简单的L,即把图片转化位灰度图像。往图片对象的convert方法中传入L即可,代码如下表示:

image = image.convert('L')
image.show()

我们选择把图片转化位灰度图像,然后根据阈值删除图片上的干扰点,成功识别出验证码,也可以调用image的show方法来查看图像,代码如下:

from PIL import Image
import numpy as npimage = Image.open("error.png")
image = image.convert('L')
threshold = 90
array = np.array(image)
array = np.where(array> threshold, 255, 0)
image = Image.fromarray((array.astype('uint8')))
# image.show()
result = pytesseract.image_to_string(image)
print(result)

这里先将变量threshold赋值位50.它代表灰度的阈值。接着将图片转化位Numpy数组,利用Numpy的where方法对数组进行筛选和处理,其中将灰度大于阈值的图片的像素设置为255表示白色,否则为0,表示黑色。Image.fromarray((array.astype(‘uint8’))) 是使用PIL(Python Imaging Library)库将numpy数组转换为图像。

3.3. 识别实战-使用image_to_string对象

看懂就行了,识别可能不太准确。

import time
import re
import pytesseract
from selenium import webdriver
from io import BytesIO
from PIL import Image
from retrying import retry
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
import numpy as npdef preprocess(image):image = image.convert('L')array = np.array(image)array = np.where(array > 105, 255, 0)image = Image.fromarray(array.astype('uint8'))return image@retry(stop_max_attempt_number=10, retry_on_result=lambda x: x is False)
def login():browser.get('https://captcha7.scrape.center/')browser.find_element(By.CSS_SELECTOR, '.username input[type="text"]').send_keys('admin')browser.find_element(By.CSS_SELECTOR, '.password input[type="password"]').send_keys('admin')captcha = browser.find_element(By.CSS_SELECTOR,'#captcha')image = Image.open(BytesIO(captcha.screenshot_as_png))image = preprocess(image)image.show()captcha = pytesseract.image_to_string(image)print(captcha)captcha = re.sub('[^A-Za-z0-9]', '', captcha)browser.find_element(By.CSS_SELECTOR, '.captcha input[type="text"]').send_keys(captcha)browser.find_element(By.CSS_SELECTOR, '.login').click()try:WebDriverWait(browser, 10).until(EC.presence_of_element_located((By.XPATH, '//h2[contains(., "登录成功")]')))time.sleep(5)browser.close()return Trueexcept TimeoutException:return Falseif __name__ == '__main__':browser = webdriver.Chrome()login()

4. pytesseract库介绍

pytesseract提供了以下14个识别的api,可以满足大多数用户的需求,基本用到的有image_to_string,image_to_boxes,image_to_data,下面是它的14个api:

from pytesseract import ALTONotSupported  # 用于表示ALTO XML格式不受支持的错误
from pytesseract import get_languages  # 输出识别出文字的语言
from pytesseract import get_tesseract_version  # 获取安装的Tesseract OCR引擎的版本信息
from pytesseract import image_to_alto_xml  # 将图像识别结果输出为ALTO XML格式的文档,该格式通常用于文档数字化和文本识别
from pytesseract import image_to_boxes  # 将图像中的文字识别为边界框(box),并返回它们的坐标信息
from pytesseract import image_to_data  # 将图像中的文字识别并返回详细的数据,包括文本、坐标、置信度等信息
from pytesseract import image_to_osd  # 识别图像中的文字方向和脚本信息,以确定文本的定位和方向
from pytesseract import image_to_pdf_or_hocr  # 将图像中的文字识别并将结果输出为PDF或HOCR(HTML OCR)格式的文档
from pytesseract import image_to_string  # 将图像中的文字识别为字符串,并返回识别的文本内容
from pytesseract import Output  # 这是一个常量,用于指定返回识别结果的格式,例如文本、字典、数据等
from pytesseract import run_and_get_output  # 执行Tesseract OCR引擎并获取其输出,可以用于高级定制和控制
from pytesseract import TesseractError  # 用于表示Tesseract OCR引擎的错误
from pytesseract import TesseractNotFoundError  # 用于表示未找到Tesseract OCR引擎的错误
from pytesseract import TSVNotSupported  # 用于表示TSV(制表符分隔值)格式不受支持的错误__version__ = '0.3.10'

以下内容使用的图片均为上面使用过的!!!!!!

5. image_to_string

从名字上来看是将图片转化为字符串格式,先来看看它的用法,再来说说它的其他参数:

import pytesseract
from PIL import Image
image1 = Image.open("tesseract_tt1.png")
result1 = pytesseract.image_to_string(image1)
print(result1, end= '')

以下是它的其他常见的可选参数:

  • lang:指定要用于识别的语言,默认为英语。
  • config:允许你传递tesseract配置参数,以微调识别过程,这可以包括有关字体、分辨率以及其他识别参数的设置,配置参数通常以键值对的形式传递。
    • –dpi:设置图像的分辨率(每英寸点数)。这可以用于提高对低分辨率图像的识别效果。
    • –c tessedit_char_whitelist:允许您指定要识别的字符白名单。例如,–c tessedit_char_whitelist=0123456789可以限制识别的字符集为数字。

以下是使用cv2和pytesseract

import cv2 
import pytesseract
img = cv2.imread('tesseract_tt1.png')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
string = pytesseract.image_to_string(img)
print(string)
print (type(string))

6. image_to_boxes

image_to_boxes 是 pytesseract 库中的一个函数,用于将图像中的文字识别为边界框(box),并返回它们的坐标信息。每个边界框包含了单个字符的位置和大小。这对于进行文本布局分析和文本识别后的后续处理非常有用。

函数签名

image_to_boxes(image, lang=None, config='', output_type=pytesseract.Output.STRING)

参数说明

  • image:要识别的图像,通常是一个 PIL 图像对象。
  • lang:可选参数,指定要用于识别的语言。
  • config:可选参数,用于配置 Tesseract 的识别参数。
  • output_type:可选参数,指定返回结果的格式,默认为字符串。

返回值

  • 如果 output_type 设置为 pytesseract.Output.STRING(默认值),则返回一个包含边界框信息的字符串,每行一个边界框,每行的格式为:<字符> <x坐标> <y坐标> <右边界x坐标> <下边界y坐标> <页>

模板代码

from pytesseract import image_to_boxes
from PIL import Image
image = Image.open('tesseract_tt2.png')# 使用 image_to_boxes 函数进行文字识别并获取边界框信息
boxes = image_to_boxes(image)
# 打印边界框信息
for box in boxes.splitlines():b = box.split()char, x, y, x2, y2, page = b[0], int(b[1]), int(b[2]), int(b[3]), int(b[4]), int(b[5])print(f"字符: {char}, 位置: 左上({x},{y}), 右下({x2},{y2}), 页: {page}")

上述示例代码演示了如何使用 image_to_boxes 函数进行文字识别,并打印出识别的文本字符以及它们的位置信息。每个边界框包括字符、左上角坐标、右下角坐标和所在页。以下是输出结果:

字符: 2, 位置: 左上(13,4), 右下(34,27), 页: 0
字符: 0, 位置: 左上(45,12), 右下(55,27), 页: 0
字符: 3, 位置: 左上(64,10), 右下(78,38), 页: 0
字符: 4, 位置: 左上(90,16), 右下(102,34), 页: 0

知道这些信息我们可以做以下事情,对于这些我就没兴趣了:

  1. 文本高亮或标记:您可以使用字符的左上角和右下角坐标信息来在原始图像上绘制矩形框,从而高亮或标记文本字符。这对于可视化识别结果或提供反馈非常有用。

  2. 文本提取:通过比较字符的所在页信息,您可以将识别的文本分成不同的页面或段落。这对于处理多页文档或大型文本文件很有帮助。

  3. 文本布局分析:通过分析字符的相对位置和页码信息,您可以推断文本的布局结构,例如确定标题、段落、表格或列表的位置。这有助于自动化文档处理。

  4. 字符级别编辑:您可以根据字符的坐标信息,进行字符级别的编辑或纠正。例如,您可以检测到字符位置偏差较大的情况,并尝试进行自动校正。

  5. 文本重排:如果需要将文本重新排列成特定格式,可以使用字符的坐标信息将它们按照所在页和位置进行排序和排列。

  6. 自动分析文本流:通过字符的相对位置和页码信息,您可以自动分析文本流,例如确定文本的阅读顺序或制定自动化文档处理规则。

7. image_to_data

以下内容是参考这一篇博文:pytesseract image_to_data检测并定位图片中的文字 - LiveZingy

image_to_data 是 pytesseract 库中的一个函数,用于将图像中的文字识别并返回详细的数据,包括文本、坐标、置信度等信息。

函数签名

image_to_data(image, lang=None, config='', output_type=pytesseract.Output.DICT, nice=0)

参数说明

  • image:要识别的图像,通常是一个 PIL 图像对象。
  • lang:可选参数,指定要用于识别的语言。
  • config:可选参数,用于配置 Tesseract 的识别参数。
  • output_type:可选参数,指定返回结果的格式,默认为字典(pytesseract.Output.DICT)。
  • nice:可选参数,设置 Tesseract 进程的优先级,默认为 0。

返回值

  • 根据 output_type 参数的不同,image_to_data 函数返回不同的对象。常见的 output_type 包括字典、字符串、或数据对象。

如果 output_type 设置为 pytesseract.Output.DICT,则返回一个包含详细信息的字典,其中包括以下参数:

  • 'level':文本块的级别(例如,字、词、文本行等)。
  • 'page_num':文本块所在的页码。
  • 'block_num':文本块的编号。
  • 'par_num':段落编号。
  • 'line_num':文本行编号。
  • 'word_num':单词编号。
  • 'left''top''width''height':文本块的位置和尺寸信息。
  • 'conf':识别置信度。
  • 'text':识别的文本内容。

以下是一个示例代码,演示如何使用 image_to_data 函数并理解其返回的对象:

import pytesseract
from PIL import Image# 打开图像文件
image = Image.open('tesseract_tt2.png')# 使用 image_to_data 函数进行文字识别并获取详细信息
data = pytesseract.image_to_data(image, output_type=pytesseract.Output.DICT)print(data)
# 打印详细信息
for i, (word, left, top, width, height, conf) in enumerate(zip(data['text'], data['left'], data['top'], data['width'], data['height'], data['conf'])):if i > 0:  # 第一行通常包含表头信息,可以跳过print(f"文本: {word}, 位置: 左上({left},{top}), 宽度: {width}, 高度: {height}, 置信度: {conf}")
{'level': [1, 2, 3, 4, 5], 'page_num': [1, 1, 1, 1, 1], 'block_num': [0, 1, 1, 1, 1], 'par_num': [0, 0, 1, 1, 1], 'line_num': [0, 0, 0, 1, 1], 'word_num': [0, 0, 0, 0, 1], 'left': [0, 13, 13, 13, 13], 'top': [0, 0, 0, 0, 0], 'width': [112, 89, 89, 89, 89], 'height': [38, 34, 34, 34, 34], 'conf': [-1, -1, -1, -1, 60], 'text': ['', '', '', '', '2034']}
文本: , 位置: 左上(13,0), 宽度: 89, 高度: 34, 置信度: -1
文本: , 位置: 左上(13,0), 宽度: 89, 高度: 34, 置信度: -1
文本: , 位置: 左上(13,0), 宽度: 89, 高度: 34, 置信度: -1
文本: 2034, 位置: 左上(13,0), 宽度: 89, 高度: 34, 置信度: 60

根据 image_to_data 的输出结果,以下是各个参数的知识点解释:

  1. 'level':文本块的级别。这表示文本的层次结构,例如,1 表示文本块级别,2 表示词级别,以此类推。

  2. 'page_num':文本块所在的页码。在单一图像中识别文本时,通常为 1。

  3. 'block_num':文本块的编号。文本块是文本的更大单元,通常表示一个文本块包含多个词或多个文本行。

  4. 'par_num':段落编号。这表示文本块所属的段落编号。

  5. 'line_num':文本行编号。表示文本块所在的文本行编号,通常在段落内。

  6. 'word_num':单词编号。表示文本块内的单词编号,通常在文本行内。

  7. 'left''top''width''height':文本块的位置和尺寸信息。'left''top' 表示文本块的左上角坐标,'width''height' 表示文本块的宽度和高度。

  8. 'conf':识别置信度。表示 Tesseract 对文本块的识别置信度,通常是一个分数,值越高表示置信度越高。

  9. 'text':识别的文本内容。这是文本块中识别出的具体文本,通常包含单词或字符的文本内容。

在这个示例中,有多个文本块级别的信息。最后一条记录中的 'text' 包含了识别的文本内容(‘2034’),而前面的记录中 'text' 为空字符串,这可能表示Tesseract对这些文本块没有成功识别。并且你也可以根据置信度选取最好的结果,当然这个结果不一定是正确的。

8. 参考博客

开源OCR识别库-tesseract介绍-平凡的编程者-博客园(cnblogs.com)

【爬虫】8.1. 使用OCR技术识别图形验证码

借助Tesseract-OCR进行文本检测(1)

借助Tesseract-OCR进行文本检测(2)

pytesseract image_to_data检测并定位图片中的文字 - LiveZingy

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/130838.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Trinitycore学习之在vscode查看远端服务器上源码配置

1&#xff1a;安装vscode&#xff0c;去官网下载&#xff0c;这里下载windows版本安装包 .zip https://code.visualstudio.com/Download 2&#xff1a;安装后&#xff0c;安装扩展chinese&#xff0c;使用中文设置&#xff0c;需要重启vscode。 3&#xff1a;安装ssh相关插件…

Jmeter系列进阶-获取图片验证码(4)

安装工具 通过ocrserver工具识别图片验证码&#xff0c;解压后 .exe双击启动即可。 jmeter中使用 &#xff08;1&#xff09;HTTP请求获取验证码 &#xff08;2&#xff09;在获取验证码图片的接口下面添加监听器》保存响应到文件&#xff1b;如下图&#xff1a; &#x…

stu01-IDEA怎么创建一个HTML项目

1.打开idea&#xff0c;依次点击file→new→project 2.点击Java&#xff0c;选择你的jdk&#xff0c;没有下载的点击“Download JDK”/已经下载有JDK但在这里没显示的→点击“Add JDK”&#xff0c;选择你安装的JDK的路径&#xff0c;然后next 3.next 4.起好名字&#xff0c;我…

Python基于Flask的高校舆情分析,舆情监控可视化系统

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝30W,Csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 运行效果图 基于Python的微博大数据舆情分析&#xff0c;舆论情感分析可视化系统 系统介绍 微博舆情分析系…

线性回归方程

性回归是利用数理统计中的回归分析来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法&#xff0c;是变量间的相关关系中最重要的一部分&#xff0c;主要考查概率与统计知识&#xff0c;考察学生的阅读能力、数据处理能力及运算能力&#xff0c;题目难度中等&…

基于 Flink CDC 高效构建入湖通道

本文整理自阿里云 Flink 数据通道负责人、Flink CDC 开源社区负责人&#xff0c; Apache Flink PMC Member & Committer 徐榜江&#xff08;雪尽&#xff09;&#xff0c;在 Streaming Lakehouse Meetup 的分享。内容主要分为四个部分&#xff1a; Flink CDC 核心技术解析数…

基于springboot+vue的大学社团管理系统(前后端分离)

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战 主要内容&#xff1a;毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询 文末联系获取 项目介绍…

sqli第一关

1.在下使用火狐访问sqlilabs靶场并使用burpsuite代理火狐。左为sqlilabs第一关&#xff0c;右为burpsuite。 2.输入?id1 and 11 与?id1 and 12试试 可以看出没有变化哈&#xff0c;明显我们输入的语句被过滤了。在?id1后面尝试各种字符&#xff0c;发现单引号 包…

企业架构LNMP学习笔记18

nginx的日志&#xff1a; 日志类型&#xff1a; access.log 访问日志、查看统计用户的访问信息&#xff0c;流量。 error.log 错误日志&#xff0c;错误信息&#xff0c;重写信息。 access.log日志文件内容示例&#xff1a; 192.168.17.1 - - [06/Sep/2023:20:37:39 0800] …

数据库系统概念学习1

第一章 引言 数据库管理系统是由一个互相关联的数据的集合和一组用以访问这些数据的程序组成。这个数据集合通常称为数据库 特定时刻存储在数据库中的信息的集合称为数据库的一个实例&#xff0c;而数据库的总体设计称为数据库模式 数据库结构的基础是数据模型&#xff0c;…

【C++基础】左值引用、右值引用、move、forward

本文参考&#xff1a;右值引用 | 爱编程的大丙 转移和完美转发 | 爱编程的大丙 左值、右值、左值引用、右值引用 左值 是指存储在内存中、有明确存储地址&#xff08;可取地址&#xff09;的数据&#xff1b; 右值 是指可以提供数据值的数据&#xff08;不可取地址&#x…

UNext:基于 MLP 的快速医学图像分割网络

UNext 会议分析摘要贡献方法整体框架1.Shifted MLP2.Tokenized MLP Stage 实验1.对比实验2.消融实验2.1 模块的消融实验2.2 通道数的探索 可借鉴参考 会议分析 期刊&#xff08;会议&#xff09;名&#xff1a; MICCAI 2022 会议信息&#xff1a; 属于顶会了 有代码&#xff1…

3D视觉测量:3D空间圆拟合优化

文章目录 0. 测试效果1. 测量思路2. 部分调用代码文章目录:形位公差测量关键内容:通过视觉方法实现GD&T中的圆孔位置定位0. 测试效果 1. 测量思路 空间圆拟合是指在三维空间中找到最佳拟合圆的过程。这通常用于从一组三维点数据中找到一个圆,以最小化数据点到圆的距离之…

百度地图3D棱柱鼠标事件

百度地图2D API JavaScript API | 百度地图API SDK 百度地图3D API jspopularGL | 百度地图API SDK 3D棱柱效果如下 一. 渲染地图 var map new BMapGL.Map(container, {style: {styleJson: styleJson2} }) map.centerAndZoom(new BMapGL.Point(116.404, 39.925), 9); map…

通过rabbitmq生成延时消息,并生成rabbitmq镜像

通过rabbitmq生成延时消息队列&#xff0c;并生成rabbitmq镜像 整体描述1. 使用场景2. 目前问题3. 前期准备 具体步骤1. 拉取镜像2. 运行镜像3. 安装插件4. 代码支持4.1 config文件4.2 消费监听4.2 消息生产 5. 功能测试 镜像操作1. 镜像制作2. 镜像导入 总结 整体描述 1. 使用…

2023年中国光伏行业研究报告

第一章 行业概况 1.1 定义 光伏行业&#xff0c;也称为太阳能光伏行业&#xff0c;是一个专注于利用光伏技术将太阳能转化为电能的领域。该行业涵盖了太阳能电池的制造、光伏系统的设计、安装和维护&#xff0c;以及电能的销售和供应。光伏技术的核心是光伏效应&#xff0c;通…

java设计模式之观察者模式

. 基本概念 观察者&#xff08;Observer&#xff09;模式中包含两种对象&#xff0c;分别是目标对象和观察者对象。在目标对象和观察者对象间存在着一种一对多的对应关系&#xff0c;当这个目标对象的状态发生变化时&#xff0c;所有依赖于它的观察者对象都会得到通知并执行它…

图片怎么压缩大小?这样压缩图片很简单

在日常生活中&#xff0c;我们常常需要处理各种各样的图片文件&#xff0c;但有时候图片的大小可能会成为问题。比如在上传图片到网站或者将图片发送给朋友时&#xff0c;过大的图片可能会导致上传速度变慢或者占用过多内存。这时&#xff0c;我们就需要用到图片压缩了&#xf…

python 语法入门

文章目录 前言python 语法入门1. 语句分隔符2. 注释3. pep8规范4. 变量5. 扩展5.1. 运行此行代码的过程 前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&#xff0c;写作不易啊^ _ ^。   而且听说点赞的人每天的运气都不会…

SegGPT: Segmenting Everything In Context论文笔记

论文https://arxiv.org/pdf/2304.03284.pdfCodehttps://github.com/baaivision/Painter 文章目录 1. 背景2. Motivation3. Method3.1 In-Context Coloring3.2 Context Ensemble3.3 In-Context Tuning 1. 背景 在Painter中&#xff0c;将各种密集预测任务视为一种着色问题。 在…