Python 实现：OCR在图片中提取文字（基于Gradio实现）

Python 实现：OCR在图片中提取文字（基于Gradio实现）

news/2024/11/13 16:39:32/文章来源:https://blog.csdn.net/weixin_45177027/article/details/134988557

Paddle OCR

PaddleOCR 基于深度学习技术实现的，使用十分简单。

先看效果

在这里插入图片描述

可以看出来识别效果还是不错的，里面的“湿”字识别成了繁体字。如果不是连体字，就不会出现这个问题。

1.测试环境

操作系统：Win10
Python：3.10

2.安装PaddlePaddle库

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple（自行选择镜像源）

3.下载PaddleOCR库

git clone https://github.com/PaddlePaddle/PaddleOCR

也可以选择直接DownLoad下载文件解压到本地

4.安装依赖包

进入PaddleOCR文件夹下：

> cd PaddleOCR

安装第三方依赖：

pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

5.详细代码

from pprint import pprint  
from paddleocr import PaddleOCR  
import gradio as gr  ocr = PaddleOCR(use_angle_cls=True, lang="ch")  def process(image):  result = ocr.ocr(image)  # return resultoutput_text = ""  # 初始化输出文本变量for sublist in result:for line in sublist:text = line[1][0]  # 提取文本output_text += text + "\n"  # 将文本追加到输出文本变量，并添加换行符pprint(output_text)return output_textiface = gr.Interface(fn=process, inputs="image", outputs="text",title="图片OCR提取文字", iface.launch()

注意：这里result原先返回的还有坐标信息以及置信度，这里经过处理只返回了识别后的文本信息。如果需要坐标信息，可以直接返回result。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/220026.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【Linux】dump命令使用

【Linux】dump命令使用

dump命令 dump命令用于备份文件系统。使用dump命令可以检查ext2/3/4文件系统上的文件，并确定哪些文件需要备份。这些文件复制到指定的磁盘、磁带或其他存储介质保管。语法 dump [选项] [目录|文件系统] bash: dump: 未找到命令... 安装dump yum -y install …

阅读更多...

ros2+在Ubuntu上安装gazebo

ros2+在Ubuntu上安装gazebo

Binary Installation on Ubuntu(Ubuntu上binary方式安装gazebo) Harmonic binaries are provided for Ubuntu Jammy (22.04) and Ubuntu 24.04 (when its released). （在Ubuntu22.04或者24.04上都是安装Harmonic版本的gazebo）The Harmonic binaries are…

阅读更多...

【Stm32-F407】全速DAP仿真器下载程序

【Stm32-F407】全速DAP仿真器下载程序

文章内容如下: 1) 全速DAP仿真器简介2) 全速DAP仿真器下载程序流程 1) 全速DAP仿真器简介 1）全速DAP仿真器简介 DAP全称 Data Acquisition Processor，是一种用于数据采集和实时控制的设备。本文使用的全速DAP仿真器遵循ARM公司的CMSIS-DAP标准&#xff…

阅读更多...

2023-12-18 最大二叉树、合并二叉树、二叉搜索树中的搜索、验证二叉搜索树

2023-12-18 最大二叉树、合并二叉树、二叉搜索树中的搜索、验证二叉搜索树

654. 最大二叉树核心：记住递归三部曲，一般传入的参数的都是题目给好的了！把构造树类似于前序遍历一样就可！就是注意单层递归的逻辑！ # Definition for a binary tree node. # class TreeNode: # def __init__(se…

阅读更多...

企业微信旧版-新版网络连接错误，无法登录的解决方案

企业微信旧版-新版网络连接错误，无法登录的解决方案

一.企业微微信无法登录故障二.解决方案 1.网上的解决方案 **检查网络连接：**确保你的计算机正常连接到互联网。尝试打开其他网页，以确保网络连接正常。 **防火墙和安全软件：**某些防火墙或安全软件可能会阻止企业微信的正常连接。请确保你…

阅读更多...

MyBatis运行原理和步骤

MyBatis运行原理和步骤

MyBatis运行原理 MyBatis框架在操作数据库时，大体经过了8个步骤： 1.读取 MyBatis 配置文件：mybatis-config.xml 为 MyBatis 的全局配置文件，配置了 MyBatis 的运行环境等信息，例如数据库连接信息。 2.加载映射文件&…

阅读更多...

详解git pull和git fetch的区别

详解git pull和git fetch的区别

git pull和git fetch的区别, 网上人云亦云胡说八道的实在是太多了，误导我很久。今天看到一个说得好的，记录一下。前言在我们使用git的时候用的更新代码是git fetch，git pull这两条指令。但是有没有小伙伴去思考过这两者的区别呢&#xff…

阅读更多...

人工智能原理课后习题（考试相关的）

人工智能原理课后习题（考试相关的）

文章目录问答题知识表示一阶谓词逻辑表示法语义网络表示法确定推理谓词公式永真和可满足性内容归结演绎推理不确定推理主观贝叶斯可信度方法证据理论搜索策略机器学习问答题什么是人工智能？ 人工智能就是让机器看起来像人类表现出的智能水平一样人工智能就是…

阅读更多...

十四、YARN核心架构

十四、YARN核心架构

1、目标 （1）掌握YARN的运行角色和角色之间的关系 （2）理解使用容器做资源分配和隔离 2、核心架构 （1）和HDFS架构的对比 HDFS架构： YARN架构：（主从模式） &…

阅读更多...

Qt/C++音视频开发60-坐标拾取/按下鼠标获取矩形区域/转换到视频源真实坐标

Qt/C++音视频开发60-坐标拾取/按下鼠标获取矩形区域/转换到视频源真实坐标

一、前言通过在通道画面上拾取鼠标按下的坐标，然后鼠标移动，直到松开，根据松开的坐标和按下的坐标，绘制一个矩形区域，作为热点或者需要电子放大的区域，拿到这个坐标区域，用途非常多&#xff0…

阅读更多...

代码随想录第三十四天（一刷C语言）|不同路径不同路径II

代码随想录第三十四天（一刷C语言）|不同路径不同路径II

创作目的：为了方便自己后续复习重点，以及养成写博客的习惯。一、不同路径思路：参考carl文档机器人每次只能向下或者向右移动一步，机器人走过的路径可以抽象为一棵二叉树，叶子节点就是终点。 1、确定dp数组&#…

阅读更多...

使用podman管理容器

使用podman管理容器

目录 1.安装及配置podman 2.镜像的命名 3.对镜像重新做标签 4.删除镜像 5.查看镜像的层结构 6.导出和导入镜像 7.创建容器 8.创建一个简单的容器 9.容器的生命周期 10.创建临时容器 11.指定容器中运行的命令 12.创建容器时使用变量对于初学者来说，不太容易理…

阅读更多...

为什么在Android中需要Context？

为什么在Android中需要Context？

介绍在Android开发中，Context是一个非常重要的概念，但是很多开发者可能并不清楚它的真正含义以及为什么需要使用它。本文将详细介绍Context的概念，并解释为什么在Android应用中需要使用它。 Context的来源 Context的概念来源于Android框架…

阅读更多...

【SpringBoot篇】基于布隆过滤器，缓存空值，解决缓存穿透问题（商铺查询时可用）

【SpringBoot篇】基于布隆过滤器，缓存空值，解决缓存穿透问题（商铺查询时可用）

文章目录 🍔什么是缓存穿透🎄解决办法⭐缓存空值处理🎈优点🎈缺点🎍代码实现 ⭐布隆过滤器🎍代码实现 🍔什么是缓存穿透缓存穿透是指在使用缓存机制时，大量的请求无法从缓存中获取…

阅读更多...

4.qml 3D-Light、DirectionalLight、PointLight、SpotLight、AxisHelper类深入学习

4.qml 3D-Light、DirectionalLight、PointLight、SpotLight、AxisHelper类深入学习

今天我们学习灯光类首先来学习Light类，它是所有灯光的虚基类，该类是无法创建的，主要是为子类提供很多公共属性。常用属性如下所示： ambientColor : color，该属性定义在被该光照亮之前应用于材质的环境颜色。默认值…

阅读更多...

23种策略模式之策略模式

23种策略模式之策略模式

23种策略模式之策略模式文章目录 23种策略模式之策略模式前言优缺点使用场景角色定义UML模拟示例小结前言在软件开发中，设计模式是为了解决常见问题而提供的一套可重用的解决方案。策略模式（Strategy Pattern）是其中一种常见的设计模式&a…

阅读更多...

STM32 寄存器配置笔记——I2C 读写AT24C02 EEPROM

STM32 寄存器配置笔记——I2C 读写AT24C02 EEPROM

一、简介本文主要介绍STM32F10xx系列如何使用软件模拟I2C总线读写AT24C02的EEPROM数据。二、概述 I2C协议是一种用于同步、半双工、串行总线(由单片机时钟线、单数据交换器数据线组成)上的协议。规定了总线空闲状态、起始条件、停止条件、数据有效性、字节格式、响应确认信号…

阅读更多...

OpenSergo Dubbo 微服务治理最佳实践

OpenSergo Dubbo 微服务治理最佳实践

*作者：何家欢，阿里云 MSE 研发工程师 Why 微服务治理？ 现代的微服务架构里，我们通过将系统分解成一系列的服务并通过远程过程调用联接在一起，在带来一些优势的同时也为我们带来了一些挑战。如上图所示，可…

阅读更多...

＜VR串流线方案＞ PICO 4 Pro VR串流线方案 Oculus Quest2 Link串流线方案

＜VR串流线方案＞ PICO 4 Pro VR串流线方案 Oculus Quest2 Link串流线方案

虚拟现实技术(英文名称：Virtual Reality，缩写为VR)，又称虚拟实境或灵境技术，是20世纪发展起来的一项全新的实用技术。虚拟现实技术囊括计算机、电子信息、仿真技术，其基本实现方式是以计算机技术为主，利用并…

阅读更多...

xcode 修改 target 中设备朝向崩溃

xcode 修改 target 中设备朝向崩溃

修改xcode的target中的设备朝向导致崩溃。从日志上看好像没有什么特别的信息。之后想了想，感觉这个应该还是跟xcode的配置有关系，不过改动的地方好像也只有plist。就又翻腾了半天plist中的各种配置项，再把所有的用户权限提示相关的东西之…

阅读更多...

最新文章

推荐文章