Python 利用百度文字识别 API 识别并提取图片中文字

Python 利用百度文字识别 API 识别并提取图片中文字

利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字。首先需注册获取 API 调用的 ID 和 key,步骤如下:

打开百度AI开放平台,进入控制台中的文字识别应用(需要有百度账号)。
文字识别

创建一个应用,并进入管理应用,记下 AppID, API Key, Secrect Key,调用 API需用到。
管理应用
AppID
最后安装 python 的百度ai接口的的库
pip install baidu-aip

以下是代码实现,需将所有识别的图片放进名为 picture 的文件夹。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Tue Jun 12 09:37:38 2018
利用百度api实现图片文本识别
@author: XnCSD
"""import glob
from os import path
import os
from aip import AipOcr
from PIL import Imagedef convertimg(picfile, outdir):'''调整图片大小,对于过大的图片进行压缩picfile:    图片路径outdir:    图片输出路径'''img = Image.open(picfile)width, height = img.sizewhile(width*height > 4000000):  # 该数值压缩后的图片大约 两百多kwidth = width // 2height = height // 2new_img=img.resize((width, height),Image.BILINEAR)new_img.save(path.join(outdir,os.path.basename(picfile)))def baiduOCR(picfile, outfile):"""利用百度api识别文本,并保存提取的文字picfile:    图片文件名outfile:    输出文件"""filename = path.basename(picfile)APP_ID = '******' # 刚才获取的 ID,下同API_KEY = '******'SECRECT_KEY = '******'client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)i = open(picfile, 'rb')img = i.read()print("正在识别图片:\t" + filename)message = client.basicGeneral(img)   # 通用文字识别,每天 50 000 次免费#message = client.basicAccurate(img)   # 通用文字高精度识别,每天 800 次免费print("识别成功!")i.close();with open(outfile, 'a+') as fo:fo.writelines("+" * 60 + '\n')fo.writelines("识别图片:\t" + filename + "\n" * 2)fo.writelines("文本内容:\n")# 输出文本内容for text in message.get('words_result'):fo.writelines(text.get('words') + '\n')fo.writelines('\n'*2)print("文本导出成功!")print()if __name__ == "__main__":outfile = 'export.txt'outdir = 'tmp'if path.exists(outfile):os.remove(outfile)if not path.exists(outdir):os.mkdir(outdir)print("压缩过大的图片...")// 首先对过大的图片进行压缩,以提高识别速度,将压缩的图片保存与临时文件夹中for picfile in glob.glob("picture/*"):convertimg(picfile, outdir)print("图片识别...")for picfile in glob.glob("tmp/*"):baiduOCR(picfile, outfile)os.remove(picfile)print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)os.removedirs(outdir)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68356.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

调用阿里API实现图片中的文字识别

作者介绍 王雪玉,女,西安工程大学电子信息学院,2022级研究生 研究方向:机器视觉与人工智能 电子邮件:2239580540qq.com 王泽宇,男,西安工程大学电子信息学院,2022级研究生&#xf…

李飞飞高徒教你从0到1构建GPT,马斯克点赞

詹士 发自 凹非寺量子位 | 公众号 QbitAI “从0到1手搓GPT”教程来了! 视频1个多小时,从原理到代码都一一呈现,训练微调也涵盖在内,手把手带着你搞定。 该内容刚发出来,在Twitter已吸引400万关注量,HackerN…

马斯克、米哈游轮番注资,AI医疗会是下一个风口吗?

图片来源:由无界AI生成 医疗健康一直都是老生常谈的话题,如今这个领域正面临着诸多挑战,如成本不断攀升或是全球性流行病等,而脑机接口等AI技术的出现有望为医疗领域提供新的解决方案。 如果你是科幻迷,你可能对脑机接…

《战略品牌管理》思维导图,教你如何对品牌进行管理

品牌一直在我们的生活中扮演了很重要的作用,它影响了我们的决策,甚至让我们痴迷。可是很少有人真正理解它的本质以及它是怎么建立并成长的,而战略品牌管理知识便是这样管理品牌的一本书,它能帮我们解释我们生活中的很多现象&#…

薅羊毛我愿称Python为最强,Python 自动化带你轻松赚钱

ps:本文仅限用于技术交流,请勿用于其他用途。 准 备 工 作 在编写代码之前,需要做如下准备工作: 1、配置好 Android ADB 开发环境 2、Python 虚拟环境内安装 pocoui 依赖库 3、操作剪切板的应用 APK 编 写 代 码 我们分 7 …

薅羊毛算副业吗?薅羊毛到底是怎么赚钱的?

薅羊毛算副业吗?薅羊毛到底是怎么赚钱的? 薅羊毛当然也算是一种副业! 薅羊毛拿佣金的起初,我的原因应该跟大部分人事一样的,“挣钱”。 我是先在知乎上,小红书大概了解的“薅羊毛”的运作方式,然后加入一个羊毛裙看了一下别人是怎么操作的,当时觉得也是很简单的,每…

羊毛大军杀入币圈,有人月入过万,有人惨遭反薅,沦为韭菜

文 | 棘轮 比萨 空投糖果、“月入过万”、“躺赚”……羊毛党大军,早已杀入币圈。 羊毛党圈流传的“史上最贵羊毛”——ONT空投,就出自币圈。甚至有职业羊毛党因此购入保时捷。 相较于互联网圈“羊毛”,币圈“羊毛”往往不需注册、实名验证。…

知乎带货月入过万的赚钱路子,前期操作后期可躺赚

如果说网络上有哪些值得投入并真正当做一个优质副业项目来操作的话,知乎好物推荐应该算一个,今天就跟大家聊聊知乎好物这个网络赚钱项目。 目前已经有很多小伙伴以此为副业,并且取得了很好的成绩,做到了睡后收入。 知乎好物&…

技术创造价值,手把手教你薅羊毛篇

距离上一篇年终总结的文章已经过了3个多月了,在年终总结中写到了利用脚本自动薅羊毛的话题,评论里有不少小伙伴比较感兴趣。so,今天就来给大家详细介绍一下如何让技术创造价值(得给薅羊毛上升一个层次)。本文没有什么技…

CSDN是如何让我副业月入过万的?

始 我跟 CSDN 的缘分要从 2011 年说起,当时我正上高二,当时好像是在搞鼓 MFC。当时家里有了第一台电脑,我也再也不用去黑网吧去敲代码了,在家搜索资料的时候出现在我眼帘之中,并且对我有帮助的基本上都是 CSDN 上的内…

薅羊毛 | Python 自动化带你轻松赚钱

作者:星安果 来源:AirPython 阅读文本大概需要 10 分钟。 1 目 标 场 景 最近,有一个朋友告诉我,她在某平台上购买了一部手机,收到货之后发现商品质量挺好的,价格也不贵。 临了随手给了个好评,商…

来来来,教你如何智慧薅羊毛!

提到边缘计算,熟悉ToB技术的朋友,首先可能想到的就是运营商的5G MEC(移动边缘计算),以及云计算中的融合边缘系统理念。 的确,作为全球公认的创新技术趋势,边缘计算如今已经被广泛用于云计算、5G…

互联网薅羊毛指南

点击上方“程序猿杂货铺”,“星标或置顶公众号” 第一时间获取价值内容 阅读本文大概需要 9 分钟 本文经授权转载于公众号 | Python爱好者社区 作者 | 王大伟 微软最有价值专家(MVP) 薅羊毛,一种参与各种优惠活动的新型说法&#…

CSDN给你一个薅羊毛的机会!你真的不要吗?

抢红包、集福卡、转锦鲤等等,每年过年过节,各种价值几十亿的瓜分活动,对于网络冲浪选手来说,眼花缭乱但也乐趣满满。 可现实是:你抢了5毛8,人家抢了好几万! 甚至前段时间,字节跳动安…

go-cqhttp QQ机器人入门

有关go-cqhttp QQ机器人的一些小问题 基础介绍介绍一些名词***2022-04-07更新***小问题汇总: 基础介绍 go-cqhttp机器人是基于onebot协议的一个应用,官网:https://docs.go-cqhttp.org/可以制作QQ机器人。娱乐性还是蛮强的。之前研究的时候发现网上的教程…

【Re:从零开始的QQ机器人搭建】——基于go-cqhttp和python

【Re:从零开始的QQ机器人搭建】—— 基于go-cqhttp 警告:小心智械危机( 前言 之前酷Q用的好好的,谁知道刚打完工会战不到2天tx就封了大部分机器人。所幸小部分有生力量保留了下来,必可活用于下次机器人搭建。 一、…

使用NoneBot2可视化平台搭建QQ聊天机器人:本地和云部署教程

NoneBot是一个基于Python 3.8的异步、开源和可扩展的框架,用于构建和运行聊天机器人,支持各种聊天平台,如Telegram,Discord和WeChat。它是基于nonebot库构建的,提供了一个易于使用的界面,用于创建聊天机器人…

教你使用python搭建QQ机器人

注:本文中Linux系统指令均为Ubuntu使用,centos等请根据指令按系统情况改动。 目录 一、环境配置 二、配置go-cqhttp 三、安装nonebot 四、运行机器人 五、插件 六、最后 一、环境配置 1、python版本>3.8.0。如果版本不对请更新版本&#xff0c…

中级 PHP 程序员应该掌握的面试题

PHP 不仅是世界上最好的语言,还是世界上最奇特的语言,奇特之处是很多难以理解的语法,还有一眼看不出运行结果的程序。下面我整理了几道中级水平的面试题,大家可以看看: 请选择以下代码运行的结果: 程序解释…

“二向箔”其实并不存在丨《三体》里的数学问题

《三体》电视剧的播出,还原了很多原著小说中的“名场面”,引发了公众和书迷的广泛关注和讨论。对于等不及电视剧更新去翻书的人,亦或是“原著党”的脑海里,“名场面”一定少不了《三体3:死神永生》中,“歌者…