python爬虫滑块验证及各种加密函数(基于ddddocr进行的一层封装)

git链接: https://github.com/JOUUUSKA/spider_toolsbox

这里写目录标题

  • 一.识别验证码
    • 1、识别英文+数字验证码
    • 2、识别滑块验证码
    • 3、识别点选验证码
  • 二、下载系列
    • 1、下载视频
    • 2、下载图片
    • 3、下载文本
  • 三、常用加密类型
    • 1、AES系列
    • 2、DES系列
    • 3、RSA系列
    • 4、SHA系列
    • 5、BASE64
    • 6、HMAC
    • 7、PBKDF2

一.识别验证码

git链接: https://github.com/JOUUUSKA/spider_toolsbox
创作不易记得stars

1、识别英文+数字验证码

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()   spidertool.ocr_img(img_path)

返回给图片中显示的验证码

2、识别滑块验证码

一张图为带坑位的原图,如下图
在这里插入图片描述
一张图为原图,如下图
在这里插入图片描述

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()  spidertool.ocr_slide_with_hole(bgimg_path, fullpage_path)

返回图片中显示的滑块图缺口坐标

小滑块为单独的png图片,背景是透明图,如下图

在这里插入图片描述
然后背景为带小滑块坑位的,如下图
在这里插入图片描述

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()  spidertool.ocr_slide_with_clean(bgimg_path, fullpage_path)

3、识别点选验证码

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.ocr_click_choose(test_img_path, result_img_path)

二、下载系列

1、下载视频

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.download_video(url)

2、下载图片

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.download_img(url)

3、下载文本

from spider_toolsbox.spidertools import SpiderTools
spidertool = SpiderTools()    spidertool.download_character(txt)

三、常用加密类型

使用说明:
加密模式的填充类型统一设定为PKCS7
加密类型中只有 SHA系列,HMACPBKDF2 的输出格式只能为hex固定格式
其他的加密类型都能 自行指定 输出格式为base64或者hex

加密函数的 形参 中
指定output_format='hex’则输出为hex返回值,
指定output_format='base64’则输出为base64返回值

解密函数的 形参 中
指定input_format='hex’则输出为hex返回值
指定input_format='base64’则输出为base64返回值

使用示例

1、AES系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()  cryptor.encrypt_AESCBC(data, key, iv)
cryptor.decrypt_AESCBC(encoded_ciphertext, key, iv)cryptor.encrypt_AESECB(data, key)
cryptor.decrypt_AESECB(encoded_ciphertext, key)

2、DES系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_DESCBC(data, key, iv)
cryptor.decrypt_DESCBC(encoded_ciphertext, key, iv)cryptor.encrypt_DESECB(data, key)
cryptor.decrypt_DESECB(encoded_ciphertext, key)

3、RSA系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_RSA(data, pubkey)
cryptor.decrypt_RSA(data, privkey)

4、SHA系列

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_MD5(data)
cryptor.encrypt_SHA1(data)
cryptor.encrypt_SHA256(data)
cryptor.encrypt_SHA384(data)
cryptor.encrypt_SHA512(data)

5、BASE64

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_Base64(data)

6、HMAC

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()   cryptor.encrypt_HMAC(data, key, digestmod)

7、PBKDF2

from spider_toolsbox.cryptools import Cryptor
cryptor = Cryptor()  cryptor.encrypt_PBKDF2(password, salt)

若是对此项目中的API存疑,
可鼠标中键点击进入项目内部查看源码注释,
笔者已做好详细的注释供各位参考
若还不清楚,可通过电子邮箱联系作者1393827820@qq.com

git链接: https://github.com/JOUUUSKA/spider_toolsbox

本文所有资源由JOUUUSKA提供
git主页: https://github.com/JOUUUSKA

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/403490.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【c++】深入理解别名机制--引用

🌟🌟作者主页:ephemerals__ 🌟🌟所属专栏:C 目录 前言 一、引用的概念和定义 二、引用的特性 三、引用的实用性 1.引用传参 2.引用做返回值 2.1 引用做返回值的作用 2.2 引用坍缩问题、悬挂引用问…

算法的学习笔记—合并两个排序的链表(牛客JZ25)

😀前言 在算法面试中,链表问题是经常遇到的考点之一,其中合并两个排序链表是一个非常经典的问题。本文将详细介绍如何通过递归和迭代两种方式实现两个有序链表的合并。 🏠个人主页:尘觉主页 文章目录 😀合并…

Arduino开源四足蜘蛛机器人制作教程

视频教程:手把手叫你做四足蜘蛛机器人——1零件介绍_哔哩哔哩_bilibili 一、项目介绍 1.1 项目介绍 Arduino主控,图形化编程,趣味学习 Arduino nano开发板舵机扩展底板 4.8V可充电电池,支持Arduino C语言编程和米思齐图形化编程…

打卡学习Python爬虫第三天|爬取豆瓣电影Top250排行榜(附源码)

一、打开网页找到url 二、查看数据是否存在于网页源代码中 三、编写代码获取网页源代码 1、获取电影名称 注意正则表达式的使用&#xff0c;先观察网页源代码&#xff0c;我们发现每一部电影的数据存放在一个<li></li>中&#xff0c;如上图。并且我们要获取的电影…

el-image 图片预览时 与 el-table (或avue-crud) 样式冲突 的解决

问题: 解决 <style scoped> ::v-deep(.el-table__cell) {position: static !important; } </style> 后效果

二十二、状态模式

文章目录 1 基本介绍2 案例2.1 Season 接口2.2 Spring 类2.3 Summer 类2.4 Autumn 类2.5 Winter 类2.6 Person 类2.7 Client 类2.8 Client 类的运行结果2.9 总结 3 各角色之间的关系3.1 角色3.1.1 State ( 状态 )3.1.2 ConcreteState ( 具体的状态 )3.1.3 Context ( 上下文 )3.…

二叉树练习习题集一(Java)

1. 思路&#xff1a; 就是让左孩子和右孩子进行交换&#xff0c;这里需要一个中间变量用来记录&#xff0c;然后完成交换。如果进行优化则添加当左孩子和右孩子都为null时直接返回。 class Solution {public TreeNode invertTree(TreeNode root) {TreeNode tmpnull;//用来进行…

网络原理知识总结

一、网络模型 1.1 osi七层参考模型 物理层&#xff1a;连接通信链路、传输比特流数据链路层&#xff1a;数据封装成帧&#xff0c;在节点与节点间实现可靠物理地址寻址&#xff0c;进行差错校验、流量控制网络层&#xff1a;逻辑地址寻址&#xff0c;路由选择 IP(IPV4IPV6) I…

window.onload、$(document).ready()、Vue.created() 页面加载完成后执行方法

1、JavaScript 的 window.onload 方法 window.onload 方法是在页面所有元素&#xff08;包括图片、样式、链接等&#xff09;加载完成后触发的&#xff0c;在这个事件之前&#xff0c;页面上的所有资源都必须加载完成。因此&#xff0c;如果页面中包含大量的图片或其他资源&am…

【iOS】——响应者链和事件传递链

事件传递 事件传递流程 发生触摸事件后&#xff0c;系统会将该事件封装成UIEvent对象加入到一个由UIApplication管理的事件队列 UIApplication会从事件队列中取出最前面的事件&#xff0c;并将事件分发下去以便处理&#xff0c;通常&#xff0c;先发送事件给应用程序的主窗口…

TCP详解(一)报文详情/MSS/MTU

本文旨在介绍TCP的报文格式详情和传输层、链路层的字节数限制 1 TCP 协议的报文格式 TCP 报文段包括协议首部和数据两部分&#xff0c;协议首部的固定部分是 20 个字节&#xff0c;头部是固定部分&#xff0c;后面是选项部分。 1.1 端口号 16位源端口&#xff1a;发送方主机…

KDP数据平台:以实战案例验证技术领先力

本文由智领云 LeetTools 工具自动生成 申请试用&#xff1a; https://www.leettools.com/feedback/ 在当今快速发展的技术环境中&#xff0c;数据平台的选择对企业的数字化转型和业务发展至关重要。智领云开源KDP&#xff08;Kubernetes Data Platform&#xff09;在数据处理和…

效果炫酷的3D翻转书特效WordPress主题模板MagicBook主题v1.19

正文&#xff1a; MagicBook是一款支持3D翻书特效的书籍WordPress主题。支持可视化页面搭建&#xff0c;3D菜单&#xff0c;完全自适应设计,WPML多语言支持。 这款主题一定会让你爱不释手。虽然他是英文的&#xff0c;但不可不承认的是&#xff0c;它优雅的设计会让你愿意花时…

无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案

无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案 1.快速创建应用 你可以通过 3 种方式在 Dify 的工作室内创建应用: 基于应用模板创建(新手推荐) 创建一个空白应用 通过 DSL 文件(本地 / 在线)创建应用 从模板创建…

13 定时器

13 定时器 1、定时1.1 硬件定时器的特性1.2 硬件定时器对应的中断处理函数所作的工作(了解)1.3 linux内核中跟时间相关的三个概念&#xff1a; 2、延时2.1.延时定义2.2 忙等待2.3.休眠等待2.4 等待队列机制2.4.1 介绍2.4.2 结论2.4.3 进程休眠和唤醒的编程步骤方法 1方法 2 3、…

关于uniapp使用izExif.js 插件问题

需求&#xff1a;1.APP获取图片的属性&#xff0c;得到经纬度信息&#xff0c;然后标注到图片上 我们采用izExif.js 插件&#xff0c;进行获取图片信息&#xff0c;在模拟器测试好好地&#xff0c;但是使用真机测试发现getImageData没有返回信息&#xff0c;去izExif.js源码查…

ubuntu中python 改为默认使用python3,pip改为默认使用pip3

一、安装pip和python&#xff08;有的话可跳过&#xff09; 更新软件源 sudo apt update !!!apt和apt-get apt apt-get、apt-cache 和 apt-config 中最常用命令选项的集合。 部分截图为apt-get&#xff0c;建议直接用apt 安装pip和python ubuntu 18.04和更高版本默认安…

字符串金额转换,字符串手机号屏蔽,身份证信息查看,敏感词替换

2135 在发票上面该写成零佰零拾零万贰仟壹佰叁拾伍元 我们用逆推法可以写成零零零贰壹叁伍->贰壹叁伍->2135 1.遍历获取到每一个数字&#xff0c;然后把大写放到数组里面&#xff0c;将数字当作索引&#xff0c;在数组里面查找大写 package stringdemo;import java.uti…

Jakarta Servlet 到 SpringMVC

Jakarta EE&#xff08;曾被称为Java EE&#xff09;是Java平台企业版&#xff08;Java Platform Enterprise Edition&#xff09;的下一代版本&#xff0c;它在Oracle将Java EE的开发和维护交给Eclipse Foundation后得以重生&#xff0c;并更名为Jakarta EE。Jakarta EE保留了…

Windows采用VS2019实现Open3D的C++应用

1、参考链接 https://blog.csdn.net/qq_31254435/article/details/137799739 但是&#xff0c;我的方法和上述链接不大一样&#xff0c;我是采用VS2019进行编译的&#xff0c;方便在Windows平台上验证各种算法。 2、创建一个VS2019的C Console工程 #include <iostream>…