selenium学习日记

这篇文章旨在记录学习selenium的时候遇到的问题和代码风格。

1、常见的登录问题、cookie、token、验证码、邮箱。
2、验证码工具,本地的onnx格式的微型模型进行图像识别,得到最终的验证码,速度还蛮快的。
ddddocr.DdddOcr()

 try:while self.driver.find_element(By.ID, "radCaptha_CaptchaImageUP"):self.driver.find_element(By.ID, "txtUser").clear()self.driver.find_element(By.ID, "txtUser").send_keys("huyue33@sic.picc.com.cn")# 输入验证码image = self.driver.find_element(By.ID, "radCaptha_CaptchaImageUP").screenshot_as_png;ocr = ddddocr.DdddOcr()text = ocr.classification(Image.open(BytesIO(image)))# text = pytesseract.image_to_string(), lang='eng')self.driver.find_element(By.ID, "txtUserValdiationCode").send_keys(f"{text}")print(text)# time.sleep(1)self.driver.find_element(By.ID, "cmdSignIn").click()self.driver.find_element(By.ID, "txtPwd")self.driver.find_element(By.ID, "txtPwd").clear()self.driver.find_element(By.ID, "txtPwd").send_keys("7&vQrPSr")self.driver.find_element(By.ID, "cmdSignIn").click()except Exception as e:# pass#print(e)pass
service = webdriver.EdgeService(executable_path='./msedgedriver.exe')  # 指定驱动的路径
options.add_argument("start-maximized")
options = webdriver.EdgeOptions()
self.driver = webdriver.Edge(options=options, service=service)#读取账号密码以及写入cookie。,
with open("./cookiefile", "r+") as f:cookie_data_list = f.readlines()for cookie in cookie_data_list:self.driver.add_cookie(json.loads(cookie))
with open("./login_info", "r+") as f:cookie_data_list = f.readlines()username = cookie_data_list[0]password = cookie_data_list[1]

截图

driver_wait = WebDriverWait(self.driver, 10, 0.5).until(
expected_conditions.element_to_be_clickable((By.ID, "phb_vw1_hyTranslation")))#10秒钟,每5秒检测该id元素是否存在
# expected_conditions.presence_of_element_located((By.ID, "phb_vw1_idAdditionalInfo")))
self.driver.set_window_size(1020, 2080)#设置网页大小
temp_save_pic.append(f"{save_dir}/{time.time()}.png")#截图
self.driver.save_screenshot(temp_save_pic[-1])
driver_wait.click()#点击
tabs = self.driver.window_handles
self.driver.switch_to.window(tabs[1])  # 切换到第二个标签页
WebDriverWait(self.driver, 10, 0.5).until(
expected_conditions.visibility_of_element_located((By.ID, "txtTranslation")))
text.append(self.driver.find_element(By.ID, "txtTranslation").text)
self.driver.close()#关闭标签页
self.driver.switch_to.window(tabs[0])
#保存文件到doc中
def saveDoc(filename, save_dictss, save_dictws, save_dictws_translate):list_save_dir = "./out_list"doc = Document()Header_name = filename.split(".")[0]doc.add_heading(filename, 0)i = 0for k, v in save_dictss.items():doc.add_paragraph(f'{i}-{k}')i = i + 1doc.add_picture(v, width=Pt(300))for pic, text in zip(save_dictws[k], save_dictws_translate[k]):print(pic)doc.add_picture(pic, width=Pt(300))# doc.add_picture(save_dictws[k], width=Pt(300))doc.add_paragraph(f'Translate')translate_txt = doc.add_paragraph()run = translate_txt.add_run(text)run.font.size = Pt(6)doc.save(list_save_dir + f"/{Header_name}.docx")
#读取excel文件
df = pd.read_excel(f"{todolist}/{filename}", engine="openpyxl", header=None)
df_list = df[0].tolist()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/460211.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

平台化运营公司如何在创业市场招商

在当今商业环境中,平台化运营的公司正成为推动经济发展的重要力量。对于这类公司而言,在创业市场招商意义重大。 平台化运营公司具有独特特点:通过搭建开放共享平台连接供需双方,实现资源优化配置与价值创造。比如电子商务平台、社…

聚类分析算法——K-means聚类 详解

K-means 聚类是一种常用的基于距离的聚类算法,旨在将数据集划分为 个簇。算法的目标是最小化簇内的点到簇中心的距离总和。下面,我们将从 K-means 的底层原理、算法步骤、数学基础、距离度量方法、参数选择、优缺点 和 源代码实现 等角度进行详细解析。…

SpringMVC执行流程(视图阶段JSP、前后端分离阶段)、面试题

目录 1.SpringMVC执行流程分为以下两种 2.非前后端分离的SpringMVC的执行流程 3.前后端分离的项目SpringMVC执行流程 4. 面试题 1.SpringMVC执行流程分为以下两种 2.非前后端分离的SpringMVC的执行流程 流程图: 更加生动的描述: DisPatcherServlet…

十分钟Linux中的epoll机制

epoll机制 epoll是Linux内核提供的一种高效I/O事件通知机制,用于处理大量文件描述符的I/O操作。它适合高并发场景,如网络服务器、实时数据处理等,是select和poll的高效替代方案。 1. epoll的工作原理 epoll通过内核中的事件通知接口和文件…

GRE Over IPsec(华三)

GRE Over IPsec 顾名思义,GRE在内,IPsec在外 那么当数据进入tunnel隧道后,会先被GRE封装后再进行IPsec感兴趣流acl匹配,匹配上了则封装IPsec,没匹配上则丢包 实验: 需求:总部pc能够通过gre o…

echarts属性之xAxis

xAxis 直角坐标系 grid 中的 x 轴,一般情况下单个 grid 组件最多只能放上下两个 x 轴,多于两个 x 轴需要通过配置 offset 属性防止同个位置多个 x 轴的重叠。 所有属性 xAxis. id string 组件 ID。默认不指定。指定则可用于在 option 或者 API 中引…

盘点:2024年最新热门项目管理平台TOP11

一、项目管理平台的重要性 在当今竞争激烈的商业环境中,项目管理平台已成为企业提高效率和团队协作的关键工具。这主要是因为现代商业项目日益复杂,涉及多个部门、众多资源以及不断变化的需求。 首先,项目管理平台能够提高工作效率。例如&a…

PHP数据类型

几种常用的数据类型: String(字符串) Integer(整型) Float(浮点型) Boolean(布尔型) NULL(空值) Array(数组) Obje…

【大数据】Flink + Kafka 实现通用流式数据处理详解

目录 一、前言 二、流式数据处理场景介绍 2.1 流式数据处理概述 2.1.1 流式数据处理场景介绍 2.2 流式数据处理技术栈 2.2.1 数据采集 2.2.2 数据处理 2.2.3 数据存储 2.2.4 数据展示 2.3 流式数据处理场景面临的问题和挑战 三、通用的流式数据处理场景解决方案 3.1…

精准测试在基金团队应用实践

以下为作者观点: 一、引言 精准测试是一套计算机测试辅助分析系统,精准测试的核心组件包含,软件覆盖率分析、用例和代码的双向追踪、智能回归测试用例选取、缺陷定位、测试用例聚类分析、测试用例自动生成系统,这些功能完整的构…

参与国家标准制定对企业发展有哪些好处?

1. 提升企业竞争力: • 技术优势凸显:参与标准制定的过程中,企业能将自身先进的技术和管理理念融入标准,这不仅是对企业技术实力的认可,也能使企业在行业中占据技术制高点。 • 质量优势强化:国家标准对产品…

滚柱导轨出现异常损坏的原因

滚柱导轨是一种精密的直线滚动导轨,具有较高的承载能力和较高的刚性,对反复动作、起动、停止往复运动频率较高情况下可减少整机重量和传动机构及动力成本。滚柱导轨可获得较高的灵敏度和高性能的平面直线运动,在重载或变载的情况下&#xff0…

开发了一个成人学位英语助考微信小程序

微信小程序名称:石榴英语 全称:石榴英语真题助手 功能定位 北京成人学士学位英语辅助学习工具,包含记高频单词,高频词组,专项练习,模拟考试等功能。 开发背景 个人工作需要提高学习英文水平&#xff…

基于Matlab 火焰识别技术

Matlab 火焰识别技术 课题介绍 森林承担着为人类提供氧气以及回收二氧化碳等废弃气体的作用,森林保护显得尤其重要。但是每年由于火灾引起的事故不计其数,造成重大的损失。如果有一款监测软件,从硬件处获得的图像中监测是否有火焰&#xff…

同声传译器什么好用?哪款是你的会议利器推荐榜?

眨眼之间,冬日的脚步悄然而至,又可以踏上前往东北的旅程,去欣赏那银装素裹的绝美雪景。 在这样一个充满异域风情和语言挑战的旅途中,一款顶尖的同声传译器软件无疑是旅行者的最佳伴侣。 它能帮助我们跨越语言的鸿沟,…

jenkins自动化构建vue(web)项目并部署(项目实战)

安装nodejs插件 系统管理>插件管理 安装完成 配置node 新建任务 根据自己情况来设置是否需要丢弃旧的构建,我保存了5天和5次 cd /var/jenkins_home/workspace/hainan_road_web/SDGS-YHJC/sdgs-ui npm config set registry https://registry.npmmirror.com n…

(二 上)VB 2010 设计初步

目录 一、常用类应用 1.Console类控制台 2.窗体基本控件 二、面向对象程序设计 1.类和对象 2.对象的属性、方法、事件属 1.属性 2.方法 3.事件、事件过程 1.事件 2.事件过程 3.对象浏览器 三、.NET类库与命名空间 1.命名空间 常用命名空间 1.System命名空间 2.…

scala 权限

一.访问权限 idea实例 关于protected:

短视频矩阵系统源码开发分享/源代码部署/oem贴牌搭建分享

短视频矩阵软件开发综述 抖音短视频SEO矩阵系统源码是一款在高速数据处理和分析方面表现卓越的系统。它结合了深度学习、大数据分析和可视化等多种先进技术,极大地提升了信息处理的效率与准确性。 短视频矩阵软件系统的开发需要多方面的技术支持,涵盖了…

Linux——— 信号

文章目录 前言:引入信号生活中的例子信号概念见一见Linux中的信号 浅度理解信号信号处理(浅谈):如何自定义捕捉 信号保存(浅谈) 信号产生系统调用产生异常产生:浅谈除0异常浅谈解引用野指针异常Core &&…