selenium 简单案例 <批量下载文件> <网页自动化点击上报>

一、批量下载文件

网页分析
在这里插入图片描述
点击跳转到下载页面
在这里插入图片描述

from selenium import webdriver
import timedef get_link_list():# 创建浏览器对象driver = webdriver.Chrome(executable_path=r'C:\Users\nlp_1\Desktop\chromedriver\chromedriver-win32\chromedriver.exe')url = 'https://www.tendacn.com/en/service/download-cata-11.html'driver.get(url)# 等待driver.implicitly_wait(10)css_elem = driver.find_elements_by_css_selector('.dr_file > a')link_list = []for link in css_elem:page_link = link.get_attribute('href')print(page_link)link_list.append(page_link)driver.close()driver.quit()return link_listdef get_download_links(link_list):download_link_list = []for i,link in enumerate(link_list):if i == 0:driver = webdriver.Chrome(executable_path=r'C:\Users\nlp_1\Desktop\chromedriver\chromedriver-win32\chromedriver.exe')driver.get(link)else:js = f'window.open("{link}")'driver.execute_script(js)# 每打开一个链接切换到该页面也就是最新的这个driver.switch_to.window(driver.window_handles[-1])download_elem = driver.find_element_by_css_selector('.downbtns > a')download_link = download_elem.get_attribute('href')download_link_list.append(download_link)totals = len(download_link_list)print(f'一共有{totals}个下载链接!')driver.quit()return download_link_listdef download_file(download_link_List):for i,doanload_link in enumerate(download_link_List):js = f'window.open("{doanload_link}")'driver.execute_script(js)print(30*'-')print(doanload_link)time.sleep(6)print(f'第{i + 1}个文件正在下载中……')# 程序执行入口
if __name__ == '__main__':link_list = get_link_list()download_link_List = get_download_links(link_list)options = webdriver.ChromeOptions()options.add_argument('--ignore-certificate-errors')driver = webdriver.Chrome(options=options)download_file(download_link_List)

二、网页自动化点击上报

在这里插入图片描述

在这里插入图片描述

# 指定账户名和密码登录
def login():# 随机点一下 ,以便显示登录页面driver.find_element_by_id('bodyMain').click()# id=“username”是打开的网址中,账号登录的输入框,输入字符串“用户名”username = input('请输入你的用户名:')password = input('请输入你的密码:')print('登录中……')driver.find_element_by_id('username').send_keys(username)driver.find_element_by_id('password').send_keys(password)# id="submit"是点击登录, click() 是模拟点击driver.find_element_by_id("submit").click()time.sleep(2)print('登录成功\n')

在这里插入图片描述

# 点击 风险分级管控driver.implicitly_wait(5)risk_grade_control = driver.find_element_by_link_text("风险分级管控")risk_grade_control.click()time.sleep(2)print('已点击【风险分级管】\n')

在这里插入图片描述

# 点击 风险点隐患上报driver.implicitly_wait(5)xpth = driver.find_element_by_xpath("//div[@data-tid='e9c7735c77284173a243f8e47999ee8d']")xpth.click()time.sleep(2)print('已点击【风险点隐患上报】\n')

在这里插入图片描述

注意:可能点击 “风险点隐患上报” 右边页面是异步加载的找不到对应的文本按钮

    # 重定向页面,确保操作的是当前窗口页面内容driver.switch_to.default_content()frame = driver.find_elements_by_tag_name('iframe')[0]driver.switch_to.frame(frame)time.sleep(1)

完整代码

# 导入相关库和模块
from selenium import webdriver
import time# 指定账户名和密码登录
def login():# 随机点一下 ,以便显示登录页面driver.find_element_by_id('bodyMain').click()# id=“username”是打开的网址中,账号登录的输入框,输入字符串“用户名”username = input('请输入你的用户名:')password = input('请输入你的密码:')print('登录中……')driver.find_element_by_id('username').send_keys(username)driver.find_element_by_id('password').send_keys(password)# id="submit"是点击登录, click() 是模拟点击driver.find_element_by_id("submit").click()time.sleep(2)print('登录成功\n')# 免输入密码和账户名登录
def vip_login():# 苏州五合汽车部件制造有限公司# 张家港市友成高新材料有限公司print('这是vip直接登录模式(免输户名和密码),登录中……')driver.find_element_by_id('bodyMain').click()driver.find_element_by_id('username').send_keys('苏州五合汽车部件制造有限公司')driver.find_element_by_id('password').send_keys('ghj@18zXX')driver.find_element_by_id("submit").click()time.sleep(2)print('vip免输入模式,登录成功!\n')# 到达要处理的页面
def to_page():# 点击 风险分级管控driver.implicitly_wait(5)risk_grade_control = driver.find_element_by_link_text("风险分级管控")risk_grade_control.click()time.sleep(2)print('已点击【风险分级管】\n')# 点击 风险点隐患上报driver.implicitly_wait(5)xpth = driver.find_element_by_xpath("//div[@data-tid='e9c7735c77284173a243f8e47999ee8d']")xpth.click()time.sleep(2)print('已点击【风险点隐患上报】\n')# 重定向页面,确保操作的是当前窗口页面内容driver.switch_to.default_content()frame = driver.find_elements_by_tag_name('iframe')[0]driver.switch_to.frame(frame)time.sleep(1)# 点击 无隐患,处理一个页面
def deal_one_page(index=0):time.sleep(2)print()print(30 * '-')print()for i in range(20):if index == totals // 20 and i == totals % 20:print(f'总共{20 * index + i}条,已经全部点击完成!')driver.close()breakprint(f'第{20 * index + i + 1}条开始点击处理……')if i == 0:driver.find_elements_by_partial_link_text('无隐患')[i].click()driver.find_elements_by_partial_link_text('无隐患')[i].click()print('等待弹窗出现,并准备点击【确定】……')time.sleep(2)try:driver.implicitly_wait(5)  # secondselem_yes = driver.find_element_by_partial_link_text('确定')elem_yes.click()except:print('稍等,正在处理……')  # 再次重点击‘无隐患’driver.find_elements_by_partial_link_text('无隐患')[i].click()time.sleep(3)  # 之前5秒合适driver.implicitly_wait(5)  # secondselem_yes = driver.find_element_by_partial_link_text('确定')elem_yes.click()print('已经点击【确定】,弹窗正在退出……')print(f'第{20 * index + i + 1}条无隐患已经上报!')print()print(30 * '-')print()time.sleep(1)# 点击 无隐患,翻页并处理全部页面
def deal_all_page(totals):for index in range(totals // 20 + 1):time.sleep(3)deal_one_page(index)print()print(f'-----第{index + 1}页已经完成-----')print(f'--------------------------------')print()try:driver.find_element_by_id('mini-25').click()except:driver.find_element_by_id('mini-25').click()time.sleep(2)def get_totals():driver.implicitly_wait(10)  # secondsdriver.find_element_by_id('mini-26').click()driver.implicitly_wait(10)end_page_elem = driver.find_elements_by_xpath(".//span[@class='mini-pager-index']/span")[0]end_page = end_page_elem.text.strip('/')time.sleep(3)end_page_count = driver.find_elements_by_partial_link_text('无隐患')totals = (int(end_page) - 1) * 20 + len(end_page_count)print(f'一共{totals}条记录待点击处理')driver.implicitly_wait(10)  # secondsdriver.find_element_by_id('mini-23').click()time.sleep(3)return totalsdef main():# vip_login()login()to_page()time.sleep(3)global totalstotals = get_totals()deal_all_page(totals)if __name__ == "__main__":totals = None# 调用环境变量指定的 Chrome 浏览器创建浏览器对象driver = webdriver.Chrome()# get 方法会一直等到页面被完全加载,然后才会继续程序,通常测试会在这里选择print('正在启动网页自动化办公程序……\n')time.sleep(2)driver.get("http://221.224.155.68:9090/cas/login?service=http%3A%2F%2F221.224.155.68%3A9090%2Flesweb3%2F")print('正在打开目标网站……\n')time.sleep(2)main()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/202305.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

几款Java源码扫描工具(FindBugs、PMD、SonarQube、Fortify、WebInspect)

说明 有几个常用的Java源码扫描工具可以帮助您进行源代码分析和检查。以下是其中一些工具: FindBugs:FindBugs是一个静态分析工具,用于查找Java代码中的潜在缺陷和错误。它可以检测出空指针引用、资源未关闭、不良的代码实践等问题。FindBu…

从Github登录的双因子验证到基于时间戳的一次性密码:2FA、OTP与TOTP

Github于2023-03-09推出一项提高软件安全标准的措施,所有在Github上贡献过代码的开发人员在年底前必须完成 2FA(Two-factory authentication,双因子认证)。初听此事之时,不以为意,因为自己之前就知道双因子…

再探MDG cloud-ready模式!看未来MDG的发展路线

紧跟上一篇博客,我们将更加深入探讨一些MDG Cloud-Ready模式的相关内容。 背景 在2021年9月,Harald Kuck,SAP ABAP Platform老大,介绍了未来ABAP的发展路线,并最终在一年后正式推出了ABAP Cloud。他在会上是这么说的…

担忧CentOS停服?KeyarchOS系统来支撑

担忧CentOS停服?KeyarchOS系统来支撑 近年发生的“微软黑屏门”、“微软操作系统停更”等安全事件,敲响了我国 IT 产业的警钟,建立由我国主导的 IT 产业生态尤为迫切。对此,我国信息技术应用创新行业乘势而起,旨在通过…

基于单片机的光伏发电并网系统设计(论文+源码)

1.系统设计 片作为主控制器。由于太阳能板本身的能量输出受到负载影响,因此需要在太阳能板后面加入一级DC/DC电路,来实现最大功率跟踪,以提高整个系统的效率。接着,由于光伏逆变器需要产生220V的交流电给居民使用,因此…

子虔与罗克韦尔自动化合作 进博会签约自动化净零智造联创中心

11月6日进博会现场,漕河泾罗克韦尔自动化净零智造联创中心合作协议签约暨合作伙伴(第一批)授牌仪式举办,子虔科技作为联创中心合作伙伴签约,携手共建智能制造,引领行业可持续发展。 图示:子虔科…

BMS基础知识:BMS基本功能,铅酸和锂电池工作原理,电池系统的重要概念!

笔者有话说: 作为BMS从业者来讲,目前接触的BMS系统并不是很高大尚,但基础功能都是有的。 关于BMS的基本功能,工作原理,运行逻辑等,在此做一个梳理,讲一些最基础的扫盲知识,可以作为…

计算机网络:数据链路层

0 本节主要内容 问题描述 解决思路 1 问题描述 数据链路层主要面临四个问题: 封装成帧;透明传输;差错检测;实现相邻节点之间的可靠通信。 1.1 子问题1:封装成帧 怎么知道数据从哪里开始?到哪里结束&a…

校园圈子论坛,交友,帖子内短视频,二手市场,APP小程序H5三端交付,源码交付,支持二开

校园圈子论坛,交友频道,商城,二手市场,活动专区,短视频,从校园生活的方方面面展现出了充满活力和创造力的镜头。这个频道是一个让学生们相互交流、结识新朋友的平台,不仅有交友功能,…

如何使用无代码系统搭建软件平台?有哪些开源无代码开发平台?

无代码是什么 无代码开发,也称为零代码(Zero Code)开发,是一种技术概念。无代码开发无需代码基础,适合业务人员、IT开发及其他各类人员使用。他们通过无代码开发平台快速构建应用,并适应各种需求变化&#…

抖音汽车租赁小程序技术指南:开发高效便捷的租赁系统

为了更好地满足用户需求,抖音汽车租赁小程序成为一个备受关注的技术解决方案。本文将深入探讨开发高效便捷的汽车租赁系统所需的技术要点,为开发者提供一份实用的技术指南。 小程序架构选择 在搭建抖音汽车租赁小程序时,选择合适的小程序架构…

Arthas 监听 Docker 部署的java项目CPU占比高的信息

1、Linux上安装Arthas wget https://alibaba.github.io/arthas/arthas-boot.jar2、docker ps 查看目标项目的容器ID 3、copy Arthas 到目标容器中 (注意有 😕 ) docker cp arthas-boot.jar d97e8666666:/4、进入到目标容器目录中 docker exec -it d97e8666666 /b…

根据商品链接获取拼多多商品详情数据接口|拼多多商品详情价格数据接口|拼多多API接口

拼多多,作为中国最大的社交电商之一,为卖家提供了丰富的商品详情接口。这些接口可以帮助卖家快速获取商品信息,提高销售效率。本文将详细介绍如何使用拼多多商品详情接口,以及它的优势和注意事项。 一、拼多多商品详情接口概述 …

centos7中通过minikube安装Kubernetes

minikube是一款开源的Kubernetes集群管理器,它可以帮助您在本地计算机上轻松部署和管理Kubernetes集群。以下是minikube的安装和使用步骤: 安装Docker:如果您还没有安装Docker,可以从Docker官方网站上下载并安装适合您操作系统的…

分类预测 | Matlab实现基于DBN-SVM深度置信网络-支持向量机的数据分类预测

分类预测 | Matlab实现基于DBN-SVM深度置信网络-支持向量机的数据分类预测 目录 分类预测 | Matlab实现基于DBN-SVM深度置信网络-支持向量机的数据分类预测分类效果基本描述程序设计参考资料 分类效果 基本描述 1.利用DBN进行特征提取,将提取后的特征放入SVM进行分类…

Java基础(程序控制结构篇)

Java的程序控制结构与C语言一致,分为顺序结构、选择结构(分支结构)和循环结构三种。 一、顺序结构 如果程序不包含选择结构或是循环结构,那么程序中的语句就是顺序的逐条执行,这就是顺序结构。 import java.util.Sc…

QT mysql 数据库线程池 与数据库操作封装

最近事情比较多很久没有写学习笔记了,数据库线程池, 数据库封装,虽说数据库操作有很多不需要写sql 的,ORM 封装的方式去操作数据库。但是从业这些年一直是自己动手写sql ,还是改不了这个习惯。不说了直接上代码。 数据…

【C语言】数据结构——栈和队列实例探究

💗个人主页💗 ⭐个人专栏——数据结构学习⭐ 💫点击关注🤩一起学习C语言💯💫 目录 导读:一、 栈1. 栈的概念及结构2. 栈的实现3. 实现代码3.1 定义结构体3.2 初始化栈3.3 销毁栈3.4 入栈3.5 出栈…

Rust生态系统:探索常用的库和框架

大家好!我是lincyang。 今天我们来探索Rust的生态系统,特别是其中的一些常用库和框架。 Rust生态系统虽然相比于一些更成熟的语言还在成长阶段,但已经有很多强大的工具和库支持各种应用的开发。 常用的Rust库和框架 Serde:一个…

python pymodbus库使用教程(以Modbus RTU为例)

文档: https://pymodbus.readthedocs.io/en/latest/ 源码: https://github.com/riptideio/pymodbus/ 文章目录 Python PyModbus库使用教程:以Modbus RTU为例介绍安装PyModbus配置串行连接导入必要的模块创建Modbus客户端实例 建立连接连接…