一文速学-selenium高阶操作连接已存在浏览器

前言

不得不说selenium不仅在自动化测试作为不可或缺的工具,在数据获取方面也是十分好用,能够十分快速的见到效果,这都取决于selenium框架的足够的灵活性,甚至在一些基于web端的自动化办公都十分有效。

通过selenium连接已经存在数据存储的浏览器,可以通过这种方式绕过短期内无法解决的验证码的识别,也可以绕过大部分网页保护措施。那么现在就来看看我们如何实现。

启动浏览器

首先我们要了解浏览器存储了多种内容,其中一些可以在不同网站或网页之间共享,而其他一些则受限于特定的域或浏览器安全策略。

1.Cookies

想象 Cookies 像是酒店的门房,每当你进出酒店(即网站)时,门房都会记住你(存储信息)。他们在你每次访问时识别你,并记住你的偏好(如房间偏好)。但门房的记忆空间很小,只能记住一些基本信息。同时,门房每次见到你都会提醒酒店你的偏好(Cookies 随着每次 HTTP 请求发送到服务器)。

Cookies存储十分重要,Cookies网站为了记录用户信息(如登录状态、用户偏好设置等)而存储在用户本地的小型数据片段。通常只能被设置它们的那个网站访问。不过,有些 cookies(如第三方 cookies)可能被多个网站共享,用于跟踪用户在不同网站的行为。具体介绍在博主前篇文章有详细介绍,有兴趣的请去阅读,这里暂不展开。

2. Local Storage

Local Storage 像是你在酒店房间内的保险箱。它可以存储更多的东西,只要你不清空保险箱或离开酒店(关闭浏览器),你的物品就一直安全地存放在那里。这些物品只属于这个房间,换到别的房间(另一个网站或浏览器标签)时,就无法访问这些物品了。

Local Storage 是一种允许网站在用户的浏览器上存储数据的机制。它是 HTML5 Web Storage API 的一部分,旨在克服传统的 cookie 存储的限制,提供了一种更加安全和高效的方式来存储数据。

  • 容量限制:与 cookies 相比,Local Storage 提供更大的存储空间(通常至少 5MB)。

  • 生命周期:Local Storage 中的数据没有过期时间,数据会一直存在直到被显式清除,无论浏览器窗口或标签页是否关闭。

  • 域限制:数据存储是基于域名的。一个网站只能访问它自己设置的数据,无法访问其他网站的 Local Storage。

  • 同源策略:遵循同源策略,即协议、域名和端口号都必须与存储数据的原始网站一致。

虽然 Local Storage 提供的存储空间比 cookies 多,但它仍有限制(一般为 5-10 MB),并且不同浏览器可能有所不同。数据在不同的浏览器会话间是持久的,但它不适用于跨浏览器的数据共享。Local Storage 存储的数据不会随着 HTTP 请求被发送,这有助于提高安全性。但它仍然是存储在客户端,因此不应该用来存储敏感信息。几乎所有现代浏览器都支持 Local Storage,包括移动端浏览器。

3.Session Storage

Session Storage 是 Web Storage API 的一部分,它提供了一种在用户浏览器上存储数据的机制。与 Local Storage 类似,Session Storage 用于存储键值对数据,但它的生命周期和作用域与 Local Storage 有所不同。

  • 生命周期:Session Storage 中的数据只在当前浏览器会话期间有效。一旦浏览器窗口或标签页被关闭,存储的数据就会被清除。

  • 存储容量:和 Local Storage 一样,Session Storage 提供较大的存储容量(通常至少 5MB),远大于 cookies。

  • 作用域:数据存储在特定的窗口或标签页内,即使是相同的网站,在不同的标签页或窗口中的 Session Storage 也是独立的。

  • 同源策略:Session Storage 遵守同源策略,即协议、域名和端口号都必须与存储数据的原始网站一致。

三者比较起来:

  • Cookies:有限的存储空间,每次与服务器交互时都会被发送,适合存储需要服务器知道的信息。

  • Local Storage:较大的存储空间,仅在客户端保存,适合存储不需要经常变更的本地数据。

  • Session Storage:存储空间适中,但数据仅在单个会话中有效,适合临时存储敏感操

所以当我们连接到已经有数据存储的浏览器和新创建的浏览器,区别主要就在于这些已经存储好了的数据,了解这些我们就知道为什么我们在已经存储的浏览器访问之前已经登录过的网址是不需要再输入密码验证了的。

我们一般启动浏览器都是双击快捷方式,其实这就是一种指令的运行方式。我们可以打开我们的快捷方式,点击属性查看:

我们在终端输入这条指令起到的效果是一样的:

大家可以尝试,所以我们启动浏览器的方式有很多种,我们可以启动FirFox的时候开启Marionette 服务。Marionette 是用于远程控制 Firefox 的协议和接口,经常用于浏览器的自动化测试。Chorm也是一样,不过二者参数名称不同。通过以下这段代码可以实验:

!"D:\Mozilla Firefox\firefox.exe"  --marionette --marionette-port 2828

指定了 2828为Marionette 服务监听的端口号,然后我们要让geckodriver.exe也就是火狐的驱动连接到该端口:

geckodriver.exe --connect-existing --marionette-port 2828

我们还可以在终端输入指令

netstat -ano|findstr "4444"

可以看到我们监听的端口:

接下来我们就可以通过selenium来连接这个端口了,这里需要注意的是selenium版本的问题,Selenium 3.x 可能不支持连接到已经打开的浏览器实例。这个功能主要在 Selenium 4.x 中通过对 Service 类的使用而得到支持。但是3.x的谷歌浏览器可以做到,火狐是做不到的。Marionette驱动程序不再适用于FF版本53和Selenium 3.5或更高版本,如果selenium高于这个版本可以用谷歌浏览器,不然会出现selenium.common.exceptions.TimeoutException: Message: 由于目标计算机积极拒绝,无法连接。 (os error 10061)错误。

谷歌浏览器指令为:

"chrome.exe" --remote-debugging-port=9222 --user-data-dir="user_path"

一定要指定存储浏览器数据的目录"user_path",端口默认为9222。

链接浏览器

1.谷歌浏览器

如果是谷歌浏览器开放的端口的话:

from selenium import webdriver
from selenium.webdriver.chrome.options import Optionsoptions = Options()
options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")# 确保您的 chromedriver 路径是正确的
driver = webdriver.Chrome( options=options)

 

连接完毕后就可以自行操作了。

2.火狐浏览器

from selenium import webdriver
from selenium.webdriver.firefox.options import Options# 创建一个新的Firefox选项对象
options = Options()# 连接到已经存在的Firefox实例
driver = webdriver.Remote(command_executor="http://localhost:4444", options=options)

如果火狐出现问题多半是你selenium的版本不匹配,看我上一节点的末尾,有写清楚情况。那么以上基本就可以实现了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/250548.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

幻兽帕鲁能在Mac上运行吗?幻兽帕鲁Palworld新手攻略

幻兽帕鲁能在Mac上运行吗? 《幻兽帕鲁》目前还未正式登陆Mac平台,不过通过一些方法是可以让游戏在该平台运行的。 虽然游戏不能在最高配置下运行,但如果你安装了CrossOver这个软件,就可以玩了。这是为Mac、Linux和ChromeOS等设计…

oracle19C 密码包含特殊字符@ 导致ORA-12154

oracle 19C 密码包含特殊字符 出现登录失败,针对此问题一次说个明白 ORA-12154: TNS:could not resolve the connect identifier specified Oracle 19c之前密码是可以包含特殊字符,但是如果包含特殊字符需要双引号 比如oracle11g 正常 如果密码包含特殊…

MongoDB从入门到实战之MongoDB快速入门

前言 上一章节主要概述了MongoDB的优劣势、应用场景和发展史。这一章节将快速的概述一下MongoDB的基本概念,带领大家快速入门MongoDB这个文档型的NoSQL数据库。 MongoDB从入门到实战的相关教程 MongoDB从入门到实战之MongoDB简介👉 MongoDB从入门到实战…

大数据本地环境搭建03-Spark搭建

需要提前部署好 Zookeeper/Hadoop/Hive 环境 1 Local模式 1.1 上传压缩包 下载链接 链接:https://pan.baidu.com/s/1rLq39ddxh7np7JKiuRAhDA?pwde20h 提取码:e20h 将spark-3.1.2-bin-hadoop3.2.tar.gz压缩包到node1下的/export/server目录 1.2 解压压…

数据结构——实验01-线性表的链式存储和操作

一、实验内容 二、算法思想与算法实现 1、解题思想 (1)逆序创建链表La就是使用头插法创建一个链表,所谓头插法就是在创建链表时始终将新元素插入到头结点之后,而正序创建链表Lb就是使用尾插法创建一个链表,所谓尾插法…

Pycharm python用matplotlib 3D绘图显示空白解决办法

问题原因: matplotlib版本升级之后显示代码变了,修改为新的 # ax Axes3D(fig) # 原代码 ax fig.add_axes(Axes3D(fig)) # 新代码import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot3d import Ax…

五大架构风格之一:数据流风格

数据流风格详细介绍 系统架构数据流风格是一种软件体系结构风格,它强调了系统内部不同部分之间的数据流动。这种风格侧重于描述系统中的数据处理过程,以及数据是如何从一个组件传递到另一个组件的。以下是系统架构数据流风格的详细介绍: 1 基…

Hadoop:HDFS学习巩固——基础习题及编程实战

一 HDFS 选择题 1.对HDFS通信协议的理解错误的是? A.客户端与数据节点的交互是通过RPC(Remote Procedure Call)来实现的 B.HDFS通信协议都是构建在IoT协议基础之上的 C.名称节点和数据节点之间则使用数据节点协议进行交互 D.客户端通过一…

代码随想录算法训练营29期Day41|LeetCode 343,96

文档讲解:整数拆分 不同的二叉搜索树 343.整数拆分 题目链接:https://leetcode.cn/problems/integer-break/description/ 思路: 题目要求我们拆分n,拆成k个数使其乘积和最大,然而题目中并没有给出k,所以…

影院购票|电影院订票选座小程序|基于微信小程序的电影院购票系统设计与实现(源码+数据库+文档)

电影院订票选座小程序目录 目录 基于微信小程序的电影院购票系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、用户功能实现 2、管理员功能实现 (1)影院信息管理 (2)电影信息管理 (3)已…

算法学习——华为机考题库6(HJ36 - HJ40)

算法学习——华为机考题库6(HJ36 - HJ40) HJ36 字符串加密 描述 有一种技巧可以对数据进行加密,它使用一个单词作为它的密匙。下面是它的工作原理:首先,选择一个单词作为密匙,如TRAILBLAZERS。如果单词中…

链表——C语言——day17

链表 链表是一种常见的重要的数据结构。它是动态地进行存储分配的一种结构。在用数组存放数据时,必须事先定义固定的长度(即元素个数)。链表则没有这种缺点,它根据需要开辟内存单元。 链表有一个“头指针“变量,图中…

kubekey网页版安装k8s集群操作流程

kubekey可以一键拉起k8s集群并完成kubesphere的部署,以后kubekey简称kk。kk 3.2版本以前都是在宿主机上完成对应的创建集群、添加节点、升级等操作的,3.2版本后开始往页面操作的方向演进,kk 3.2版本现在还是alpha,所以不推荐在生产…

fastadmin后台自定义按钮和弹窗

工具栏自定义按钮-ajax请求 前端代码 1.在对应模块的模板文件index.html添加自定义按钮&#xff0c;注意按钮要添加id以绑定点击事件 <div class"panel panel-default panel-intro">{:build_heading()}<div class"panel-body"><div id&qu…

STM32通用定时器、计数器

时间记录&#xff1a;2024/1/30 一、时钟介绍&#xff08;TIM2-TIM5&#xff09; &#xff08;1&#xff09;通用定时器时钟频率介绍 内部时钟AHB为72MHz&#xff0c;经过APB1预分频器2分频变为36MHz&#xff0c;TIMxClk定时器时钟由时钟树可以看出&#xff0c;如果APB1预分…

C#,雅各布斯塔尔—卢卡斯(Jacobsthal Lucas Number)的算法与源代码

1 雅各布斯塔尔序列 雅各布斯塔尔序列是一个与斐波那契序列类似的加法序列&#xff0c;由递归关系JnJn-12Jn-2定义&#xff0c;初始项J00&#xff0c;J11。序列中的一个数字称为雅可布沙尔数。它们是卢卡斯序列Un&#xff08;P&#xff0c;Q&#xff09;的一种特殊类型&#x…

微软Office Plus与WPS Office的较量:办公软件市场将迎来巨变?

微软Office Plus在功能表现上远超WPS Office&#xff1f; 微软出品的Office套件实力强劲&#xff0c;其不仅在办公场景中扮演着不可或缺的角色&#xff0c;为用户带来高效便捷的体验&#xff0c;而且在娱乐生活管理等多元领域中同样展现出了卓越的应用价值 作为中国本土办公软…

IO多路复用机制——select、poll、epoll的原理和区别

select&#xff0c;poll&#xff0c;epoll都是IO多路复用的机制。I/O多路复用就通过一种机制&#xff0c;可以监视多个描述符&#xff0c;一旦某个描述符就绪&#xff08;一般是读就绪或者写就绪&#xff09;&#xff0c;能够通知程序进行相应的读写操作。但select&#xff0c;…

西瓜书学习笔记——k近邻学习(公式推导+举例应用)

文章目录 算法介绍实验分析 算法介绍 K最近邻&#xff08;K-Nearest Neighbors&#xff0c;KNN&#xff09;是一种常用的监督学习算法&#xff0c;用于分类和回归任务。该算法基于一个简单的思想&#xff1a;如果一个样本在特征空间中的 k k k个最近邻居中的大多数属于某个类别…

使用ngrok内网穿透

没有服务器和公网IP&#xff0c;想要其他人访问自己做好的网站&#xff0c;使用这款简单免费的内网穿透小工具——ngrok&#xff0c;有了它轻松让别人访问你的项目~ 一、下载ngrok 官网地址&#xff1a;ngrok | Unified Application Delivery Platform for Developers&#x…