【总结】ui自动化selenium知识点总结

1. 大致原理

首页安装第三方库selenium库，

其次要下载好浏览器驱动文件，比如谷歌的 chromedriver.exe，配置上环境变量。

使用selenium的webdriver类去创建一个浏览器驱动对象赋值叫driver，一个浏览器驱动对象就可以

实现对浏览器得操作
页面元素的定位
和元素的操作

（原理：代码--->发送http请求-----> 到了真正的浏览器驱动中的http server----->浏览器才执行步骤）

from selenium import webdriver
driver = webdriver.Chrome()

2. 浏览器

浏览器的操作

比如 get 访问网页、close关闭当前页、quit离开整个浏览器
set_window_size设置窗口大小(最大化maximize_window()，最小化minimize_window)、
页面前进后退刷新等，# .forward() .back() .refresh()
浏览器标签页（窗口）的切换用到 swith_to.window(handle)
- 再结合.window_handles获取句柄列表 [ ]
- 常见用法 1，使用索引-1，打开最新的标签页。 handles_list = driver.window_handles driver.switch_to.window(handles_list[-1]) # 切换到最后一个 handles
- 常见用法 2，遍历switch_to 到每个一个handle上，使用title来判断是否break，这样就到了想去的页面代码用法
浏览器的滚动条也是能控制上下滚动： driver.excute_script() 可以用户js语句实现任意页面上的操作，
- 滚动条--"window.scrollTo(0,10000)" # 0表示向右移动 0
- 比如一个日期控件的元素是有readonly属性，不能输入值，就可以写个js语句把它去掉。js="document.getElementById(id值').removeAttribute('readonly')"
  - 滚动到指定元素可见(方式2)
  - document.getElementById('password').type="text" # 修改元素属性
save_screenshot('./window.png') 保存【整屏截图】（尺寸打开是多大就截多大） element.screenshot('./ele.png') 元素截图
- 或保存【整屏截图】 .get_screenshot_as_file("./all.png") (源码中，save_screentshot 就用的它)

（截全屏，和元素截图的另一种方式）

# 屏幕截图另一个格式
get_screenshot_as_png 这个是不带文件参数的，就需要用with open 来创建
with open('window1.png','wb') as f:f.write(driver.get_screenshot_as_png())# 元素截图另一种格式
另外元素截图还可以用这种，也是也是需要用with open打开
with open('code.png','wb') as f:f.write(ele_code.screenshot_as_png)			# 把图片变成字节流的数据# 补充知识（OCR识别）：
ele_bytes = ele_code.screenshot_as_png
import ddddocr					# pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple/
ocr=ddddocr.DdddOcr(show_ad=False)			# 参数表示去掉广告
text = ocr.classification(ele_bytes)		# 提取文本信息或者 
with open('xxx.png' ,'rb') as f:			# r表示读，  b表示二进制  也是字节流的数据data = f.read()

截图可以使用的地方：可以用来截取验证码，然后ocr识别图片上的文本

浏览器的获取

driver.get_cookies() (需要手动登录一次),遍历得到的cookie列表，然后dirver.add_cookie（i）, 就可以实现绕过登录
driver.current_url 获取当前url
driver.title 获取标题
driver.get_window_size() 获取浏览器尺寸 --得到的是字典格式{'width': 945, 'height': 1020}
driver.current_window_handle driver.window_handles 结合swith_to_window 来使用

3. 元素定位与操作

元素定位

我一般选择使用css定位，像 id，name，classname，tag_name这些底层都是通过css来定位的
而且css定位比较方便，可以用
- 标签选择器，和 #id值 .class值
- 属性选择器，（可以属性等于某个值，属性以某个值开头，或包含某个值）
- 路径选择器，(比如空格表示，后代， > 表示找儿子)
- 伪类选择器（比如:ntrh-child(n)）
如果要根据某个元素的文本值来定位，或者要根据一个标签多个属性值组合判断，我就会用到xpath定位，
- //*[text(),"文本"] //*[contains(text(),"文本")] （这种方式也能代替link_text）
- //*[@id="id1",@class="class1"]
其他： find_element 是找一个元素， find_elements, 是把能找到的装到列表里面，找不到也不会报错，是返回空列表

driver.find_element(By.CSS_SELECTOR,'#multiSelect')

8种定位方式，面试前背背就行。。

页面F12，可以ctrl F进行搜索

下图也是不用专门背

Xpath定位（这两种要用的）：

//*[text(),"文本"] //*[contains(text(),"文本")]

//input[@id='kw' and @class]

元素操作

按钮、输入框（单选框）代码举例

常用的点击click、输入文字send_keys（补充：追加写入）、清空文字clear、submit，get_attribute() 获取属性，.tag_name .text 坐标尺寸 .location .size， .rect更准的坐标尺寸等

多选框代码举例

需要用 is_selected() 是否选中判断多选框是否选中（bool），然后click （is_displayed() 是否可见有hidden属性的 is_enabled() 是否可用有disabled属性的）

例： se = ele.is_selected() if se: print("已经被选中")

特殊一点的1： select元素下拉框的选择代码举例

方式1（只适用于select标签）：

先实例化一个选择对象， select = Select （ele） # 参数为元素对象
- select_by_index
- select_by_value
- select_by_visible_text
- deselect_all() 反选

方式2(div的下拉选择，或者select都行)
- 直接用send_keys("某个值") --- 定位到選項标签
- 或者直接click --- 定位到其中的一项

特殊一点的2： alert警告框的处理

警告框出来后，首先要driver.switch_to点alert

点accept() , 确认
点dismiss(), 取消
点send_keys(), 输入
或者点text 不要（）

键盘操作元素

记住是通过send_keys，完成的就行了，然后传入键盘的值，用的少，也没难度，用时查

如：对【提交按钮】元素进行，回车键

对【输入框】元素进行，ctrl A, ctrl C V 等, (Keys.键*数字) 表示多次操作如回退 Keys.BACKSPACE*2 等

如下图，是百度提交

鼠标操作代码笔记

从selenium引入ActionChains类，然后action = ActionChains（driver）实例化一个action对象

from selenium.webdriver import ActionChains

练习地址：https://sahitest.com/demo/

ActionChains(driver).动作1.动作2.perform() 它是一个链式调用

拖动滑块也能实现 drag_and_drop_by_offset（ele，向右的x，向下的y））

ui自动化需掌握的知识点还有：

嵌套网页

遇到有 iframe的元素嵌套网页，需要先先使用到 switch_to点frame（iframe元素de定位），切换到对应frame，才能进行元素操作，

另外它还有返回上层页面，和默认地方的操作（百度下）

driver.switch_to.frame(ele), # 参数除了是元素定位ele，还可以是 id name，或者通过索引号
driver.switch_to.parent_frame() 返回上一层
driver.switch_to.default_content() 调回最外层

文件上传代码演示

http://42.192.62.186:8088/index.html#/home 账号密码： sq3 123 万能验证码：999999

普通的input框，直接用send_keys，传图片路径

非input框，用python第三方库，pypiwin32 或者 pyautogui 结合pyperclip

ui自动化其他必备知识点

隐式等待和显示等待代码演示

隐式等待

driver.implicitly_wait(30) 可以设置一个最大等待时间，等页面加载完，才会去执行后面的找元素。不然加载没出来，就找元素，会报错。

比如在渲染页面时，如果不等待直接去找，会找不到。

显示等待

找一种元素时，可以不停的找，直到它可见，就找到。

它的逻辑有点像下面这种（轮询去找，最后超过时间就不等了）

导入一个等待条件（直接出现，或者直接可见），和一个webDriverWait类。

小补充：

元素ele点location_once_scrolled_into_view等滚动到可见----
1. 如例子：https://www.runoob.com/ 页面下放的元素
ele.value_of_css_property('color') 获取CSS属性值
元素上找元素（第4课，2节）
冻屏操作（针对那种不好定位元素）---自己百度，如：百度输入框，输入了学习两个字，弹窗上面的元素不好捕获
setTimeout(()=>{debugger;},5000) 表示5秒后debugger. 就可以先在consloe里输入，回车，然后去页面上操作，让页面挺住就可以操作

滚动到可见代码和获取css属性值的例子

from selenium import webdriver
from time import sleep
from selenium.webdriver.common.by import By
driver = webdriver.Chrome()
driver.get('https://www.runoob.com/')
sleep(2)
#打开了人看不到，但是网页这个树加载好了，这个元素可能就可以操作
# driver.find_element_by_xpath("//h4[contains(text(),'【网站主机教程】')]").click()ele_host = driver.find_element(By.XPATH,"//h4[contains(text(),'【网站主机教程】')]")
ele_host.location_once_scrolled_into_view       # 报黄，但是不影响，  滚动条会自动下去
print(ele_host.value_of_css_property('color'))  #rgba(100, 133, 76, 1)

元素上找元素

http://42.192.62.186:8088/index.html#/demo/13

'''
知识点:webelement的find_element_xxxx方法
'''
from selenium import webdriver
import time
driver = webdriver.Chrome()
from selenium.webdriver.common.by import By
driver.implicitly_wait(5)
driver.get("http://42.192.62.186:8088/index.html#/")
driver.maximize_window()
# 账号密码
driver.find_element(By.CSS_SELECTOR, '#username').send_keys('sq3')
driver.find_element(By.CSS_SELECTOR, '#password').send_keys('123')
driver.find_element(By.CSS_SELECTOR, '#code').send_keys('999999')driver.find_element(By.CSS_SELECTOR, "#submitButton").click()
time.sleep(1)
driver.refresh()
time.sleep(1)
driver.find_element(By.XPATH, "//span[contains(text(),'按钮')]").click()
driver.find_element(By.XPATH, "//li[contains(text(),'下拉框')]").click()# 方式1 ，点击选项
driver.find_element(By.XPATH, "//*[contains(text(),'3C数码')]").click()
time.sleep(3)
# 方式1 ，CSS定位
driver.find_element(By.CSS_SELECTOR, "#categoryId > option:nth-child(3)").click()time.sleep(3)
# 方式2，在下拉框上， 再找
"""元素上找元素  （分布找--------代码封装时有用）,  缩小范围找"""
driver.find_element(By.ID, 'categoryId').find_elements(By.TAG_NAME, 'option')[5].click()
#找到id=categoryId的元素，在它下面找标签为option的元素