接上,之前做的问卷星刷问卷的功能单一,每个题目只能选一个选项。现在的3.0版本功能增加了计数器(刷了几份问卷)、多选项的选择、通过滑块验证。想要了解之前的相关信息请看下面的链接:
隔壁寝室刷问卷刷疯了,我们寝室则相反,打游戏的同时问卷份数也在增加,隔壁寝室的人投来羡慕的目光,向我要代码!!
python基础知识------生成多个随机数
本篇文章将会将该程序拆分成代码块逐一讲解其功能。
注意:经过本人测试,刷问卷,一次只能刷51份,第52次运行程序时,会出现滑动验证,即使程序中写了过滑动验证的相关代码并且成功通过了滑动滑块,但是问卷星会重新弹出是否进行验证,然后又重新弹出滑动验证码。手动滑动,接下来会进行以上的循环。关闭浏览器,问卷星份数并未增加。
所以即使增加了滑动验证码的代码,其结果还是只能在短期内刷51份。当然,当出现滑动验证码时,只要暂停程序,过一个小时(具体时间未测量)后又能重新开始刷了。如有不同想法和测试结果,请指正。
目录
一、模块导入
二、代码块的解析
1.生成多选题不重复的随机选项
2.计数器(记录运行次数)
3.伪装selenium
4.滑动验证码---滑动距离
5.滑动验证码---滑动滑块
6.定时运行程序
7.run()函数的编写
三、源代码及结果展示
四、总结
一、模块导入
import random
from selenium import webdriver
import time
from selenium.webdriver import ActionChains
import schedule as schedule
二、代码块的解析
1.生成多选题不重复的随机选项
# 多选题的多个选项
def int_random(m, n, o):p = []while len(p) < o:new_int = random.randint(m, n)if (new_int not in p):p.append(new_int)else:passreturn p
该代码实现的功能是生成m到n之间的o个不重复的数字,可用于多选题随机选项的选择,详细内容请看我之前的博文
python基础知识------生成多个随机数
2.计数器(记录运行次数)
# 计数器
count = 0
def sum():global countcount += 1w = print("第{}次运行".format(count))return w
这里的global的用法是在局部函数中对全局变量重新赋值,这样就起到了每运行一次程序,计数器计数的功能。
3.伪装selenium
url = 'https://www.wjx.cn/vm/maBODlH.aspx'# 躲避智能检测option = webdriver.ChromeOptions()option.add_experimental_option('excludeSwitches', ['enable-automation'])option.add_experimental_option('useAutomationExtension', False)driver = webdriver.Chrome(options=option)driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': 'Object.defineProperty(navigator, "webdriver", {get: () => undefined})'})driver.get(url)
该代码在之前的博文中讲过具体原因
隔壁寝室刷问卷刷疯了,我们寝室则相反,打游戏的同时问卷份数也在增加,隔壁寝室的人投来羡慕的目光,向我要代码!!
4.滑动验证码---滑动距离
def get_track(distance): # distance为传入的总距离# 移动轨迹track = []# 当前位移current = 0# 计算间隔t = 0.2# 初速度v = 0while current < distance:# 加速度a = 50v0 = v# 当前速度v = v0 + a * t# 移动距离# move = v0 * t + 1 / 2 * a * t * tmove = v0 * t + a * t# 当前位移current += move# 加入轨迹track.append(round(move))return track # track列表 返回的是整个滑动条的多个焦点,可以模拟鼠标的缓慢滑动
首先该代码返回的是track列表(其中包含了移动的轨迹),定义当前位移current=0,时间间隔t=0.2,初始速度v=0,接下来通过判断语句,判断当前距离是否小于你所输入的总距离,如果成立,则通过物理的知识,通过加速度a,速度v计算位移,然后将它加到current中。
注:这里的a、t、v都可以自定义,甚至我连move = v0 * t + 1 / 2 * a * t * t这个公式也更改了。
因为python自动化讲究效率,速度很关键,而且对于这类简单的滑动验证,不用那些先加速后减速的套路,所以只需要一直加速即可。
5.滑动验证码---滑动滑块
def move_to_gap(slider, tracks): # slider是要移动的滑块,tracks是要传入的移动轨迹ActionChains(driver).click_and_hold(slider).perform()for x in tracks:ActionChains(driver).move_by_offset(xoffset=x, yoffset=0).perform()time.sleep(0.1)ActionChains(driver).release().perform()
①ActionChains(driver).click_and_hold(slider).perform()中
click_and_hold(slider)---点击鼠标左键,不松开,其中slider为需要定位要移动的滑块
(例如huakuai = driver.find_element_by_css_selector('#nc_1_n1z'))
perform()---执行该动作;
②接下来遍历tracks
ActionChains(driver).move_by_offset(xoffset=x, yoffset=0).perform()中
move_by_offset(xoffset=x, yoffset=0)---鼠标向右移动x的px
③ActionChains(driver).release().perform()中
release()---释放
注:4和5一般在一起使用
6.定时运行程序
def run():passschedule.every(5).seconds.do(run)while True:schedule.run_pending()
run()函数为主函数,通过schedule实现每隔5秒运行一次程序
7.run()函数的编写
代码如下
def run():global driverurl = 'https://www.wjx.cn/vm/maBODlH.aspx'# 躲避智能检测option = webdriver.ChromeOptions()option.add_experimental_option('excludeSwitches', ['enable-automation'])option.add_experimental_option('useAutomationExtension', False)driver = webdriver.Chrome(options=option)driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': 'Object.defineProperty(navigator, "webdriver", {get: () => undefined})'})driver.get(url)sum()# 总共有13个题目i = 1while i <= 13:base_xpath1 = '//*[@id="div{}"]'.format(i)base_xpath2 = base_xpath1 + '/div[2]/div'a = driver.find_elements_by_xpath(base_xpath2)# print(len(a))# 在选项个数范围内,随机生成一个数字 如有四个选项,随机生成数字3b = random.randint(1, len(a))# print(b)# 通过随机数字,点击该数字的选项# time.sleep(1)# 当第六个问题回答第四个选项(其他)时,需要填写if i == 6 and b == 4:driver.find_element_by_css_selector('#div{} > div.ui-controlgroup > div:nth-child({})'.format(i, b)).click()# time.sleep(1)# 这里你可以每隔一段时间更改send_keys中的内容,也可以将答案写出来,然后随机选择哪个选项driver.find_element_by_css_selector('#tqq6_4').send_keys('QQ群和微信群')elif i == 5 or i == 7 or i == 8 or i == 11:q = int_random(1, len(a), b)# sort函数表示将列表排序,如果未加参数表示从小到大排列q.sort()for r in q:driver.find_element_by_css_selector('#div{} > div.ui-controlgroup > div:nth-child({})'.format(i, r)).click()# time.sleep(0.5)else:driver.find_element_by_css_selector('#div{} > div.ui-controlgroup > div:nth-child({})'.format(i, b)).click()# 当第三个问题答案是是时,跳到5if i == 3 and b == 1:i = 5else:i += 1
# # 点击提交按钮time.sleep(0.5)driver.find_element_by_xpath('//*[@id="ctlNext"]').click()# 出现点击验证码验证time.sleep(1)driver.find_element_by_xpath('//*[@id="alert_box"]/div[2]/div[2]/button').click()time.sleep(0.5)driver.find_element_by_xpath('//*[@id="rectMask"]').click()time.sleep(4)try:huakuai = driver.find_element_by_css_selector('#nc_1_n1z')move_to_gap(huakuai, get_track(328))except:passfinally:# 关闭页面handles = driver.window_handlesdriver.switch_to.window(handles[0])time.sleep(0.5)# 刷新页面(可要可不要)# driver.refresh()# 关闭当前页面,如果只有一个页面,则也关闭浏览器driver.close()
这里面的代码需要你根据具体问卷星的内容进行改写。
问卷星问卷的网址为浙水院经管学院2020级大学生勤工俭学和兼职问题调查【复制】,大家可以自己查看一下问卷星问卷内容,对于该问卷
①首先,题目为13个,所以判断条件为i <= 13,
②len(a)为选项的个数,b为在选项个数内随机生成整数
③如果第六个问题,随机数b为4时,则还要填写文本内容;
④如果是第5、7、8、11个问题,则调用上面1.生成多选题不重复的随机选项的函数,再通过sort()函数将列表从小到大排列(这一过程可省略),最后遍历该列表,选择里面生成的随机选项。
⑤剩下的就是单选题了,这个比较简单
⑥对于那些隐藏的题目,即当且仅当选择了前面某题的某选项才出现时,需要重新在if语句中写,
并且该if语句要放在所以if语句的最后,因为这个if中含有i,如果放前面会因为i提前变化,导致找不到相关内容,最终报错。
写好这些以后,就开始点击提交问卷按钮,并开始进行验证了。刷问卷选项时可以不设间隔时间,但是以下的操作就需要足够时间,需要用到time.sleep(),不然会使得刷问卷失败。所以刷问卷所需时长主要花在验证这里。
⑦
try:huakuai = driver.find_element_by_css_selector('#nc_1_n1z')move_to_gap(huakuai, get_track(328))except:passfinally:# 关闭页面handles = driver.window_handlesdriver.switch_to.window(handles[0])time.sleep(0.5)# 刷新页面(可能不需要)# driver.refresh()# 关闭当前页面,如果只有一个页面,则也关闭浏览器driver.close()
该代码段表示,先执行try代码块,如果发现错误,则执行except代码块,finally表示不管代码会不会报错,都会执行finally代码块。
在本代码中,前51次不会出现滑块验证,因此执行try代码块时本应该会报错,但是我们将except段pass,使得代码不会报错,最终不管代码是否会报错,都会执行finally代码块。
当然,如上所说,即使过了滑动验证,还是会重新弹出滑动验证,导致无法提交,份数也不会增加,所以我们可以不用在代码中加入这段。
# 点击提交按钮time.sleep(0.5)driver.find_element_by_xpath('//*[@id="ctlNext"]').click()# 出现点击验证码验证time.sleep(1)driver.find_element_by_xpath('//*[@id="alert_box"]/div[2]/div[2]/button').click()time.sleep(0.5)driver.find_element_by_xpath('//*[@id="rectMask"]').click()time.sleep(4)# 关闭页面handles = driver.window_handlesdriver.switch_to.window(handles[0])time.sleep(1)# 刷新页面(可能不需要)# driver.refresh()# 关闭当前页面,如果只有一个页面,则也关闭浏览器driver.close()
所以也不需要用到
get_track(distance)和move_to_gap(slider, tracks)这两个函数。
三、源代码及结果展示
# -*- coding: utf-8-*-
import random
from selenium import webdriver
import time
from selenium.webdriver import ActionChains
import schedule as schedule
# 多选题的多个选项
def int_random(m, n, o):p = []while len(p) < o:new_int = random.randint(m, n)if (new_int not in p):p.append(new_int)else:passreturn p
# 计数器
count = 0
def sum():global countcount += 1w = print("第{}次运行".format(count))return wdef get_track(distance): # distance为传入的总距离# 移动轨迹track = []# 当前位移current = 0# 计算间隔t = 0.2# 初速度v = 0while current < distance:a = 50v0 = v# 当前速度v = v0 + a * t# 移动距离# move = v0 * t + 1 / 2 * a * t * tmove = v0 * t + a * t# 当前位移current += move# 加入轨迹track.append(round(move))return track # list 返回的是整个滑动条的多个焦点,可以模拟鼠标的缓慢滑动def move_to_gap(slider, tracks): # slider是要移动的滑块,tracks是要传入的移动轨迹ActionChains(driver).click_and_hold(slider).perform()for x in tracks:ActionChains(driver).move_by_offset(xoffset=x, yoffset=0).perform()time.sleep(0.1)ActionChains(driver).release().perform()def run():global driverurl = 'https://www.wjx.cn/vm/maBODlH.aspx'# 躲避智能检测option = webdriver.ChromeOptions()option.add_experimental_option('excludeSwitches', ['enable-automation'])option.add_experimental_option('useAutomationExtension', False)driver = webdriver.Chrome(options=option)driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument', {'source': 'Object.defineProperty(navigator, "webdriver", {get: () => undefined})'})driver.get(url)sum()# 总共有13个题目i = 1while i <= 13:base_xpath1 = '//*[@id="div{}"]'.format(i)base_xpath2 = base_xpath1 + '/div[2]/div'a = driver.find_elements_by_xpath(base_xpath2)# print(len(a))# 在选项个数范围内,随机生成一个数字 如有四个选项,随机生成数字3b = random.randint(1, len(a))# print(b)# 通过随机数字,点击该数字的选项# time.sleep(1)# 当第六个问题回答第四个选项(其他)时,需要填写if i == 6 and b == 4:driver.find_element_by_css_selector('#div{} > div.ui-controlgroup > div:nth-child({})'.format(i, b)).click()# time.sleep(1)# 这里你可以每隔一段时间更改send_keys中的内容,也可以将答案写出来,然后随机选择哪个选项driver.find_element_by_css_selector('#tqq6_4').send_keys('QQ群和微信群')elif i == 5 or i == 7 or i == 8 or i == 11:q = int_random(1, len(a), b)# sort函数表示将列表排序,如果未加参数表示从小到大排列q.sort()for r in q:driver.find_element_by_css_selector('#div{} > div.ui-controlgroup > div:nth-child({})'.format(i, r)).click()# time.sleep(0.5)else:driver.find_element_by_css_selector('#div{} > div.ui-controlgroup > div:nth-child({})'.format(i, b)).click()# 当第三个问题答案是是时,跳到5if i == 3 and b == 1:i = 5else:i += 1
# # 点击提交按钮time.sleep(0.5)driver.find_element_by_xpath('//*[@id="ctlNext"]').click()# 出现点击验证码验证time.sleep(1)driver.find_element_by_xpath('//*[@id="alert_box"]/div[2]/div[2]/button').click()time.sleep(0.5)driver.find_element_by_xpath('//*[@id="rectMask"]').click()time.sleep(4)try:huakuai = driver.find_element_by_css_selector('#nc_1_n1z')move_to_gap(huakuai, get_track(328))except:passfinally:# 关闭页面handles = driver.window_handlesdriver.switch_to.window(handles[0])time.sleep(0.5)# 刷新页面(可能不需要)# driver.refresh()# 关闭当前页面,如果只有一个页面,则也关闭浏览器driver.close()schedule.every(1).seconds.do(run)while True:schedule.run_pending()
该结果刷的是另外一份问卷
四、总结
在发这篇博文之前,我已经帮三个人刷过问卷了,每一种问卷内容都不一样,run()函数需要自己写。
其中有些问卷非常复杂(如下),你需要花时间了解问卷,然后再写程序
现在,问卷星自动化刷问卷3.0版本已经完结,如果有其他想法的,欢迎和我交流,如果上述有误的,请指正!!