Python爬虫(二十三)_selenium案例：动态模拟页面点击

Python爬虫(二十三)_selenium案例：动态模拟页面点击

news/2025/1/11 20:43:52/文章来源:https://blog.csdn.net/javasdn/article/details/133771638

在这里插入图片描述

本篇主要介绍使用selenium模拟点击下一页，更多内容请参考:Python学习指南

#-*- coding:utf-8 -*-import unittest
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup
import timeclass douyuSelenium(unittest.TestCase):#初始化方法def setUp(self):self.driver = webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'])#具体的测试用例方法，一定要以test开头def testDouyu(self):self.driver.get("http://www.douyu.com/directory/all")while True:#指定xml解析soup = BeautifulSoup(self.driver.page_source, "lxml")#返回当前页面的所有房间标题列表和观众人数列表titles = soup.find_all('h3' , {'class':"ellipsis"})print(len(titles))nums = soup.find_all('span', {'class': "dy-num fr"})# #使用zip()函数把列表合并，并创建一个远相对的列表[(1, 2), (3, 4)]for title, num in zip(nums, titles):print(u'观众人数： '+num.get_text().strip(), u'\t房间标题： '+title.get_text().strip())#page_source.find()未找到内容则返回-1if self.driver.page_source.find('shark-pager-disable-next') != -1:breakself.driver.find_element_by_class_name('shark-pager-next').click()time.sleep(1)# 退出时的清理方法def tearDown(self):print("加载完成...")self.driver.quit()if __name__ == '__main__':unittest.main()

最后

分享一份Python的学习资料，但由于篇幅有限，完整文档可以扫码免费领取！！！

1）Python所有方向的学习路线（新版）

总结的Python爬虫和数据分析等各个方向应该学习的技术栈。

在这里插入图片描述

比如说爬虫这一块，很多人以为学了xpath和PyQuery等几个解析库之后就精通的python爬虫，其实路还有很长，比如说移动端爬虫和JS逆向等等。

（2）Python学习视频

包含了Python入门、爬虫、数据分析和web开发的学习视频，总共100多个，虽然达不到大佬的程度，但是精通python是没有问题的，学完这些之后，你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。

在这里插入图片描述

（3）100多个练手项目

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了，只是里面的项目比较多，水平也是参差不齐，大家可以挑自己能做的项目去练练。

在这里插入图片描述

。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/158928.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Linemod算法研究

Linemod算法研究

转载，这篇博客写的比较详细，分析也到位. https://www.cnblogs.com/aoru45/p/16810996.html

阅读更多...

【Windows日志】记录系统事件的日志

【Windows日志】记录系统事件的日志

文章目录一、概要二、Windows日志介绍 2.1 应用程序日志2.2 系统日志2.3 安全日志三、查看与分析日志四、常见事件ID 4.1 登录事件 4.1.1 4624登陆成功4.1.2 4625登陆失败 4.2 特权使用4.3 账户管理事件4.4 账户登录事件5.2 事件ID汇总一、概要 Windows主要有以下三类日…

阅读更多...

【Android知识笔记】图片专题（BitmapDrawable）

【Android知识笔记】图片专题（BitmapDrawable）

如何计算一张图片的占用内存大小？注意是占用内存，不是文件大小可以运行时获取重要的是能直接掌握计算方法基础知识 Android 屏幕像素密度分类：（其实还有一种 ldpi = 120，不过这个已经绝种了，所以最低的只需关心mdpi即可）上表中的比例为：m : h : xh : xxh: xxxh = …

阅读更多...

自动驾驶学习笔记（四）——变道绕行仿真

自动驾驶学习笔记（四）——变道绕行仿真

#Apollo开发者# 学习课程的传送门如下，当您也准备学习自动驾驶时，可以和我一同前往： 《自动驾驶新人之旅》免费课程—> 传送门《2023星火培训【感知专项营】》免费课程—>传送门文章目录前言仿真内容启动Dreamview 开启Sim…

阅读更多...

如何降低海康、大华等网络摄像头调用的高延迟问题（一）：海康威视网络摄像头的python sdk使用（opencv读取sdk流）

如何降低海康、大华等网络摄像头调用的高延迟问题（一）：海康威视网络摄像头的python sdk使用（opencv读取sdk流）

目录 1.python sdk使用 1.海康SDK下载 2.opencv读取sdk流先说效果，我是用的AI推理的实时流，延迟从高达7秒降到小于1秒如果觉得这个延迟还不能接受，下一章，给大家介绍点上不得台面的小方法 SDK（Software Developme…

阅读更多...

《3D 数学基础》几何检测-最近点

《3D 数学基础》几何检测-最近点

目录 1. 直线上的最近点 2. 射线上的最近点 3. 点到平面的距离 4. 圆或球上的最近点 5. AABB上的最近点 1. 直线上的最近点 q是距离q的最近点，也就是q在直线上的投影。其中p是直线上的点（向量表示），n是直线的法向量&#x…

阅读更多...

【苍穹外卖 | 项目日记】第四天

【苍穹外卖 | 项目日记】第四天

前言： 今天状态还可以，既有自己实战独立写接口，又听了课，学习了新的知识目录前言： 今日完结任务： 今日收获： 实现店铺状态接口杂项知识点： 总结： 今日完结任务…

阅读更多...

2023.10.14 培训总结

2023.10.14 培训总结

培训内容数字模型联合仿真及集成测试技术 MBSE(Model-Based-System-Engiaeering） 参数化建模参数化仿真产生的疑问支持面向对象支持CAE CFD工具优化工具飞机的业务功能开发分布式架构新技术 WSDL协议DDS 发布/订阅SAOPCORBA 明显开发者 Chris Garrett 美…

阅读更多...

【基于Kmeans、Kmeans++和二分K均值算法的图像分割】数据挖掘实验三

【基于Kmeans、Kmeans++和二分K均值算法的图像分割】数据挖掘实验三

文章目录 Ⅰ、项目任务要求任务描述：主要任务要求： II、实现过程数据集描述实现描述具体实现过程 III、完整代码代码①代码② Ⅰ、项目任务要求任务描述： 图像分割是图像处理和计算机视觉中重要的一环，在实际生活中得到了广泛的…

阅读更多...

P1433 吃奶酪

P1433 吃奶酪

#include <iostream> #include <cmath> using namespace std; #define M 15 #define S(n) ((n) * (n)) double indx[M 5], indy[M 5], ans 0, sum 0;//坐标数组，从下标为1开始记录 int n, vis[M 5] { 0 };//vis数组，选过的数字标记为1…

阅读更多...

openssl学习——消息认证码原理

openssl学习——消息认证码原理

消息认证码原理消息认证码（Message Authentication Code, MAC）是一种技术，它的原理是通过对消息和密钥进行特定的处理，生成一个固定长度的数据，这个数据就是消息认证码（MAC）。这个过程可以看作…

阅读更多...

openGauss学习笔记-99 openGauss 数据库管理-管理数据库安全-客户端接入认证之配置文件参考

openGauss学习笔记-99 openGauss 数据库管理-管理数据库安全-客户端接入认证之配置文件参考

文章目录 openGauss学习笔记-99 openGauss 数据库管理-管理数据库安全-客户端接入认证之配置文件参考99.1 参数说明99.2 认证方式 openGauss学习笔记-99 openGauss 数据库管理-管理数据库安全-客户端接入认证之配置文件参考 99.1 参数说明表 1 参数说明参数名称描述取值范…

阅读更多...

SQL及数据库基础知识点总结

SQL及数据库基础知识点总结

一. SQL（Structured Query Language）： 结构化查询语言。SQL语法不区分关键字的大小写，多条SQL语句必须以；分隔。二. SQL的作用： SQL可以访问和处理数据库，包括数据的增删改查（插…

阅读更多...

SpringCloud-Config

SpringCloud-Config

一、介绍 （1）服务注册中心 （2）管理各个服务上的application.yml，支持动态修改，但不会影响客户端配置 （3）一般将application.yml文件放在git上，客户端通过http/https方式…

阅读更多...

Maika 与越南童模们受邀请参加中国上海时装周 hanakimi 品牌开幕

Maika 与越南童模们受邀请参加中国上海时装周 hanakimi 品牌开幕

金风送爽，秋高气和。2024中国上海时装周以“活力互链”为主题，于10月8日正式启幕。魅力四射的越南童模身着著名时尚品牌MLB、Hana Kami、Jacadi的精美设计，迈着有力、专业但又不失优雅的步伐走上时尚舞台上海大型现场。无论是拍摄造型照还是…

阅读更多...

windows TBB的使用

windows TBB的使用

windows TBB的使用 1. Install with GUI 1. Install with GUI To install oneTBB using GUI, complete the following steps: Go to the Download page.Select the preferred installer Online installer has a smaller file size but requires a permanent Internet connec…

阅读更多...

MFF论文笔记

MFF论文笔记

论文名称：Improving Pixel-based MIM by Reducing Wasted Modeling Capability_发表时间：ICCV2023 作者及组织：上海人工智能实验室，西门菲沙大学，香港中文大学问题与贡献 MIM(Model Maksed Model)方法可以分为两部分…

阅读更多...

C语言-贪吃蛇 1.输入控制ncurse

C语言-贪吃蛇 1.输入控制ncurse

一、为什么要用nurse C语言中的gets()、scanf()、getchar()等函数是在用户输入后需要按下Enter键才能执行代码，而贪吃蛇要求按下按键后立即对蛇的方向进行操作，所以根据贪吃蛇功能的需求引入ncurse，让用户输入后就能让蛇进行对应的行动。二、…

阅读更多...

Spring Boot中的异步编程：解决的问题与应用场景

Spring Boot中的异步编程：解决的问题与应用场景

Spring Boot中的异步编程：解决的问题与应用场景在现代Web应用程序中，高并发和性能是至关重要的。为了处理大量的请求和任务，异步编程成为了不可或缺的一部分。Spring Boot提供了强大的异步编程支持，可以显著提高应用程序的吞吐量…

阅读更多...

Spring MVC 和Spring JDBC

Spring MVC 和Spring JDBC

目录 Spring MVC MVC模式核心组件工作流程 Spring JDBC Spring JDBC功能和优势 Spring JDBC的关键组件 Spring MVC Spring MVC（Model-View-Controller）是Spring框架的一个模块，用于构建Web应用程序。它的主要目标是将Web应用程序的不…

阅读更多...

最新文章

推荐文章