python抓取工具【pyppeteer】用法直接运行无错

话不多说上代码

import requests
from pyppeteer import launch
# url 代表抓取的网页   ids 是为了分别抓的是哪个页面的id
async def req(url, ids):# 这个地方是禁用 sigint  不然的话 在其他地方调用这个方法会报错  不信 你试试 （main方法自己运行 没啥事）browser = await launch(handleSIGINT=False,handleSIGTERM=False,handleSIGHUP=False)# 新开一个浏览器页面  page = await browser.newPage()# 设置页面大小await page.setViewport({'width': 1920, 'height': 1080})# 用链接截图await page.goto(url)# 以下是配置 的前端页面 的 class   例如  页面中 需要截取  class=content 的 你就写下面的就完事   await page.waitForSelector('.content')await page.waitForSelector('.title')await page.waitForSelector('.title')  # 我也不知道我咋复制的多出来了  觉得碍眼 你删了呗await page.waitForSelector('.space')# 这个是 输出的图片地址 绝对路径await page.screenshot({'path': f'D:\\work\\1111{ids}.png'})# 这个是重点  一点要关闭浏览器 要不然耗内存  运行一段时间后 程序会挂await browser.close()

调用代码

反正我是这么写的你怎么写是你的事

  		# 获取当前线程的事件循环loop = asyncio.get_event_loop()# 在事件循环中运行异步函数capture_and_ocrloop.run_until_complete(req(url, now22))

还有一种写法我没用不知道有没有用你要不试试

	asyncio.run(req(url,ids))

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/472009.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python抓取工具【pyppeteer】用法直接运行无错

相关文章

【重生之我要苦学C语言】深入理解指针6

创建vue插件，发布npm

Java垃圾回收算法

文献阅读 | Nature Communications：使用自适应图注意自动编码器从空间解析的转录组学中解读空间域

新手小白学习docker第八弹------实现MySQL主从复制搭建

学习threejs，使用TWEEN插件实现动画

HarmonyOS Next星河版笔记--界面开发（5）

24.11.13 机器学习特征降维(主成份分析) KNN算法交叉验证(K-Fold) 超参数搜索

基于SpringBoot+RabbitMQ完成应⽤通信

react+hook+vite项目使用eletron打包成桌面应用+可以热更新

【C++】string(一)

新版Apache tomcat服务安装 Mac+Window双环境（笔记）

see的本质是什么？

0x00基础算法 -- 0x05 排序

深度学习在边缘检测中的应用及代码分析

博物馆实景复刻：开启沉浸式文化体验的新篇章

服务器上安装Orcale数据库以及PL SQL工具（中文）

除了 TON, 哪些公链在争夺 Telegram 用户？数据表现如何？

JSON.stringify的应用说明

java:接口，抽象，多态的综合小练习

python抓取工具【pyppeteer】用法 直接运行 无错

相关文章

python抓取工具【pyppeteer】用法直接运行无错