VCR库编写爬虫程序

VCR库编写爬虫程序

news/2024/11/18 14:36:09/文章来源:https://blog.csdn.net/weixin_73725158/article/details/134155675

VCR库编写一个爬虫程序来爬取图片，代码如下所示：

require 'vcr'
require 'open-uri'

# 使用VCR库录制一次HTTP请求
VCR.use_cassette('vip_crawler') do# 设置主机和端口proxy_host = ''proxy_port = ''# 创建一个HTT理对象proxy = URI.parse("http://#{proxy_host}:#{proxy_port}")# 使用代理对象打开网页response = open("https://www.vip.com/", proxy: proxy)# 获取网页内容html = response.read# 使用正则表达式匹配图片链接image_links = html.scan(/<img.*src=['"]([^'"]+)[\s>]/i)# 遍历所有图片链接，下载图片image_links.each do |link|image_url = link[0]File.open(image_url, 'wb') do |file|file.write(open(image_url).read)endend
end

首先使用VCR库录制一次HTTP请求，然后设置主机和端口，创建一个HTTP对象，象打开网页，获取网页内容，使用正则表达式匹配图片链接，遍历所有图片链接，下载图片。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/178881.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

遥遥领先，免费开源的django4-vue3前后端分离项目

遥遥领先，免费开源的django4-vue3前后端分离项目

星域后台管理系统前端介绍 🌿项目简介本项目前端基于当下流行且常用的vue3作为主要技术栈进行开发，融合了typescript和element-plus-ui，提供暗黑模式和白昼模式两种主题以及全屏切换，开发bug少，简单易学&#xff0c…

阅读更多...

电源管理（PMIC）MAX20428ATIA/VY、MAX20428ATIC/VY、MAX20428ATIE/VY适合汽车ADAS应用的开关稳压器

电源管理（PMIC）MAX20428ATIA/VY、MAX20428ATIC/VY、MAX20428ATIE/VY适合汽车ADAS应用的开关稳压器

一、概述 MAX20428是一款高效率、八路输出、低压PMIC。OUT1将输入电源升压至5V，电流高达500mA，而三个同步降压转换器的输入电压范围为3.0V至4.2V，输出电压范围为0.8V至3.9875V，峰值电流分别高达1.3A、1.3A和3.5A。三个300mA pMOS…

阅读更多...

阿里云双11优惠活动：新老用户99元服务器和代金券领取攻略

阿里云双11优惠活动：新老用户99元服务器和代金券领取攻略

2023阿里云双11优惠活动开启了，轻量2核2G3M带宽服务器87元一年、2核4G4M带宽165元一年，云服务器ECS经济型e实例2核2G3M固定带宽优惠价格99元一年，新老用户同享，并且续费不涨价，第二年99元续费。阿里云个人和企业用户还…

阅读更多...

tcp/ip该来的还是得来

tcp/ip该来的还是得来

1. TCP/IP、Http、Socket的区别 \qquad 区别是：TCP/IP即传输控制/网络协议，也叫作网络通讯协议，它是在网络的使用中的最基本的通信协议。Http是一个简单的请求-响应协议，它通常运行在TCP之上。Socket是对网络中不同主机上的应用进…

阅读更多...

vue(32) : win10创建vue2基础前端框架

vue(32) : win10创建vue2基础前端框架

vue2element-uiaxios 1.创建vue2项目开发工具为HBuilderX 3.7.3 1.1.新建项目 1.2.普通项目-vue项目(2.6.10) 等待创建项目 2.安装element-ui组件 2.1右键左下角开始图标 2.2.cd进入项目目录,执行安装element-ui npm i element-ui -S 2.3.main.js引入配置 import {Paginat…

阅读更多...

vue3+ts 提取公共方法

vue3+ts 提取公共方法

因为好多页面都会使用到这个效验规则，封装一个校检规则，方便维护封装前封装后

阅读更多...

C++ 面向对象学习优秀教程

C++ 面向对象学习优秀教程

油管看视频沉浸式翻译插件，实现中文字幕！ 文章目录 Object Oriented Programming (OOP) in C Course Object Oriented Programming (OOP) in C Course https://www.youtube.com/watch?vwN0x9eZLix4 博主：https://www.youtube.com/CodeBeau…

阅读更多...

vue指令

vue指令

在 Vue，除了核心功能默认内置的指令 ( v-model 和 v-show )，Vue 也允许注册自定义指令。它的作用价值在于当开发人员在某些场景下需要对普通 DOM 元素进行操作。 Vue 自定义指令有全局注册和局部注册两种方式。先来看看注册全局指令的方式，通…

阅读更多...

Centos8安装yum源时候出现的异常问题及解决方案（保好使）

Centos8安装yum源时候出现的异常问题及解决方案（保好使）

问题的出现作者在使用centos8的时候，想安装tree命令，输入了如下的命令： yum install tree 但是却显示了下面的错误： Errors during downloading metadata for repository base: - Curl error (28): Timeout was reached for h…

阅读更多...

内涝积水监测仪怎么样？万宾科技城市内涝积水监测的作用

内涝积水监测仪怎么样？万宾科技城市内涝积水监测的作用

在城市建设发展过程中，道路基础设施的建设永远都占据着重要一席，因为人们出行一旦受阻便会影响城市进展，也会影响经济发展。在城市之中有隧道，下穿式立交桥等容易存积水的地方，一旦出现恶劣暴雨天气，这些地…

阅读更多...

无限上下文，多级内存管理！突破ChatGPT等大语言模型上下文限制

无限上下文，多级内存管理！突破ChatGPT等大语言模型上下文限制

目前，ChatGPT、Llama 2、文心一言等主流大语言模型，因技术架构的问题上下文输入一直受到限制，即便是Claude 最多只支持10万token输入，这对于解读上百页报告、书籍、论文来说非常不方便。为了解决这一难题，加州伯克利…

阅读更多...

【C++入门三】学习C++缺省参数 | 函数重载 | 引用

【C++入门三】学习C++缺省参数 | 函数重载 | 引用

C入门三 1.缺省参数1.1 缺省参数概念1.2 缺省参数分类 2. 函数重载2.1 函数重载概念2.2 C支持函数重载的原理--名字修饰(name Mangling) 3.引用3.1引用概念3.2引用特性3.3 常引用3.4 使用场景1. 做参数2. 做返回值 3.5 传值、传引用效率比较3.6引用和指针的区别 4.引用和指针的…

阅读更多...

从关键新闻和最新技术看AI行业发展（2023.10.9-10.22第八期） |【WeThinkIn老实人报】

从关键新闻和最新技术看AI行业发展（2023.10.9-10.22第八期） |【WeThinkIn老实人报】

Rocky Ding 公众号：WeThinkIn 写在前面【WeThinkIn老实人报】旨在整理&挖掘AI行业的关键新闻和最新技术，同时Rocky会对这些关键信息进行解读，力求让读者们能从容跟随AI科技潮流。也欢迎大家提出宝贵的优化建议，一起交流学习&…

阅读更多...

excel利用正则匹配和替换指定内容

excel利用正则匹配和替换指定内容

上班中, 突然接到电话, 屋里的上司大人发来个excel, 说要替换里面x-x-xxx列的内容为x栋x单元xxx. 大致表格如下, 原表格我就不发了身为程序猿的我, 肯定第一就想到了正则! 打开excel-开始-查找和替换, 我擦, 只能完全匹配和替换比如一次只能替换1-1- -> 为1栋1单元 1-2…

阅读更多...

【使用Python编写游戏辅助工具】第三篇：鼠标连击器的实现

【使用Python编写游戏辅助工具】第三篇：鼠标连击器的实现

前言这里是【使用Python编写游戏辅助工具】的第三篇：鼠标连击器的实现。本文主要介绍使用Python来实现鼠标连击功能。鼠标连击是指在很短的时间内多次点击鼠标按钮，通常是鼠标左键。当触发鼠标连击时，鼠标按钮会迅速按下和释放多次&#xf…

阅读更多...

课程学习前言

课程学习前言

App逆向说明 app抓包分析可以看到有签名有加固，毕竟需要APK去访问服务、获取数据，都需要APK有完整的信息，而这些信息、代码经过各种加密，还是放在APK里面。说白了，就是门锁紧了，钥匙藏在门口某个地方&…

阅读更多...

柯桥日常英语培训，英语中参加商务会议需要注意什么？

柯桥日常英语培训，英语中参加商务会议需要注意什么？

PART 01 Be prepared. 做好准备。 Have the agenda, a notebook and pen, business cards and any other documents you may need ready. Determine what you can do beforehand to be ready to join in on the discussion. 准备好议程、笔记本和笔、名片以及其他可能需要的…

阅读更多...

算法通过村第十八关-回溯|青铜笔记|什么叫回溯（中篇）

算法通过村第十八关-回溯|青铜笔记|什么叫回溯（中篇）

文章目录前言回溯的核心问题撤销操作解释总结前言提示：阳光好的时候，会感觉还可以活很久，甚至可以活出喜悦。 --余秀华回溯是非常重要的算法思想之一，主要解决一些暴力枚举也搞不定的问题（这里埋个坑💣…

阅读更多...

mac下载安装jenkins

mac下载安装jenkins

下载 https://get.jenkins.io/war/ 启动使用命令行启动 java -jar jenkins.war 浏览器访问 IP:8080 或 localhost:8080 ，对jenkins进行配置，刚开始需要输入密码终端会展示密码和密码存放位置 jenkins插件下载地址， 下载后自行上传。 I…

阅读更多...

Ubuntu20.04安装CUDA、cuDNN、tensorflow2可行流程（症状：tensorflow2在RTX3090上运行卡住）

Ubuntu20.04安装CUDA、cuDNN、tensorflow2可行流程（症状：tensorflow2在RTX3090上运行卡住）

最近发现我之前在2080ti上运行好好的代码，结果在3090上运行会卡住很久，而且模型预测结果完全乱掉，于是被迫研究了一天怎么在Ubuntu20.04安装CUDA、cuDNN、tensorflow2。 1.安装CUDA（包括CUDA驱动和CUDA toolkit，注意此…

阅读更多...

最新文章

推荐文章