python爬虫学习（2）——requests模块

python爬虫学习（2）——requests模块

news/2024/12/23 8:25:01/文章来源:https://blog.csdn.net/m0_72811193/article/details/139208145

520那天我向心仪的女孩要微信：“女神，能给我你的微信号吗？”
女神：“给我——爬！！！！”
从那天开始，我就决定要学好爬虫，爬到女神微信号！！！

文章目录

一、requests模块是什么？
- 二、如何使用：（requests模块的编码流程）
三、使用步骤（爬取搜狗首页的页面数据）
- 1.引入库（环境安装）
- 2.完整代码
- 3.运行代码爬取成功
总结

一、requests模块是什么？

简单来说：python中原生的一款基于网络请求的模块，功能非常强大，简单便捷，效率极高。

作用：模拟浏览器发请求。

二、如何使用：（requests模块的编码流程）

1.指定URL；
2.发起请求；
3.获取响应数据；
4.持久化存储；

三、使用步骤（爬取搜狗首页的页面数据）

1.引入库（环境安装）

pip install requests

在这里插入图片描述

2.完整代码

#!usr/bin/env python3
# -*- coding: utf-8 -*-
#需求：爬取搜狗首页的页面数据
import requests
if __name__ == '__main__':#step1: 指定urlurl = 'http://www.sogou.com/'#step2: 发起请求#git方法会返回一个响应对象；response = requests.get(url=url)#step3: 打印响应数据（在响应对象里面）page_text = response.textprint(page_text)#step4: 保存响应数据到文件(持久化存储)with open('sogou_homepage.html', 'w', encoding='utf-8') as fp:fp.write(page_text)print('保存成功！')

3.运行代码爬取成功

在这里插入图片描述

总结

`Python代码使用requests库从指定的网址下载网页内容，
然后将其保存到本地文件中，
最后打印出保存成功的消息。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/333235.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

RBA认证是什么？申请RBA认证的流程是什么？

RBA认证是什么？申请RBA认证的流程是什么？

RBA认证，全称为Responsible Business Alliance（责任商业联盟）认证，是一个全球性的企业社会责任（CSR）倡议，旨在通过推动供应链中的社会和环境责任实践，确保供应链的可持续性。该认证要…

阅读更多...

【驱动】RS485收发控制、自动收发电路及波特率限制

【驱动】RS485收发控制、自动收发电路及波特率限制

1、芯片本身支持自动收发 RS485收发器芯片本身支持自动收发切换：优点：简化硬件设计和软件编程，减少外部控制线；缺点：成本高，传输速率可能受限制。下面介绍几款支持自动收发切换的RS485/422芯片 1.1 MAX13487 MAX13487 是一款由美信（Maxim）生产的半双工 RS-485/RS…

阅读更多...

Unity3D读取Excel表格写入Excel表格

Unity3D读取Excel表格写入Excel表格

系列文章目录 unity工具文章目录系列文章目录👉前言👉一、读取Excel表格👉二、写入Excel表格👉三、Fileinfo和Directoryinfo的操作👉四、壁纸分享👉总结 👉前言有时候难免会遇到读取文件写…

阅读更多...

uniapp页面vue3下拉触底发送获取新数据请求实现分页功能

uniapp页面vue3下拉触底发送获取新数据请求实现分页功能

页面下拉触底获取新数据实现分页功能实现方式有两种，根据自己的业务需求来定，不同的方案适用场景不一样，有的是一整个页面下拉获取新数据，有的是部分盒子内容滚动到底部时候实现获取新数据，下面讨论一下两种方式的区别…

阅读更多...

网络通讯聊天工具的实现

网络通讯聊天工具的实现

学习网络与通信，实现聊天界面能够通过服务器进行私聊和群聊的功能。 1.服务器：ServeSocket 客户端先发送消息给服务器，服务器接受消息后再发送给客户端。利用服务器随时监听。等待客户端的请求，一旦有请求便生产一个socket套接…

阅读更多...

js深入理解对象的属性（properties）的特殊特性（attributes）

js深入理解对象的属性（properties）的特殊特性（attributes）

对象 js对象 // 构造一个对象 let obj {}; let obj new Object(); 我们知道js中一切皆对象，对象是一个键值对集合（key: value)，一个键(key)对应一个值(value)，而每个键都是这个对象的属性，我们可以通过对象的属性来…

阅读更多...

Java绩效考核系统源码 springboot员工绩效考核系统源码

Java绩效考核系统源码 springboot员工绩效考核系统源码

Java绩效考核系统源码 springboot员工绩效考核系统源码-009 源码下载地址：https://download.csdn.net/download/xiaohua1992/89352195 项目介绍本系统的功能分为管理员和员工两个角色管理员的功能有： （1）个人中心管理功能&a…

阅读更多...

一点点 cv 经验 1：cv方向、模型评估、输入尺寸、目标检测器设计

一点点 cv 经验 1：cv方向、模型评估、输入尺寸、目标检测器设计

一点点 cv 经验 1：cv方向、模型评估、输入尺寸、目标检测器设计 cv 方向Pytorch数据集划分模型评估误差偏差方差噪声输入尺寸方法一：让数据适应模型方法二：修改模型适应数据方法三：划分Patch，分别处理目标检测器结构…

阅读更多...

【Redis】关于列表类型

【Redis】关于列表类型

文章目录 🍃前言🍀常见操作命令介绍🚩lpush🚩lpushx🚩rpush🚩rpushx🚩lrange🚩lpop🚩rpop🚩lindex🚩linsert🚩llen🚩lrem&…

阅读更多...

Python3 笔记：Python之禅

Python3 笔记：Python之禅

打开Python Shell，输入import this，按回车键运行程序。 Beautiful is better than ugly. 优雅胜于丑陋。 Explicit is better than implicit. 明确胜于含糊。 Simple is better than complex. 简单胜于复杂。

阅读更多...

Ansible02-Ansible Modules模块详解

Ansible02-Ansible Modules模块详解

目录写在前面4. Ansible Modules 模块4.1 Ansible常用模块4.1.1 Command模块4.1.2 shell模块4.1.3 scrpit模块4.1.4 file模块4.1.5 copy模块4.1.6 lineinfile模块4.1.7 systemd模块4.1.8 yum模块4.1.9 get_url模块4.1.10 yum_repository模块4.1.11 user模块4.1.12 group模块4.…

阅读更多...

在C++中自定义命名空间，在命名空间中定义string变量，同时定义一个函数实现单词逆置

在C++中自定义命名空间，在命名空间中定义string变量，同时定义一个函数实现单词逆置

代码 #include <iostream> #include <cstring> using namespace std; namespace my_space {string s;void reverse(string s);//定义逆置函数 } using namespace my_space; void my_space::reverse(string s){int lens.size();int i0;int jlen-1;while(i<j){//…

阅读更多...

设计模式17——模板方法模式

设计模式17——模板方法模式

写文章的初心主要是用来帮助自己快速的回忆这个模式该怎么用，主要是下面的UML图可以起到大作用，在你学习过一遍以后可能会遗忘，忘记了不要紧，只要看一眼UML图就能想起来了。同时也请大家多多指教。模板方法模式（Temp…

阅读更多...

买车是小米su7还是model3？这个AI在我这里“干掉了”百万车评人

买车是小米su7还是model3？这个AI在我这里“干掉了”百万车评人

作者 | 曾响铃文 | 响铃说 43天交付1万辆新车！雷军的微博一发，又把小米汽车推上了热搜。自小米su7问世以来，天天刷屏。说不心动，那是假的，身边好几个朋友都按捺不住要下订一台了。但真要买，还是忍不住…

阅读更多...

容器组件：页面和自定义组件生命周期（HarmonyOS学习第五课）

容器组件：页面和自定义组件生命周期（HarmonyOS学习第五课）

页面和自定义组件生命周期先明确自定义组件和页面的关系： 自定义组件:Component装饰的UI单元，可以组合多个系统组件实现U的复用。页面:即应用的UI页面。可以由一个或者多个自定义组件组成，Entry装饰的自定义组件为贞面的入口组件&#xf…

阅读更多...

5月26（信息差）

5月26（信息差）

🌍 珠峰登顶“堵车”后冰架断裂 5人坠崖 2人没爬上来！ 珠峰登顶“堵车”后冰架断裂 5人坠崖 2人没爬上来！ 🎄 Windows 11 Beta 22635.3646 预览版发布：中国大陆地区新增“微软电脑管家”应用 ✨ 成都限购解除即将满…

阅读更多...

DOS学习-目录与文件应用操作经典案例-ren

DOS学习-目录与文件应用操作经典案例-ren

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆，收藏下次不迷路┗|｀O′|┛ 嗷~~ 目录一.前言二.使用三.案例案例 1：重命名当前目录下的文件案例 2&#xff1a…

阅读更多...

Postman快捷功能-快速填写请求头

Postman快捷功能-快速填写请求头

大家好，之前给大家分享关于 Postman 工具的基础使用，今天给大家介绍一个快捷功能，可以一定程度提高我们使用 Postman 工具的效率，在我们进行接口测试时，几乎每个接口都需要填写 Headers，且 Headers 中的参数…

阅读更多...

【leetcode面试经典150题】-80. 删除有序数组中的重复项 II

【leetcode面试经典150题】-80. 删除有序数组中的重复项 II

【leetcode面试经典150题】-80. 删除有序数组中的重复项 II 1 题目介绍2 个人解题思路2.1 代码2.2 思路 3 官方题解 1 题目介绍给你一个有序数组 nums ，请你原地删除重复出现的元素，使得出现次数超过两次的元素只出现两次 ，返回删除后数组…

阅读更多...

一键接入大模型：One-Api本地安装配置实操，POSTMAN、APIFOX调用CURL

一键接入大模型：One-Api本地安装配置实操，POSTMAN、APIFOX调用CURL

前言最近准备学习一下 Semantic Kernel, OpenAI 的 Api 申请麻烦，所以想通过 One-api 对接一下国内的在线大模型，先熟悉一下 Semantic Kernel 的基本用法,本篇文章重点记录一下OneApi安装配置的过程。讯飞星火有 3.5 模型的 200w 个人免费 token，可以拿来学习。讯飞星…

阅读更多...

最新文章

推荐文章