手写一个简单爬虫--手刃豆瓣top250排行榜

手写一个简单爬虫--手刃豆瓣top250排行榜

news/2024/12/24 10:40:31/文章来源:https://blog.csdn.net/Ultravioletrays/article/details/132592321

#拿到页面面源代码 request
#通过re来提取想要的有效信息 re
import requests
import re
url="https://movie.douban.com/top250"headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36"}resp=requests.get(url,headers=headers)page_content=resp.text#解析数据
obj=re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>'r'.*?<p class="">.*?<br>.*?(?P<year>.*?)&nbsp.*?<span class="rating_num" property="v:average">(?P<score>.*?)</span>.*?<span>(?P<people>.*?)人',re.S)
result=obj.finditer(page_content)
for it in result:print(it.group("name"))print(it.group("year").strip())print(it.group("score"))print(it.group("people")+" peple judge")#上述操作在于爬取文件

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/120662.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【Vue3 知识第四讲】数据双向绑定、事件绑定、事件修饰符详解

【Vue3 知识第四讲】数据双向绑定、事件绑定、事件修饰符详解

文章目录一、数据双向绑定二、事件绑定详解2.1 **Vue中的事件绑定指令**2.2 **事件函数的调用方式**2.3 **事件函数参数传递** 三、事件修饰符3.1 **Vue中常用的事件修饰符**3.2 **按键修饰符** 四、属性绑定五、类与样式的绑定5.1 class 类的绑定5.2 style 样式绑定一、数据…

阅读更多...

泛型的学习

泛型的学习

泛型深入泛型：可以在编译阶段约束操作的数据类型，并进行检查泛型的格式：<数据类型> 注意：泛型只能支持引用数据类型 //没有泛型的时候，集合如何存储数据//如果我们没有给集合指定类型，默认认为…

阅读更多...

VMWare vsphere配置虚拟机规则实例

VMWare vsphere配置虚拟机规则实例

在虚拟化平台，存在HA关系的虚拟机通常要求不能放置在同一物理机上以提升安全性，高业务互访问的虚拟机则需要放置在同一物理机上以提升性能，同一资源类型为高负荷的虚拟机需分散放置以平衡集群主机性能提升虚拟机效率，这些情况下就…

阅读更多...

Pycharm配置及使用Git教程

Pycharm配置及使用Git教程

文章目录 1. 安装PyCharm2. 安装Git3. 在PyCharm中配置Git插件4. 连接远程Gtilab仓库5. Clone项目代码6. 将本地文件提交到远程仓库6.1 git add6.2 git commit6.3 git push6.4 git pull 平时习惯在windows下开发，但是我们又需要实时将远方仓库的代码clone到本地&…

阅读更多...

SpringMVC：从入门到精通

SpringMVC：从入门到精通

一、SpringMVC是什么 SpringMVC是Spring提供的一个强大而灵活的web框架，借助于注解，Spring MVC提供了几乎是POJO的开发模式【POJO是指简单Java对象（Plain Old Java Objects、pure old java object 或者 plain ordinary java object&#xff0…

阅读更多...

zookeeper教程

zookeeper教程

zookeeper教程 zookeeper简介zookeeper的特点及数据模型zookeeper下载安装zookeeper客户端命令zookeeper配置文件zookeeper服务器常用命令zookeeper可视化管理工具zkuizookeeper集群环境搭建zookeeper选举机制使用Java原生api操作zookeeper使用java zkclient库操作zookeeper使用…

阅读更多...

文件上传漏洞-upload靶场5-12关

文件上传漏洞-upload靶场5-12关

文件上传漏洞-upload靶场5-12关通关笔记（windows环境漏洞） 简介在前两篇文章中，已经说了分析上传漏的思路，在本篇文章中，将带领大家熟悉winodws系统存在的一些上传漏洞。 upload 第五关 （大小写绕过…

阅读更多...

C#面试十问

C#面试十问

1：C#中变量类型分为哪两种？它们的区别是什么？2：Class和Struct的区别？3：C#中类的修饰符和类成员的修饰符有哪些？4：面向对象的三个特征（特点）是什么&#xff1f…

阅读更多...

MySQL MHA高可用配置及故障切换

MySQL MHA高可用配置及故障切换

目录 MHA MHA 的组成 MHA 的特点 MHA工作原理故障切换时MHA会做的动作 MHA注意问题搭建 MySQL MHA 修改Mysql主配置文件 Master 节点 Slave1 节点 Slave2 节点创建软连接配置 mysql 一主两从安装MHA所有组件配置无密码认证 manager 节点 master节点 slave…

阅读更多...

【java】【项目实战】[外卖九]项目优化（缓存）

【java】【项目实战】[外卖九]项目优化（缓存）

目录一、问题说明二、环境搭建 2.1 Git管理代码 2.1.1 创建本地仓库 2.1.2 创建远程仓库 2.1.3 创建分支--》推送到远程仓库 2.2 maven坐标 2.3 配置文件application.yml 2.4 配置类RedisConfig 三、缓存短信验证码 3.1 实现思路 3.2 代码改造 3.2.1 UserContro…

阅读更多...

时序预测 | MATLAB实现EEMD-SSA-LSTM、EEMD-LSTM、SSA-LSTM、LSTM时间序列预测对比

时序预测 | MATLAB实现EEMD-SSA-LSTM、EEMD-LSTM、SSA-LSTM、LSTM时间序列预测对比

时序预测 | MATLAB实现EEMD-SSA-LSTM、EEMD-LSTM、SSA-LSTM、LSTM时间序列预测对比目录时序预测 | MATLAB实现EEMD-SSA-LSTM、EEMD-LSTM、SSA-LSTM、LSTM时间序列预测对比预测效果基本介绍模型描述程序设计参考资料预测效果基本介绍时序预测 | MATLAB实现EEMD-SSA-LSTM、E…

阅读更多...

《向量数据库指南》——腾讯云向量数据库（Tencent Cloud VectorDB） SDK 正式开源

《向量数据库指南》——腾讯云向量数据库（Tencent Cloud VectorDB） SDK 正式开源

腾讯云向量数据库 SDK 宣布正式开源。根据介绍，腾讯云向量数据库（Tencent Cloud VectorDB）的 Python SDK 与 Java SDK 是基于数据库设计模型，遵循 HTTP 协议，将 API 封装成易于使用的 Python 与 Java 函数或类，为开发者提供了更加友好、更加便捷的数据库使用和管理方式。…

阅读更多...

数据分享|R语言用lme4多层次（混合效应）广义线性模型（GLM），逻辑回归分析教育留级调查数据...

数据分享|R语言用lme4多层次（混合效应）广义线性模型（GLM），逻辑回归分析教育留级调查数据...

全文链接:http://tecdat.cn/?p22813 本教程为读者提供了使用频率学派的广义线性模型（GLM）的基本介绍。具体来说，本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用，以及模型评估的方法（点击文末“阅读原文…

阅读更多...

Java版企业电子采购招标系统源码

Java版企业电子采购招标系统源码

一、立项管理 1、招标立项申请功能点：招标类项目立项申请入口，用户可以保存为草稿，提交。 2、非招标立项申请功能点：非招标立项申请入口、用户可以保存为草稿、提交。 3、采购立项列表功能点：对草稿进行编辑&#x…

阅读更多...

【Unity3D赛车游戏优化篇】【九】Unity中如何让汽车丝滑漂移？

【Unity3D赛车游戏优化篇】【九】Unity中如何让汽车丝滑漂移？

👨‍💻个人主页：元宇宙-秩沅 👨‍💻 hallo 欢迎点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由秩沅原创 👨‍💻 收录于专栏：Uni…

阅读更多...

软件测试人需要掌握的测试知识架构体系（上）

软件测试人需要掌握的测试知识架构体系（上）

软件计划与可行性研究（问题定义、可行性研究）；需求分析；软件设计（概要设计、详细设计）；编码；软件测试；运行与维护。一、软件的生命周期(SDLC) 1、生存周期划分各阶段…

阅读更多...

软路由ip的优势与劣势：了解其适用场景和限制

软路由ip的优势与劣势：了解其适用场景和限制

在网络技术的快速发展中，软路由IP作为一种灵活且功能强大的网络设备，越来越受到人们的关注。然而，正如任何技术一样，软路由IP也有其优势和劣势。本文将深入探讨软路由IP的优势、劣势以及其适用场景和限制，帮助你更好地…

阅读更多...

字节二面：如果高性能渲染十万条数据？

字节二面：如果高性能渲染十万条数据？

前言最近博主在字节面试中遇到这样一个面试题，这个问题也是前端面试的高频问题，作为一名前端开发工程师，我们虽然可能很少会遇到后端返回十万条数据的情况，但是了解掌握如何处理这种情况，能让你对前端性能优化有更深的…

阅读更多...

Redis 缓存预热+缓存雪崩+缓存击穿+缓存穿透

Redis 缓存预热+缓存雪崩+缓存击穿+缓存穿透

面试题： 缓存预热、雪萌、穿透、击穿分别是什么？你遇到过那几个情况？缓存预热你是怎么做的？如何造免或者减少缓存雪崩？穿透和击穿有什么区别？他两是一个意思还是载然不同？穿适和击穿你有什么解…

阅读更多...

uniApp webview 中调用底座蓝牙打印功能异常

uniApp webview 中调用底座蓝牙打印功能异常

背景: 使用uniApp, 安卓底座 webView 方式开发; 调用方式采用H5 向底座发送消息, 底座判断消息类型, 然后连接打印机进行打印; 内容通过指令集方式传递给打印机; 过程当中发现部分标签可以正常打印, 但又有部分不行,打印机没反应, 也没有报错; 原因分析: 对比标签内容…

阅读更多...

最新文章

推荐文章