投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】

简历模板下载

    • 工具准备
    • 项目思路解析
    • 简易源码分享

工具准备

数据来源: 站长素材
开发环境:win10、python3.7
开发工具:pycharm、Chrome

在这里插入图片描述

项目思路解析

找到进入详情页面的超链接地址,以及对应简历的名字
提取出参数信息
在这里插入图片描述
使用xpath语法的时候需要注意网页源代码跟浏览器页面渲染的页面会有出入,提取数据需要根据网页源代码来提取

    html_data = etree.HTML(page) a_list = html_data.xpath("//div[@class='box col3 ws_block']/a")  for a in a_list:resume_href = 'https:' + a.xpath('./@href')[0]  resume_name = a.xpath('./img/@alt')[0]  

进入详情页面
找到对应的详情页面的地址
提取对应rar的下载地址
在这里插入图片描述

        resume_tree = etree.HTML(resume_page)  resume_link = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0]

简易源码分享

import requests  
from lxml import etree headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0',
}for i in range(2, 10):url = f'https://sc.chinaz.com/jianli/free_{str(i)}.html'  # 设置相应的路由iresponse = requests.get(url=url, headers=headers)html_data = etree.HTML(response.text)a_list = html_data.xpath("//div[@class='box col3 ws_block']/a")for a in a_list:new_url = 'https:' + a.xpath('./@href')[0]name = a.xpath('./img/@alt')[0]res = requests.get(url=new_url)  # 进入简历模板详情页面resume_tree = etree.HTML(res.text)resume_url = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0]result = requests.get(url=resume_url, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0'}).content  # 获取二进制数据path = './moban/' + name + '.rar'  with open(path, 'wb') as fp:  fp.write(result)  # 保存文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37611.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何用python主抓取股市数据并分析?

导读:在本文中我们研究白酒股票市场的数据。使用baostock来获取股票信息,可视化它们的不同,最后将使用一些方法来分析股票的风险,基于其以前的历史表现。我们还将通过长期短期记忆(LSTM)方法来预测未来的股票价格。注意&#xff0…

选出均线组合多头排列的牛股!股票量化分析工具QTYX-V2.5.6

前言 有些大牛股启动后会以连续快速的风格,开启一轮势不可挡的上涨。 我们来看下“中油资本”这只票上涨中期的特征。我们观察它的形态特征会发现,它的均线系统以多头排列姿态快速发散。在出现这种形态的初期买入的话,上涨效应很强。 于是&am…

cisp-pte通关靶场思路分享

文章写在cisp-pte通关靶场思路分享

15.PDE和PTE属性

一、PDE PTE 结构 低12位是权限位。 低1位是P位,P1代表有效,P0代表无效 低2位是RW位,RW0表示只读,RW1表示可读可写。 低3位是U/S位,U/S1表示用户及超级用户都可以操作页表,U/S0表示只有超级用户可以操作…

Windows保护模式学习笔记(七)—— PDEPTE

Windows保护模式学习笔记(七)—— PDE&PTE Cr3PDE(页目录表项)PTE(页表项)物理页的属性10-10-12分页的补充 实验1:证明PTE的特征1第一步:选择一个进程的Cr3第二步:查…

PTE学习作业

##被攻击者服务器为Linux:加粗样式 1.基础题目之SQL注入 所谓SQL注入,就是通过把SQL命令插入到Web表单提交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的SQL命令。 通过SQL注入漏洞读取/tmp/360/key文件,答案就在文件中。 …

cisp-pte真题解答

0x00 实例1 sql注入 poc:http://192.168.222.135:1081/vulnerabilities/fu1.php?id-1%) ununionion select 1,load_file(/tmp/key),3,4,5,6,7--知识点:1.双写绕过 2.load_file 读取文件内容 0x02 文件上传 知识点: 1.文件内容大小写绕过&a…

pte-文件上传总结

这里写目录标题 文件上传一1126文件上传二 1127文件上传二 1128文件上传1129文件上传总结文件上传一1126 找个gif,删除部分中间内容,改成txt文件,添加 <?php @eval($_POST[123]);?> Content-Type的值是application/octet-stream, 上传文件时,Content-Type的值改im…

PTE考试写作教程

PTE考试写作教程 由经验丰富的母语教师完成准备教程&#xff0c;以在 PTE 考试的写作部分取得成功 课程英文名&#xff1a;PTE Academic Exam Preparation Writing Mastery (Achieve 79) 此视频教程共10.0小时&#xff0c;中英双语字幕&#xff0c;画质清晰无水印&#xff0…

PTE靶机攻略之Windows

26题 这是一道关于Windows权限提升的考题&#xff0c;目标机的IP地址:172.16.12.101&#xff0c;目标的端口范围在27000-28000之间&#xff0c;请利用扫描工具找到开放的端口&#xff0c;开始你的渗透之旅&#xff0c;进入网站后台&#xff0c;请填入key1的值&#xff1a; 解…

CISP-PTE真题演示

周末帮好兄弟做PTE的真题&#xff0c;觉得确实挺有意思的&#xff0c;于是就有了这篇文章&#xff0c;侵删侵删哈 第一阶段 基础题目一&#xff1a;SQL注入 所谓SQL注入&#xff0c;就是通过把SQL命令插入到Web表单提交或输入域名或页面请求的查询字符串&#xff0c;最终达到…

CISP-PTE实操练习讲解

CISP-PTE实操练习讲解 文章目录 CISP-PTE实操练习讲解前言一、文件上传二、反序列化漏洞三.失效的访问控制总结 前言 这次给大家讲解一下考试的各个题型 一、文件上传 这道题就很简单&#xff0c;上传一个木马进行蚁剑连接就可以了 答案就在key.php文件中 我们创建一个文件…

CISP-PTE考证相关知识

PTE考试介绍&#xff1a; ①考试时长&#xff1a;4个小时 ②考试方式&#xff1a;线下考试&#xff0c;通过本机连接在线考试平台 ③试卷分值&#xff1a;满分100分&#xff0c;70分及其以上为通过考试 ④试题分布&#xff1a;20道选择题&#xff0c;每道1分计20分&#xff1b;…

什么是CISP-PTE?

那我就简单的写几点给你介绍一下什么是CISP-PTE。上目录&#xff01; 1.认证机构 中国信息安全测评中心英文名简称&#xff1a;CNITSEC。是经中央批准成立的国家信息安全权威测评机构&#xff0c;职能是开展信息安全漏洞分析和风险评估工作&#xff0c;对信息技术产品、信息系…

CISP-PTE靶场搭建

环境 靶场下载&#xff1a;https://pan.baidu.com/s/1jZbXATH3BtT4d2MLhB3gcQ?pwdrdhw 提取码: rdhw 虚拟机版本&#xff1a;VirtualBox 6.1.34 r150636&#xff08;Qt5.6.2&#xff09; 靶场操作系统&#xff1a;Centos 6 64位 搭建过程 以管理员模式打开VBox新建并设置虚拟…

CISP-PTE考试介绍

注册信息安全专业人员-渗透测试工程师&#xff0c;英文为 Certified Information Security Professional - Penetration Test Engineer &#xff0c;简称 CISP-PTE。证书持有人员主要从事信息安全技术领域网站渗透测试工作&#xff0c;具有规划测试方案、 编写项目测试计划、编…

pte 文件包含

pte 文件包含 文件包含实验1文件包含实验2文件包含实验3文件包含实验1 http://*****/vulnerabilities/fu1.php?file=php://filter/read=convert.base64-encode/resource=../key.php文件包含实验2

19-PDE-PTE

不知在《分页》文章里&#xff0c;你有没有搞懂什么是页&#xff0c;同时还延伸出了页表的概念。另外&#xff0c;还解释了逻辑地址、线性地址和物理地址之间的关系。我知道你脑子可能是一团浆糊&#xff0c;这只能怪我的语言表达能力还不够强。 大段大段的文字让人读起来有时…

华为面试汇总

4个16位类型表示一个64位数据类型 比如用4个16位int可以表示一个64位的float&#xff0c;类型的前两个int表示整数部分后两个int表示小数部分&#xff0c;然后自己重载实现运算函数。 希尔排序与基数排序 了解各自的原理即可 希尔排序(Shell’s Sort)是插入排序的一种又称“缩…

教你如何拿到华为offer!华为面试流程及面试题解析

华为的招聘流程一直非常复杂,本人最近参加了华为的社招,对全部流程有一个总体了解,包括流程,面试题目类型,分享给大家,希望大家能有所帮助。 首先是华为hr审核简历,看一个简历和所需职位的匹配度,基本就是看毕业学校,看掌握技能是否与所需职位吻合,然后会有一个电话沟…