Python网络爬虫,我目前只能获取单个文件,为啥?

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

归来池苑皆依旧,太液芙蓉未央柳。

大家好,我是皮皮。

一、前言

前几天在Python钻石交流群【Jethro Shen】问了一个Python网络爬虫的问题,这里拿出来给大家分享下。

c5f946e60284ebc99043ceeea38e9c2f.png

他想获取全部文件,但是实际上,只能获取单个文件。

二、实现过程

这里【甯同学】给了一个解决思路,如下图所示:

6a5308acefcf9961d24ef845b496916f.png

后来【瑜亮老师】也提供了一种方法。9582584eae1d88982beb503336a9c30c.png

直接一步到位。

45558846788b98632a626274e7dbd595.png

下面是具体的代码:

import requests
import time
from lxml import html
from lxml import etreeheaders = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 ''Safari/537.36'}def get_href_links(url):response = requests.get(url, headers=headers)page_content = response.contentdom_tree = html.fromstring(page_content)href_links = dom_tree.xpath('//a/@href')return href_linksurl = "https://mp.weixin.qq.com/s/BANHI5apQzlpeTTdLZAIvg"
urls = set(get_href_links(url)[1:-5])
mp3_d_url = 'https://res.wx.qq.com/voice/getvoice?mediaid={}'
for url in urls:response = requests.get(url, headers=headers)html = response.textselector = etree.HTML(html)voice_encode_fileid = selector.xpath('//mpvoice/@voice_encode_fileid')[0]name = selector.xpath('//mpvoice/@name')[0]d_url = mp3_d_url.format(voice_encode_fileid)response = requests.get(d_url)if response.status_code == 200:with open(name, 'wb') as f:f.write(response.content)print('{} 下载成功!'.format(name))else:print('{} 下载失败!'.format(name))time.sleep(1)  # 设置请求间隔时间为1秒,避免被封IP

顺利地解决了粉丝的问题。

8aca1350009d27e75a48847007a5d28e.png

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【Jethro Shen】提问,感谢【甯同学】、【瑜亮老师】、给出的思路和代码解析,感谢【eric】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

019a5a25378aea0ad5195ad6dfa7962e.png

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

dc516636720a708a46cf229f180fc487.png

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

4c607fe3886e6e10512e4660000e4d83.jpeg

------------------- End -------------------

往期精彩文章推荐:

  • if a and b and c and d:这种代码有优雅的写法吗?

  • Pycharm和Python到底啥关系?

  • 都说chatGPT编程怎么怎么厉害,今天试了一下,有个静态网页,chatGPT居然没搞定?

  • 站不住就准备加仓,这个pandas语句该咋写?

55f43f59668e1dd01607237c421bd2f0.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62633.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

盘点一个Python网络爬虫过验证码的问题(方法一)

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 低眉信手续续弹,说尽心中无限事。 大家好,我是皮皮。 一、前言 前几天在Python最强王者群【鶏啊鶏。】问了一个Python网络爬虫的…

小红书怎么推广笔记?小红书推广笔记有什么用?

小红书平台问世以来,得到快速发展,目前已经是电商领域的后起之秀,也是重要的口碑平台,在女性及生活用品方面的影响力不次于微信和微博,可以说是和抖音齐名的新秀平台。大家都知达到小红书平台的重要重要性,…

小红书笔记下沉的方法和技巧

小红书目前用户越来越多,随之而来发布的笔记数量也大了起来,不可避免得出现很多恶意的负面笔记,让大家很头疼。 下面推神网(daizuobaike)就给大家详细介绍下几种小红书负面笔记处理的方式: 1.官方入口,达到…

3.13 小红书笔记怎样带话题,才能增加曝光?【玩赚小红书】

虽然很多博主都知道在笔记内容最后要带上一个相关话题,但却很少人知道带什么样的话题,如何找到官方话题或热门话题来提高笔记内容的曝光。这一篇文章黄宇风就来讲讲,小红书笔记该如何带话题。 ​ ​ 1、挖掘小红书笔记热门话题 笔记带话题主…

小红书笔记没人看是什么原因?账号正常吗

相信很多人都遇到过自己认为笔记质量不错,但仍然会出现发布的小红书笔记没人看的情况。我们将为大家分析可能是哪些原因造成了这方面的困境,并告诉大家应该如何解决这些问题。 一.小红书笔记没人看的原因 1.账号违规 如果账号本身昵称、个性…

小红书怎样找回原账号_小红书笔记数据好不好,关键词搜索占一半

用户获取、浏览小红书笔记的渠道大致可以分为四个,一个是关注的博主账号,首页会有他们的笔记内容推荐;一个是主页上的发现页面,会推荐平常该用户感兴趣的内容以及附近地点的笔记;另外还有的则是小红书系统推荐。但更多小红书用户平常看笔记、…

小红书笔记打开显示连接不到服务器,小红书笔记看不到全文怎么回事啊?怎么发布小红书笔记?...

我们可以通过小红书购物笔记了解一些商品哦,因为小红书购物笔记里面的内容基本都是一些买家的购物体验,对于要买东西的我们来说,可以提供一些建议。可是最近有网友咨询小红书笔记看不到全文,小红书购物笔记找不到怎么回事?怎么发…

与领导吃饭需要注意什么

虽然说招待客人需要一定的技巧,但不是所有的聚餐,对方都会答应宴请;尤其是下属请领导吃饭时,不仅需要各种礼仪,还需要一定的技巧;当领导遇到下属,要请客吃饭时,都认为下属是有目的的…

新来的领导把我的职务免掉了,一年后,我要不要找领导聊聊?

你这一年都不找领导聊,现在人家另外两个都官复原职了,你才想起来聊聊,晚了。 从你的叙述中可以看出,你是一个非常正直的人,要不然被免职后也不会这么干等着。但正是你的正直,才导致了复职的是另外两个 &am…

领导找你谈话要注意这些

我的朋友小单每天努力工作,得到领导的重视;有一次小单正在认真工作,领导突然把小单叫到办公室谈话。小单一开始还有些紧张,没想到领导正好找她谈心,小单明白了领导的目的后就开口说话了。领导表面上只是问,…

如何看待程序员休息时间不工作被领导威胁辞退的?

在现在的互联网行业,程序员在职场工作肯定是十分辛苦的,基本很多公司都是996制度,这也和互联网行业工作环境有关系。因此程序员基本就只有周末一天假,所以难得休息一下。就有一名程序员因为在休息时间不工作被领导威胁辞退&#x…

程序员被领导辞退,1周后接到领导电话,听完后网友:把他拉黑

员工离职后,跟原来的单位就不再是雇佣关系,如果原单位有事情需要员工帮着解决,员工该不该收取报酬呢,但有的老板却认为,员工当时在公司留下的后遗症,他帮着公司解决,理所当然。 最近有一位程序员…

程序员和领导聚餐晒图,网友回复亮了:发量上就知道谁是新来的

目前大家都知道现在互联网行业的高薪,另外随着互联网行业们,门槛的降低,有很多人都想要加入到和联网行业当中来,而薪资高待遇好也是程序员让人羡慕的一方面,虽然一方面吐槽你互联网行业的辛苦加班,没有个人…

没有五十瓶红牛我是不会告诉你——面试中应该如何正确谈薪

文章末尾给大家留下了大量福利 前言 金九银十已经来临,很多小伙伴已经开始投身跳槽的准备中了。大家选择跳槽无非是想增加自己的工资收入,所以面试过程中的谈薪环节就显得尤为重要,谈的好与不好,未来整个的薪资水平都可能受影响…

为什么明明你做了很多事,到头来领导还是给你打了差评?

阅读本文大概需要 5.33 分钟。 这个问题源于一个队友的疑惑,原问题是 我在国企工作,平时工作之外,多做了很多事情,由于领导不懂技术,年底了,把我当作一般科室人员处理了,感觉看不到未来&#xf…

某程序员发现老板娘偷看同事微信火速离职!网友:这。。。

近日,湖南长沙李先生工作时意外发现老板娘偷看同事的微信,在告知同事后,小李觉得老板娘没素质最终选择离职。 视频显示,一女子正坐在电脑前翻阅微信聊天记录。根据小李和其同事对话的得知,那台电脑上登录的是小李同事的…

马斯克39页火星计划,也许是人类史上最伟大的PPT

“硅谷钢铁侠”马斯克一直梦想着火星移民。作为现在SpaceX公司首席运营官,他提出了核心答案,在火星上建造一座完整的城市。人类正成为多行星物种。 “你想在早晨醒来,并认为未来将会很好 - 这就是航天文明的全部内容。这是关于相信未来&#…

GPT-4要来了?传言:先进到与人类无异

编 | Cris源 | 新智元 千呼万唤始出来!GPT-4,真要来了? 作为史上最受期待的AI模型,GPT-4真要来了? 这几天,AI分析师罗梅罗的一篇专栏文章,一经推出便迅速「引爆」了整个AI科技圈。 他表示&#…

在人类的辅助下,ChatGPT完成了星际争霸小游戏程序的编写

算法使用的是Transformer,人类依然需要判断一些语法错误。但ChatGPT已经能完成90%的编程工作。

如果人工智能最终将毁灭人类,挽救人类你能做什么?

2017年,“人工智能”被写入政府工作报告,随之而来,AI所能替代的职位越来越多。我们开始担心,会不会在将来的某一天,自己所从事的职业被AI取代了呢? 智能革命时代先行者李开复在《人工智能》这本书里说&…