盘点一个Python网络爬虫问题

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

在天愿作比翼鸟,在地愿为连理枝。

大家好,我是皮皮。

一、前言

前几天在Python最强王者群【刘桓鸣】问了一个Python网络爬虫的问题,这里拿出来给大家分享下。

6b507c754c0574ec2a9310a7d6231f94.png

他自己的代码如下:

import requestskey = input("请输入关键字")res = requests.post(url="https://jf.10086.cn/cmcc-web-shop/search/query",data={"sortColumn" : "default","sortType": "DESC","pageSize": "60","pageNum": "1","firstKeyword": key,"integral": "","province": ""},headers={"User_Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36"}
)print(res.json())

二、实现过程

这里【隔壁😼山楂】指出拿到的数据需要用json解析,后来【瑜亮老师】指出是参数加少了。

a193390036cac1607da8ff7021ce19ba.png

甯同学指出,需要在请求头里边加上origin,后来【eric】给出了一个对应代码,如下所示:

import requestsheaders = {"authority": "jf.10086.cn","accept": "*/*","accept-language": "zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6","content-type": "application/x-www-form-urlencoded;charset=UTF-8","origin": "https://jf.10086.cn","referer": "https://jf.10086.cn/","sec-ch-ua": "\"Microsoft Edge\";v=\"113\", \"Chromium\";v=\"113\", \"Not-A.Brand\";v=\"24\"","sec-ch-ua-mobile": "?0","sec-ch-ua-platform": "\"Windows\"","sec-fetch-dest": "empty","sec-fetch-mode": "cors","sec-fetch-site": "same-origin","sessionid": "","user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36 Edg/113.0.1774.42"
}
cookies = {"sajssdk_2015_cross_new_user": "1","sensorsdata2015jssdkcross": "%7B%22distinct_id%22%3A%221882e060ca319-0c9999999999998-7b515477-921600-1882e060ca46ed%22%2C%22first_id%22%3A%22%22%2C%22props%22%3A%7B%22%24latest_traffic_source_type%22%3A%22%E7%9B%B4%E6%8E%A5%E6%B5%81%E9%87%8F%22%2C%22%24latest_search_keyword%22%3A%22%E6%9C%AA%E5%8F%96%E5%88%B0%E5%80%BC_%E7%9B%B4%E6%8E%A5%E6%89%93%E5%BC%80%22%2C%22%24latest_referrer%22%3A%22%22%7D%2C%22identities%22%3A%22eyIkaWRlbnRpdHlfY29va2llX2lkIjoiMTg4MmUwNjBjYTMxOS0wYzk5OTk5OTk5OTk5OTgtN2I1MTU0NzctOTIxNjAwLTE4ODJlMDYwY2E0NmVkIn0%3D%22%2C%22history_login_id%22%3A%7B%22name%22%3A%22%22%2C%22value%22%3A%22%22%7D%2C%22%24device_id%22%3A%221882e060ca319-0c9999999999998-7b515477-921600-1882e060ca46ed%22%7D","BSFIT_EXPIRATION": "1684453169465","BSFIT_DEVICEID": "eNgfgPaqBaS8qXzJHKXgXxJUCen3U5WF8tO1cjBaMqaDL7EKt2xK0J5XwThnB_kC-VbJC2t-N4axkF2UXAKhRvM7w7kNMRWX8pyxlMitEPPbnWVSnXSU4e2MZvpGBme1L3PX7et2B40xYhXg0MpYpfmUtnuJJTEQ"
}
url = "https://jf.10086.cn/cmcc-web-shop/search/query"
data = {"sortColumn": "default","sortType": "DESC","pageSize": "60","pageNum": "1","firstKeyword": "食用油","integral": "","province": ""
}
response = requests.post(url, headers=headers, cookies=cookies, data=data)

代码运行之后,可以得到预期的数据:

68c1693d3e8c4fb2eb123afa0dcbd30b.png

这里【甯同学】也给出了对应的代码,如下所示:

55d8d6297e5a4be3ed03d03e96413aee.png

后来【瑜亮老师】测试发现,请求头里边只需要增加ua和origin就可以了。

5925e11348b61e8f77ad8f65766e6f77.png

顺利地解决了粉丝的问题。

969c8544080f21be032d65105a0d8882.png

三、总结

大家好,我是皮皮。这篇文章主要盘点了一个Python网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

最后感谢粉丝【刘桓鸣】提问,感谢【隔壁😼山楂】、【瑜亮老师】、【eric】、【甯同学】给出的思路和代码解析,感谢【冷喵】、【Ineverleft】、【༺࿈黑科技·鼓包࿈༻】等人参与学习交流。

【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。

4e6e8e4af00270b90eb87095fe4be164.png

大家在学习过程中如果有遇到问题,欢迎随时联系我解决(我的微信:pdcfighting1),应粉丝要求,我创建了一些高质量的Python付费学习交流群和付费接单群,欢迎大家加入我的Python学习交流群和接单群!

f18c8508f83356fb25803a9c10cf7a12.png

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

7e48b7a78d8962fa1d3e75dd48b34fe8.jpeg

------------------- End -------------------

往期精彩文章推荐:

  • if a and b and c and d:这种代码有优雅的写法吗?

  • Pycharm和Python到底啥关系?

  • 都说chatGPT编程怎么怎么厉害,今天试了一下,有个静态网页,chatGPT居然没搞定?

  • 站不住就准备加仓,这个pandas语句该咋写?

694be067e69fde34f82c245e48397625.png

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62636.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

请问这个网址怎么用httpx 把json数据取出来

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 空山新雨后,天气晚来秋。 大家好,我是皮皮。 一、前言 前几天在Python铂金群【gyx】问了一个Python网络爬虫处理的问题&#xf…

大伙,为啥我爬虫爬百度搜索得出的结果是0啊?

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 君王掩面救不得,回看血泪相和流。 大家好,我是皮皮。 一、前言 前几天在Python白银交流群【~Crazy】问了一个Python网络爬虫处理…

Python网络爬虫,我目前只能获取单个文件,为啥?

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 归来池苑皆依旧,太液芙蓉未央柳。 大家好,我是皮皮。 一、前言 前几天在Python钻石交流群【Jethro Shen】问了一个Python网络爬…

盘点一个Python网络爬虫过验证码的问题(方法一)

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 低眉信手续续弹,说尽心中无限事。 大家好,我是皮皮。 一、前言 前几天在Python最强王者群【鶏啊鶏。】问了一个Python网络爬虫的…

小红书怎么推广笔记?小红书推广笔记有什么用?

小红书平台问世以来,得到快速发展,目前已经是电商领域的后起之秀,也是重要的口碑平台,在女性及生活用品方面的影响力不次于微信和微博,可以说是和抖音齐名的新秀平台。大家都知达到小红书平台的重要重要性,…

小红书笔记下沉的方法和技巧

小红书目前用户越来越多,随之而来发布的笔记数量也大了起来,不可避免得出现很多恶意的负面笔记,让大家很头疼。 下面推神网(daizuobaike)就给大家详细介绍下几种小红书负面笔记处理的方式: 1.官方入口,达到…

3.13 小红书笔记怎样带话题,才能增加曝光?【玩赚小红书】

虽然很多博主都知道在笔记内容最后要带上一个相关话题,但却很少人知道带什么样的话题,如何找到官方话题或热门话题来提高笔记内容的曝光。这一篇文章黄宇风就来讲讲,小红书笔记该如何带话题。 ​ ​ 1、挖掘小红书笔记热门话题 笔记带话题主…

小红书笔记没人看是什么原因?账号正常吗

相信很多人都遇到过自己认为笔记质量不错,但仍然会出现发布的小红书笔记没人看的情况。我们将为大家分析可能是哪些原因造成了这方面的困境,并告诉大家应该如何解决这些问题。 一.小红书笔记没人看的原因 1.账号违规 如果账号本身昵称、个性…

小红书怎样找回原账号_小红书笔记数据好不好,关键词搜索占一半

用户获取、浏览小红书笔记的渠道大致可以分为四个,一个是关注的博主账号,首页会有他们的笔记内容推荐;一个是主页上的发现页面,会推荐平常该用户感兴趣的内容以及附近地点的笔记;另外还有的则是小红书系统推荐。但更多小红书用户平常看笔记、…

小红书笔记打开显示连接不到服务器,小红书笔记看不到全文怎么回事啊?怎么发布小红书笔记?...

我们可以通过小红书购物笔记了解一些商品哦,因为小红书购物笔记里面的内容基本都是一些买家的购物体验,对于要买东西的我们来说,可以提供一些建议。可是最近有网友咨询小红书笔记看不到全文,小红书购物笔记找不到怎么回事?怎么发…

与领导吃饭需要注意什么

虽然说招待客人需要一定的技巧,但不是所有的聚餐,对方都会答应宴请;尤其是下属请领导吃饭时,不仅需要各种礼仪,还需要一定的技巧;当领导遇到下属,要请客吃饭时,都认为下属是有目的的…

新来的领导把我的职务免掉了,一年后,我要不要找领导聊聊?

你这一年都不找领导聊,现在人家另外两个都官复原职了,你才想起来聊聊,晚了。 从你的叙述中可以看出,你是一个非常正直的人,要不然被免职后也不会这么干等着。但正是你的正直,才导致了复职的是另外两个 &am…

领导找你谈话要注意这些

我的朋友小单每天努力工作,得到领导的重视;有一次小单正在认真工作,领导突然把小单叫到办公室谈话。小单一开始还有些紧张,没想到领导正好找她谈心,小单明白了领导的目的后就开口说话了。领导表面上只是问,…

如何看待程序员休息时间不工作被领导威胁辞退的?

在现在的互联网行业,程序员在职场工作肯定是十分辛苦的,基本很多公司都是996制度,这也和互联网行业工作环境有关系。因此程序员基本就只有周末一天假,所以难得休息一下。就有一名程序员因为在休息时间不工作被领导威胁辞退&#x…

程序员被领导辞退,1周后接到领导电话,听完后网友:把他拉黑

员工离职后,跟原来的单位就不再是雇佣关系,如果原单位有事情需要员工帮着解决,员工该不该收取报酬呢,但有的老板却认为,员工当时在公司留下的后遗症,他帮着公司解决,理所当然。 最近有一位程序员…

程序员和领导聚餐晒图,网友回复亮了:发量上就知道谁是新来的

目前大家都知道现在互联网行业的高薪,另外随着互联网行业们,门槛的降低,有很多人都想要加入到和联网行业当中来,而薪资高待遇好也是程序员让人羡慕的一方面,虽然一方面吐槽你互联网行业的辛苦加班,没有个人…

没有五十瓶红牛我是不会告诉你——面试中应该如何正确谈薪

文章末尾给大家留下了大量福利 前言 金九银十已经来临,很多小伙伴已经开始投身跳槽的准备中了。大家选择跳槽无非是想增加自己的工资收入,所以面试过程中的谈薪环节就显得尤为重要,谈的好与不好,未来整个的薪资水平都可能受影响…

为什么明明你做了很多事,到头来领导还是给你打了差评?

阅读本文大概需要 5.33 分钟。 这个问题源于一个队友的疑惑,原问题是 我在国企工作,平时工作之外,多做了很多事情,由于领导不懂技术,年底了,把我当作一般科室人员处理了,感觉看不到未来&#xf…

某程序员发现老板娘偷看同事微信火速离职!网友:这。。。

近日,湖南长沙李先生工作时意外发现老板娘偷看同事的微信,在告知同事后,小李觉得老板娘没素质最终选择离职。 视频显示,一女子正坐在电脑前翻阅微信聊天记录。根据小李和其同事对话的得知,那台电脑上登录的是小李同事的…

马斯克39页火星计划,也许是人类史上最伟大的PPT

“硅谷钢铁侠”马斯克一直梦想着火星移民。作为现在SpaceX公司首席运营官,他提出了核心答案,在火星上建造一座完整的城市。人类正成为多行星物种。 “你想在早晨醒来,并认为未来将会很好 - 这就是航天文明的全部内容。这是关于相信未来&#…