以某乎为实战案例,教你用Python爬取手机App数据

1

前言

最近爬取的数据都是网页端,今天来教大家如何爬取手机端app数据(本文以ios苹果手机为例,其实安卓跟ios差不多)!

本文将以『某乎』为实战案例,手把手教你从配置到代码一步一步的爬取App数据!

2

配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

点击Connections

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

3

配置手机代理

1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig
mac或linux:ifconfig

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

点击下载证书后,下面就开始安装(看图操作

ok,这样手机端就配置完成,下面开始抓取数据!!!

4

抓取数据

1.打开某乎app

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

这样我们获取的数据包列表就都是过滤条件内的目标网址

3.查找数据包

比如点击热榜

对应的https加密数据包如下:

数据包中的数据如下:

提取出url链接

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-
## 李运辰 2021-3-20
import requests
import jsonheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',}
url = "https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0"
res = requests.get(url, headers=headers)
res.encoding = 'utf-8'
s = json.loads(res.text)
list = s['data']
for i in list:title = i['target']['title']print(title)

ok这样就可以将数据获取下来!

5

总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某户为实战,实现了python爬取手机app数据(详细教程,推荐收藏)。

近期热门文章

  • 30 行代码实现蚂蚁森林自动收能量(附送源码)

  • Linux 最常用命令:简单易学,但能解决 95% 以上的问题

  • 2021了,最流行的密码依旧是123456

  • 真香!用VS Code直接浏览GitHub代码 !

  • 从万众期待到口碑扑街!唐探3令人失望,用Python来分析一下大家的评论

  • 用Python分析了某大学2000千条表白墙,甜到发腻,原来脱单的秘密是……

  • 值得收藏!20个Python奇技淫巧,让你受益匪浅!

  • 这款IDEA插件刷爆了朋友圈,网友:这用起来有点酸爽~

  • 央视最美记者王冰冰火爆B站,单个视频1800万播放,都说了啥?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72217.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用Python爬虫抓取手机APP的传输数据

大多数APP里面返回的是json格式数据,或者一堆加密过的数据 。这里以超级课程表APP为例,抓取超级课程表里用户发的话题。 1、抓取APP数据包 表单: 表单中包括了用户名和密码,当然都是加密过了的,还有一个设备信息&am…

22. 听说你想要用爬虫采集我的手机号?哎 ~ 我展示用的是图片

本篇博客我们实现图片渲染手机号码案例,用于防止爬虫直接采集文字信息。 爬虫训练场 本案例实现的效果如下所示 文章目录 bootstrap5 实现名片样式卡片补充数据生成逻辑生成用户 5 个汉字的昵称调用头像 API,生成图片将手机号码生成图片bootstrap5 实现名片样式卡片 在 Boo…

一种解决Qobuz客户端一直转圈加载不出来的思路

先上图,Qobuz在Win10上的客户端是这样滴 之前是最高音质,换到最差音质还是加载不出来。可能是我网络的问题,但是代理节点是没问题的。然后我尝试了一下Qobuz的Web Player。 就是登录之后画红圈这个 秒开好吧,也不卡顿&#xff…

2022年注册会计师(CPA)考试测试题及答案

1、某外国投资者协议购买境内公司股东的股权,将境内公司变更为外商投资企业,该外商投资企业的注册资本为700万美元。根据外国投资者并购境内企业的有关规定,该外商投资企业的投资总额的上限是( )万美元。 A.1000 B.1400 C.1750 D…

【PMP】PMP考试练习题(中英文对照)

1. A company wants to ensure that project failures are addressed in project documentation. Where should the project manager include them? A. Project management plan B. Risk management plan C. Change management plan D. Communications management plan 公司希…

PMP通过率大跌,是否与新版考试大纲有关?

通过率的增长和下降并不是只看考试内容或者说考试是否有重大改革来的,毕竟每年的考生水平都是不一的,我们也没有办法去确定一个考试的通过率高低是否准确,你相信那就是,不相信同样对于你是否能过通过考试也没有多大影响。 考试并不…

超级好用『PMP考试答题24计』一次通过考试~(1)

作为一个想一次通过PMP考试的老考试人。 刷题、报班、看视频、看教材甚至是通过人的经验贴都不会放过的我,只要是与通过PMP考试有关的都想去看看了解了解,避避坑。 但是内容有太多,而且考试的经验也就只能看看,在自己身上好像没…

PMP中文报名注意事项

随着PMP得到越来越多的关注和认可,报考人数也在逐年快速增长着。 而PMP的考试,分为英文报名和中文报名。在PMI官网通过英文报名之后才能进行英文报名。 一般报了机构的学员,机构都会提供英文代报名服务。 而中文报名因为涉及预约考点&…

证券从业资格考试 超全指南

一、考试科目 分为一般从业资格考试、专项业务类资格考试和管理类资格考试三种情况。 一般从业资格考试,即“入门资格考试”,主要面向即将进入证券业从业的人员,具体测试考生是否具备证券从业人员执业所需专业基础知识,是否掌握…

PMP扫盲篇2 | PMP报名、缴费、考试那些事儿~~

接上一篇: ​PMP是一种项目管理考试认证,更是一种思路。 抱着考试的思路,你必须至少把PMBOK完整学下来;抱着学习PMP知识和思路的态度,你要终生阅读PMI的各种guide和参加各种pmp分享会、讨论会——因为你必须不停的学…

2022年注册会计师(CPA)考试模拟题及答案

1、股份有限公司的下列股票发行方式中,不需要证监会核准的是(  )。 A.上市公司发行新股 B.非公众公司非公开发行股票,发行后股东人数为80人 C.非公众公司向特定对象发行股票,发行后股东人数为210人 D.非上市公众…

PMP澳门机考3A学员考试攻略

(刚到澳门,考试前一晚,寻找考场) 备考篇 如何高效学习? 项目整合管理大概13章节,每次直播上课会讲其中的几个章节。 在上课前最好可以预习下讲义,很多内容并不是非得在课上才能获得,…

1. python学习基础

这里写目录标题 python学习总结python学习参考网址环境配置⚖ 包管理说明(涉及包的位置,包的查找原理,如何设置模块,__init.py__)conda和pip换源conda创建激活和切换环境pip进行包的管理🪝[pip官网&#xf…

[精简]快速入门五线谱

五线谱的每一根线,线与线之间的空间,都可以代表一个音,它是可推的低音谱号:高音谱号:接下来,我们需要记住4个do的位置(因为记住了do的位置,其他音就可以推算出来)&#x…

html5 五线谱,五线谱难学?5分钟完成五线谱入门

五线谱 (Musical Notation)是目前世界上通用的记谱法。在5根等距离的平行横线上,标以不同时值的音符及其他记号来记载音乐的一种方法。最早的发源地是希腊,它的历史要比数字形的简谱早得多。在古希腊,音乐的主要表现形式是声乐。到了罗马时代…

国产麒麟软件安装

1、通过应用商店安装 2、软件官网下载 下载qq 1、打开qq官网,找到linux版本 2、找到对应的安装包下载 麒麟是基于Ubuntu版本开发,下载Ubuntu的安装包 3、下载之后直接在下载文件夹双击安装下载的文件 4、输入用户的密码进行授权 5、安装成功 6、打…

CSDN年度征文 | 你好,2023

祝大家新年快乐~🧧🧧🧧 ⭐过去的2022⭐ 2022已成过去,2023慢步向我们走来。回首2022,这一年不是平凡的一年。这一年,有苦也有乐。冬奥会的成功举办、香港回归25周年、二十大胜利召开、航天任务圆满成功等等…

CSDN年度征文 | 你好!2023

本窝在这里祝大家新年快乐~🧧🧧🧧 ⭐过去的2022⭐ 2022已成过去,2023慢步向我们走来。回首2022,这一年不是平凡的一年。这一年,有苦也有乐。冬奥会的成功举办、香港回归25周年、二十大胜利召开、航天任务圆…

h5页面生成分享海报(保存图片、分享)

一、案例简介 最近遇见了h5分享页面,就是自己写的整页内容(内含二维码)可以长按保存到手机里,然后发给别人。 其实就是h5生成分享海报,以前的时候写过这个东西,但是太久了都忘了,然后上网去搜索,答案也是五花八门,也很不简洁,自己理解起来也很费劲,好不容易把代码搬…

小程序制作海报,支持一键生成多张

1. 前言 生成海报是小程序一项寻常普遍的低成本推广方式,在小程序中通过引导用户生成带有小程序二维码的海报发上票圈,来吸引更多的流量。 2. 需求分析 在与朋友圈类似的 带有文字描述 和 最多带有9张图片的 列表中,实现 1/ 使用云开发&…