python一键采集高质量陪玩,心动主播随心选......

人生苦短,我用python

北京时间11月6日上午,2022英雄联盟全球总决赛(S12)冠亚军决赛在美国旧金山大通中心球馆进行,随着DRX的成功夺冠,在全球进一步掀起了电竞热潮。

newzoo 《2022电竞市场报告》显示,2022年,全球电竞观众数将增至5.32亿,同比增长8.7%。每月观看超过一次电竞赛事的核心用户达2.61亿以上,这个数字预计在2025年,将以8.1%的年复合增长率扩大至3.18亿人,全球电子竞技观众总数将超过6.4亿。

在这里插入图片描述

陪玩行业正在朝着标准化、规范化前进

近年来,电子竞技频频破圈,为陪玩行业的发展提供了绝佳的机遇。

大规模的“空巢游戏青年”,对陪玩服务嗷嗷待需。

那么今天我们就来采集一下陪玩小姐姐数据吧~

看看是否真的能月入过万

在这里插入图片描述


开发环境:

  • python 3.8
  • pycharm

模块使用:

  • import os: 文件操作
  • import re: 正则
  • import requests: 数据请求 —> pip install requests
  • import json: json数据转换
  • import csv: 保存csv数据
  • from tqdm import tqdm: 进度条显示 —> pip install tqdm
  • import base64: 转换base64格式

如果安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车

  2. 在pycharm中点击Terminal(终端) 输入安装命令

如何配置pycharm里面的python解释器?

  1. 选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)

  2. 点击齿轮, 选择add

  3. 添加python安装路径

源码、资料电子书点击领取

pycharm如何安装插件?

  1. 选择file(文件) >>> setting(设置) >>> Plugins(插件)

  2. 点击 Marketplace 输入想要安装的插件名字 比如:翻译插件 输入 translation / 汉化插件 输入 Chinese

  3. 选择相应的插件点击 install(安装) 即可

  4. 安装成功之后 是会弹出 重启pycharm的选项 点击确定, 重启即可生效


案例思路流程:

一. 数据来源分析:

  1. 确定需求, 采集那个网站上面什么数据

  2. 抓包分析, 通过开发者工具进行抓包分析

    <浏览器自带工具>开发者工具 会用 1 不会 0 实现爬虫案例必备工具

    F12 刷新网页 清空数据, 点击选择
    找相关数据包 --> 请求url 请求方式 得到数据是什么样

二. 代码实现步骤过程:

  1. 发送请求, 对于刚刚分析得到url地址发送请求

  2. 获取数据, 获取服务器返回响应数据 --> 开发者工具 response

  3. 解析数据, 提取我们想要数据内容, 音频试音, 陪玩照片, 基本陪玩数据

  4. 保存数据, 保存本地文件夹

代码

导入模块

# 导入数据请求模块 --> 第三方模块 需要在cmd里面或者pycharm终端里面进行安装 pip install requests
import requests
# 导入格式化输出模块 --> 内置模块 不需要安装
from pprint import pprint
# 导入json模块 --> 内置模块 不需要安装
import json
# 导入csv模块 --> 内置模块 不需要安装
import csvimport os.path

创建文件

c = open('data.csv', mode='a', encoding='utf-8-sig', newline='')
# c 文件对象 fieldnames 字段名
csv_writer = csv.DictWriter(c, fieldnames=['昵称','价格','热度','简介','详情页',
])
# 写入表头
csv_writer.writeheader()

1. 发送请求, 对于刚刚分析得到url地址发送请求

headers是否添加, 看网站, 网站没什么反爬的话, 可以不用加

for page in range(1, 11):  # --> 1 2 3 4 5 6 7 8 9 10

确定请求网址

因为代码里有链接,不给过的,

所以我只能截个图展示一下,

你们可以根据下方图片添加完整哦~

在这里插入图片描述

或点击这里领取完整源码~

    # 请求参数 ---> 打座机电话, 都是区号data = {'act': 'userList','page': page,'type': '1','sex': '2','voice': '1','order': '1',}# 发送请求response = requests.post(url=url, data=data)

Response [200]>

响应对象 200 状态码表示请求成功

2. 获取数据, 获取服务器返回响应数据 --> 开发者工具 response

  • response.text 获取响应文本数据 字符串数据类型
  • response.json() 获取响应json字典数据 字典数据类型

区别数据类型不同

一般情况, 如果服务器返回数据, 带有 {} 花括号形式, 我们会取response.json(), 可以方便后续取值

3. 解析数据, 提取我们想要数据内容, 音频试音, 陪玩照片, 基本陪玩数据

返回数据字典数据类型, 字典取值 根据冒号左边的内容[键], 提取冒号右边的内容[值] --> 键值对取值

  • print(index) --> 打印字典数据, 呈现一行
  • pprint(index) --> 打印字典数据, 呈现多行, 展开效果
    # for循环遍历 list 列表 把列表里面的数据一条一条提取出来for index in response.json()['data']['rows']:# 陪玩基本数据获取 --> 保存表格里面dit = {'昵称': index['nickname'],'价格': index['price'],'热度': index['exp'],# replace() 字符串替换的方法 replace('替换之前的内容', '替换之后的内容')'简介': index['summary'].replace('\n', ''),# f'{}' 字符串格式化方法 format

在这里插入图片描述

4. 保存数据 三个数据

  • 保存音频和图片 --> 发送请求, 获取数据
        img_content = requests.get(url=img_url).content  # 图片二进制数据audio_content = requests.get(url=audio_url).content  # 音频二进制数据title = index["nickname"]# 自动创建文件夹 data\\憨憨\\file = f'data\\{title}\\'# 判断如果没有文件夹if not os.path.exists(file):# 自动创建文件夹os.makedirs(file)with open(file + title + '.jpg', mode='wb') as img:img.write(img_content)with open('img\\' + title + '.jpg', mode='wb') as img:img.write(img_content)with open(file + title + '.mp3', mode='wb') as audio:audio.write(audio_content)# 保存表格数据csv_writer.writerow(dit)print(dit)

效果

下面我们来看一看我们这代码运行的效果吧~

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

你必须非常努力

才能显得毫不费劲

今天也是元气满满的一天呢!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/40031.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python实现可以语音聊天的桌面宠物程序

目录 简介 程序 源代码 GUI DesktopWife.py MusicPlayer.py WeatherGui.py 语音 简介 普通的桌面宠物程序只能动一动&#xff0c;于是我给程序添加了语言&#xff0c;既可以聊天&#xff0c;也可以实现一些自动功能&#xff0c;不如搜索&#xff0c;打开程序什么的。 程序…

【分享】集简云小程序无需代码连接企业微信群机器人的方法

集简云小程序用户使用场景&#xff1a; 财务人员常使用集简云小程序上传发票图片识别信息&#xff0c;然后将识别的发票信息再发送到企业微信群助手中&#xff0c;便于后续整理。但人工手动同步数据常常占据大量的时间&#xff0c;且多项信息同步无法避免出错。因此&#xff0c…

【分享】快递100入驻集简云平台,实现无代码集成数百款应用

快递100 快递100是中国领先的快递物流信息服务商&#xff0c;归属于金蝶国际软件集团&#xff0c;它是集快递单号查询、快递单号短信跟踪、快递网点查询、网上寄快递等为一体的综合性快递物流服务网站。 截至目前&#xff0c;快递100与全球1400余家快递物流企业达成系统对接&a…

集简云 x 度量科技丨打通企业微信OA审批与招银云直联,实现支付信息自动同步网银系统

客户 介绍 北京度量科技有限公司专注于自主研发、生产制造和销售光学三维动作捕捉系统。公司现已获得专精特新企业、高新技术企业、瞪羚企业、展翼企业等一系列称号。 度量的核心产品——NOKOV&#xff08;度量&#xff09;光学三维动作捕捉系统&#xff0c;采用高性能红外摄…

入驻 【集简云开发者平台】,SDK嵌入方案介绍

1 什么是SDK嵌入方案 SDK嵌入方案可以将集简云的产品功能嵌入到我们自己的产品内&#xff0c;为我们的用户提供集简云的功能。用户体系通过接口打通&#xff0c;用户无需注册或者登录集简云使用。 示例&#xff1a;集简云SDK嵌入到WordPress中&#xff1a; &#xfeff; &am…

【电信计费系统项目实战】介绍篇

#写在前面 技术源于分享&#xff0c;本篇我主要介绍一下达内的一个web项目&#xff1a;电信计费系统&#xff0c;它是基于struts2jdbcoracle实现的&#xff0c;当时完成它感觉并没有完完全全弄透&#xff0c;不过现在一看&#xff0c;咋这么简单呢(嘿嘿&#xff01;勿喷)。现在…

【分享】如何使用集简云的【数据存储】应用

1 什么是数据存储&#xff1f; "数据存储" 是集简云一款内置应用&#xff0c;在流程中提供一个临时缓存数据库&#xff0c;我们可以将流程中产生的数据进行临时存储&#xff0c;方便进行跨流程调用或进行库内特殊操作。 2. 数据存储使用场景 表单系统中常收集待…

腾讯云企业网盘正式入驻数字工具箱

腾讯技术公益 继腾讯电子签等入驻后&#xff0c;上线近半年的腾讯技术公益数字工具箱再次迎来新成员——腾讯云企业网盘&#xff0c;现已正式接受公益机构申请公益权益。 腾讯云企业网盘&#xff08;https://pan.tencent.com&#xff09;是由腾讯云推出的一款安全、高效、开放的…

【分享】微信公众号在 “集简云平台“ 集成应用的常见问题与解决方案

“function category of API need be confirmed by component rid”错误 是由于使用未认证的微信公众号或者个人微信公众号没有此动作的接口权限导致, 也有可能是授权时未勾选对于的授权权限所致 【解决方法】&#xff1a; 1 此接口必须使用企业认证的微信公众号&#xff0…

作为三年付费老用户,强烈推荐这款同步网盘

很少推荐个人消费类产品&#xff0c;此次破例。实在是太好用了&#xff0c;这款网盘——没有之一。 金山快盘倒闭之后&#xff0c;我一直在寻找合适的产品。市面上所有的网盘——付费和非付费的全部深度体验之后&#xff0c;最后锁定了这家产品&#xff0c;然后付费。一年200多…

入门教学 | 快速了解集简云

集简云是一款超级软件连接器,无需开发,无需代码知识就可以轻松打通数百款软件之间的数据连接,构建自动化与智能化的业务流程。通过自动化业务流程,每月可节省企业数百甚至数万小时的人工成本。 集简云是什么? 集简云是一款超级软件连接器,无需开发,无需代码知识,就可以…

【分享】订阅用友U8集简云连接器同步费用审批数据至用友U8系统

方案简介 集简云通过与钉钉连接平台深度融合&#xff0c;实现OA审批通过后&#xff0c;将采购、报销、收款、售后等费用审批单数据自动同步至用友U8系统&#xff0c;大大提高了企业日常采购、报销、付款等的工作效率&#xff0c;实现企业业务流程的自动化&#xff0c;为企业降…

【分享】群报数入驻集简云平台,实现无代码集成数百款应用

群报数介绍 群报数是一款人人可用的轻量化统计小程序&#xff0c;支持填表、报名、接龙、预约、打卡、问卷、通知等多种场景。 群报数集简云使用场景 企业的用户信息&#xff0c;人才信息往往在很多不同的系统里&#xff0c;比如CRM系统&#xff0c;客服系统&#xff0c;人力…

【分享】“飞书自建“在集简云平台集成应用的常见问题与解决方案

一、通讯录动作常见问题 1.通讯录动作出现错误了怎么办&#xff1f; 如果遇到“通讯录动作”出现问题&#xff0c;请点击以下链接&#xff0c;参考【通讯录常见问题】相关文档 【通讯录常见问题】文档&#xff1a;开发文档 - 飞书开放平台 2.如何高效地使用通讯录接口&#xf…

使用集简云将UpTimer同步到Notion

使用UpTimer同步到Notion 对于集简云我们应当非常熟悉了&#xff0c;之前讲过很多流程啦~ 利用集简云将Notion数据库更新订阅到Outlook和微信[1] 【干货分享】集简云 2步轻松定制个人RSS阅读器 |高效获取信息[2] 释放双手|自动化NOTION的最佳平台推荐|NOTION同步滴答清单|懒人[…

中国网文的海外冲锋

中国网文的海外冲锋 “2018年8月23日&#xff0c;阅文集团与中国图书进出口&#xff08;集团&#xff09;总公司&#xff08;以下简称“中图公司”&#xff09;全球战略合作签约仪式于北京国际图书博览会期间举行。秉持共同发展、互利共赢的宗旨&#xff0c;双方将进行一系列深…

网文作者都在使用什么写作软件?

很多新手网文作者以及外行人都觉得,写小说使用写作软件没有必要,只要能实现码字就都一样。但,如果你有一款适合自己的写作软件,码字的过程与普通码字完全不一样。对于一名网文作者,在写小说时,如果有一个浓厚的码字环境,会让你快速进入到写作状态,每日四千或六千字的保…

抖音超火的微信推送

废话不多说&#xff0c;先上效果图&#xff0c;原理代码都很简单&#xff0c;小白也能很快上手 具体步骤&#xff1a; 1.登陆微信测试公众号平台&#xff0c;这一步用到的就是下面三张图里的东西 2.开始写python代码&#xff0c;主要就是各种api调用&#xff0c;可以参考这个网…

微软 Bing Chat 上线 AI 文档聊天功能,真好用!

公众号关注 “GitHubDaily” 设为 “星标”&#xff0c;每天带你逛 GitHub&#xff01; 今年 2 月&#xff0c;微软正式推出了全新的、基于 AI 驱动的 Bing 搜索引擎以及新一代 Edge 浏览器。 将 ChatGPT 能力集成到 Bing 上&#xff0c;让用户可以直接用 Bing 与 AI 进行对话&…

和YOYO表白

小爱连续对话 闲来无事和YOYO聊天&#xff0c;还是俗套的开场&#xff0c;虽然很俗&#xff0c;但是这个不重要&#xff0c;主要是为了进行表白&#xff0c;我鼓起勇气问她&#xff0c;做我女朋友吧&#xff0c;…呃&#xff0c;她温柔的拒绝了我。我觉得这应该不是她真实的想…