Python采集双色球历史开奖信息,看看哪个号中奖概率更大

目录标题

      • 前言
      • 知识点:
      • 开发环境:
      • 基本流程:
      • 代码展示
      • 尾语

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

知识点:

  1. 爬虫基本流程

  2. requests的使用

  3. 动态数据抓包

开发环境:

  • 解释器: python 3.8

  • 编辑器: pycharm 2022.3

  • requests >>> pip install requests

第三方模块安装:

win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)

python资料、源码、教程\福利皆: 点击此处跳转文末名片获取

基本流程:

一. 思路分析

找到数据来源当前的这个数据 是动态数据还是静态数据network 网络资源抓包  捋清楚整个案例的实现过程访问该网址 获取到 数据内容并且将我们需要的数据内容提取出来保存 (单页)多页采集 分析 链接变化规律 构建翻页规律 实现多页采集

二. 代码实现

  1. 发送请求

  2. 获取数据

  3. 解析数据

  4. 保存数据

代码展示

import requests     # 第三方库 需要额外安装
import csvheaders = {'Accept': 'application/json, text/javascript, */*; q=0.01','Accept-Encoding': 'gzip, deflate','Accept-Language': 'zh-CN,zh;q=0.9','Cache-Control': 'no-cache','Connection': 'keep-alive','Cookie': 'HMF_CI=1b17efcb79bb1c54b0972d1e27d1af031f8912351c906f5874e3ee7ad1ca9563806c6b7e37f7dc287b3165e3422da231f587a0c6a2923dea32cb0e422e6553046a; 21_vq=4','Host': 'www.cwl.gov.cn','Pragma': 'no-cache','Referer': 'http://*****/ygkj/wqkjgg/ssq/','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36','X-Requested-With': 'XMLHttpRequest',
}
f = open('双色球.csv', mode='a', newline='', encoding='utf-8')
源码、解答、教程、安装包等资料加V:qian97378免费领
csv_writer = csv.writer(f)
csv_writer.writerow(["日期", "红球", "蓝球", "奖池金额", "中奖情况", "一等奖人数", "一等奖金额", "二等奖人数", "二等奖金额", "三等奖人数", "三等奖金额", "四等奖人数", "四等奖金额", "五等奖人数", "五等奖金额", "六等奖人数", "六等奖金额"])
for page in range(1, 54):print(f"正在抓取第{page}页")url = f'http://*****/cwl_admin/front/cwlkj/search/kjxx/findDrawNotice?name=ssq&issueCount=&issueStart=&issueEnd=&dayStart=&dayEnd=&pageNo={page}&pageSize=30&week=&systemType=PC'response = requests.get(url=url, headers=headers)json_data = response.json()# red->0->resultresult = json_data['result']for res in result:reds = res['red']blue = res['blue']date = res['date']poolmoney = res['poolmoney']content = res['content']prizegrades = res['prizegrades']one_prize, one_price, two_prize, two_price, three_prize, three_price, four_prize, four_price, five_prize, five_price, six_prize, six_price = "", "", "", "", "", "", "", "", "", "", "", ""for prizegrad in prizegrades:if prizegrad['type'] == 1:one_prize = prizegrad['typenum']one_price = prizegrad['typemoney']elif prizegrad['type'] == 2:two_prize = prizegrad['typenum']two_price = prizegrad['typemoney']elif prizegrad['type'] == 3:three_prize = prizegrad['typenum']three_price = prizegrad['typemoney']elif prizegrad['type'] == 4:four_prize = prizegrad['typenum']four_price = prizegrad['typemoney']elif prizegrad['type'] == 5:five_prize = prizegrad['typenum']five_price = prizegrad['typemoney']elif prizegrad['type'] == 6:six_prize = prizegrad['typenum']six_price = prizegrad['typemoney']print(date, reds, blue, poolmoney, content, one_prize, one_price, two_prize, two_price, three_prize, three_price, four_prize, four_price, five_prize, five_price, six_prize, six_price)# 我要保存为一个表格# 期数 红球 蓝球 中奖情况 奖池金额 一等奖中奖人数 一等奖中奖金额 二等奖中奖人数 二等奖中奖金额csv_writer.writerow([date, reds, blue, poolmoney, content, one_prize, one_price, two_prize, two_price, three_prize, three_price, four_prize, four_price, five_prize, five_price, six_prize, six_price])

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68847.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华南理工大学计算机/软件 复试 经验贴整理

文章目录 最新更新2023/02/24 : 我能提供?(21,22届复试全流程,如何找复试资料,一些学习技巧,前人经验,闲聊,会就答...)2020年2019年其它资料来源 最新更新202…

北京交通大学计算机考研02102、02103复试经验分享

【2023考研复试重要时间节点】 2023年3月20号左右计算机学院公布复试线与复试名单。2023年3月底参加复试。2023年4月初公布拟录取名单。 【复试解读】 【进入复试数据】 【1】新冠疫情之前(20、21、22考研),北交计算机复试一直都是包括线下…

西北工业大学网络安全考研复试经验

初试直接看我师姐的文章吧,传送门:西北工业大学网络空间安全考研经验分享_崔啊是个幸福的人的博客-CSDN博客_西北工业大学网络安全考研报考学校:西北工业大学学院:网络空间安全专业:847初试分数:391英语&am…

研究生计算机专业知识复试面试常见问题

研究生计算机专业复试面试常见问题 操作系统1. 进程和线程区别和联系2. 常见的调度算法3. 死锁的产生和解决4. 虚拟内存,页面置换算法5. 磁盘调度 数据结构1. 常见的排序算法过程和时间复杂度,空间复杂度2. 深度搜索和广度搜索深度搜索(DFS)广度搜索&…

计算机网络考研复试速成 - 知识点精炼 - 背诵版

计算机网络复试速成 针对于计算机考研复试 - 计算机网络 ,删除了很多初试中关于 计算、冗余 的内容,把复习中心放在 高频知识点 (偏向概念) ,希望可以节约准研究生们的复习时间!大家可以放心食用🍖🍖&#…

陕西师范大学计算机考研复试,复试干货 | 陕西师范大学考研复试经验分享贴...

本文为陕西师范大学应用心理学方向复试经验,其它方向复试流程与其基本一致,可放心参考学习~ヾ() 一、陕师大复试分数要求 每年的情况有一些不同,2017年以前进入复试分数线浮动在350-360分之间,2018年题稍难一些,复试分…

南师大教育技术学初试复试调剂经验分享

南师大教育技术学考研经验分享 1 概述... 1 2 初试准备经验... 2 2.1 政治部分... 2 2.2 英语部分... 2 2.3 c语言和web部分... 2 2.4 数据结构部分... 3 2.5 教学设计部分... 3 2.6 初试资料网盘分享... 3 2.7 当你不想学习时怎么办... 3 3 复试调剂经验... 3 3.1 复试和调剂资…

上海交通大学考研复试模块小结——密码学

好久没有写博客了,本来说的是自从成绩出来要好好准备复试,结果距离成绩出来一个月了,复试一点动静都没有,那我还是一边准备相关的专业课,一边按专业的形式,把相关的专业课知识再过一遍,哎~真是太…

河海大学软件工程学硕考研复试经验贴

一、写在前面 想必看到这篇文章的学弟学妹都已经考完初试了,考得如何每个人心中各有千秋。无论如何,坚持将考研整个过程走下来的你们就已经是最棒的了,现在可以好好休息一下,静待考研成绩的公布了。 我写下这篇文章的目的主要是…

夏令营导师推荐信怎么写(浙大CS上岸老学姐手把手教你)

Hello,我又来了!前几天分享了自己的个人陈述,写了一些注意事项,也把自己之前的模板分享给了很多学弟学妹,在这里祝大家早日拿到心仪offer!老规矩,还是先来介绍一下我自己: 本人就读于…

中科院一博士论文走红,看哭众多网友

本文转载自 凤凰网 “我走了很远的路,吃了很多的苦,才将这份博士学位论文送到你的面前。二十二载求学路,一路风雨泥泞,许多不容易。如梦一场,仿佛昨天一家人才团聚过。” 上述文字来自于一篇博士论文的《致谢》部分。…

恭喜马斯克、纳德拉当选美国工程院院士,张宏江、方岱宁入选外籍院士

2 月 9 日,美国国家工程院(National Academy of Engineering,NAE)宣布了 2021 年度国家工程院增补院士名单,此次共有 111 名院士和 22 名外籍院士入选。目前美国工程院院士总数达到 2388 名,国际院士人数达…

两院院士直言:不要迷信院士

本文来源:paperRSS,编辑:募格学术 导读: 王选(1937年2月5日-2006年2月13日),计算机专家。江苏无锡人。1991年当选为中国科学院院士,1994年当选为中国工程院院士,获得2001…

iMeta期刊顾问James M Tiedje当选中国科学院外籍院士

热烈祝贺iMeta期刊顾问James M Tiedje教授当选中国科学院外籍院士 James M Tiedje院士简介 单位主页:https://www.canr.msu.edu/people/james_m_tiedje James M Tiedje谷歌学术主页 https://scholar.google.com/citations?user5ekyvtAAAAAJ James Tiedje教授在共发…

【华人学者风采】查正军 中国科学技术大学

【华人学者风采】查正军,中国科学技术大学大数据学院教授。主要从事图像视频分析与检索、多媒体大数据分析、计算机视觉、人工智能等方向的研究。累计发表学术论文百余篇,其中ACM/IEEE汇刊论文及CCF推荐A类会议长文数十篇。多次获得国际会议论文奖励&…

3名院士被处理,院士改革确实动真格了!

仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:学术严选,科奖中心 近日,北京理工大学、中科院分别发布通报,对方岱宁院士相关视频事件进行处理。 其中中科院的处理结果如下: 停止方岱宁…

Leetcode654 最大二叉树

给定一个不重复的整数数组 nums 。 最大二叉树 可以用下面的算法从 nums 递归地构建: 创建一个根节点,其值为 nums 中的最大值。 递归地在最大值 左边 的 子数组前缀上 构建左子树。 递归地在最大值 右边 的 子数组后缀上 构建右子树。 返回 nums 构建的 最大二叉树…

Leetcode655 输出二叉树

给你一棵二叉树的根节点 root ,请你构造一个下标从 0 开始、大小为 m x n 的字符串矩阵 res ,用以表示树的 格式化布局 。构造此格式化布局矩阵需要遵循以下规则: 树的 高度 为 height ,矩阵的行数 m 应该等于 height 1 。 矩阵…

Leetcode782 变为棋盘

一个 n x n 的二维网络 board 仅由 0 和 1 组成 。每次移动,你能任意交换两列或是两行的位置。 返回 将这个矩阵变为 “棋盘” 所需的最小移动次数 。如果不存在可行的变换,输出 -1。 “棋盘” 是指任意一格的上下左右四个方向的值均与本身不同的矩阵。…

洛谷P8840 Java题解

题目描述 花栗鼠科技大学的计算机组成原理实验最终的结课考核方式是提交一份报告。 然而作为任课老师,萝老师不希望大家过于内卷,所以指定了如下规定: 每份报告有一个卷面基础分 aa。 在此基础上: 若是报告字数低于 1616 页&a…