python爬虫之使用BeautifulSoup模块抓取500彩票网竞彩足球赛果及赔率

目录

  • 前言
  • 分析思路
  • 数据储存
  • 代码
  • 结果展示
  • 结语

前言

竞彩足球是目前比较受欢迎的一种体彩彩种,玩法较为灵活多样,赔率可观,今天就来记录一下如何抓取竞彩足球的开奖信息和赔率。

分析思路

我使用的网站为500彩票,我们以2021年6月9日的比赛结果为例,该天的比赛结果地址为https://trade.500.com/jczq/?date=2021-06-09,打开网页右键对第一场比赛结果进行审查元素操作,发现比赛的信息和结果储存在tbody下的tr class="bet-tb-tr bet-tb-end"中,那接下来我们对每一场比赛的tr进行分析。在这里插入图片描述
打开第一个tr我们发现所有的内容均储存在class名称不同的td当中,比如开赛时间就储存在td class="td td-endtime"当中,而赔率则储存在td class="td td-betbtn"下的p标签下的span标签当中,我们所需的数据的储存结构和位置都弄清楚以后下一步就简单了。
我们就可以使用BeautifulSoup的find_all方法获取所有的tr标签下的td标签,然后可以根据td的索引和class的名称获取到对应标签的文本内容。赔率的话可以在储存赔率的td标签下获取获取span标签即可得到所有的赔率,其他的内容基本都是这个思路只是层数和标签名称不同而已,具体获取方式有很多种,大家可以灵活使用,这里就不一一列举了。
在这里插入图片描述

数据储存

数据的储存我使用的是pandas模块,获取的到数据首先临时储存在字典中,接着将字典转换为pandas的DataFrame数据类型,最后使用merge进行合并和储存为xlsx文件。
数据储存这个部分应该有更加高明和简便的方法,但是本人对于pandas模块还只是一个初学者,所以过程比较繁琐,欢迎各位指教!

代码

BeautifulSoup模块抓取竞彩足球代码:

#!user/bin/env python
#_*_ coding:utf-8 _*_
#_*_ author:taojinwen _*_
import requests,time
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://trade.500.com/jczq/?date=2021-06-09'
header = {
"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
respones = requests.get(url,headers = header)
content = respones.content.decode('gbk')
soup = BeautifulSoup(respones.text,'lxml')
trs = soup.find_all('tr',class_="bet-tb-tr")
index = []
#columns = ['让球','胜','平','负']
data = {'让球':'','胜':'','平':'','负':''}
title = {'编号':'','赛事':'','开赛时间':'','主队 VS 客队':'','百家平均':''}
serial_numbers = []
game_names = []
game_times = []
team_names = []
victory = []
flat = []
defeat = []
for tr in trs:tds = tr.find_all('td')#编号':'','赛事':'','开赛时间':'','主队 VS 客队#每次增加一个空值是为了后期方便合并serial_number = tds[0].text.strip('\n')serial_numbers.extend((serial_number,''))game_name = tds[1].text.strip('\n')game_names.extend((game_name,''))game_time = tds[2].textgame_times.extend((game_time,''))team_name = tds[3].text.replace('\n','')team_names.extend((team_name,''))#让球p = tds[4].find_all('p')p1 = p[0].textp2 = p[1].textindex.extend((p1,p2))#赔率span = tds[5].find_all('span')if len(span) == 6:#同时加载多个元素到列表victory.extend((span[0].text,span[3].text))flat.extend((span[1].text,span[4].text))defeat.extend((span[2].text,span[5].text))else:victory.extend(('未开售', span[0].text))flat.extend(('未开售', span[1].text))defeat.extend(('未开售', span[2].text))
data['让球'] = index
data['胜'] = victory
data['平'] = flat
data['负'] = defeat
title['编号'] = serial_numbers
title['赛事'] = game_names
title['开赛时间'] = game_times
title['主队 VS 客队'] = team_names
df1 = pd.DataFrame(data)
df2 = pd.DataFrame(title)
now = time.time()
ls = time.localtime(now)
time = str(ls.tm_mon)+'_'+str(ls.tm_mday)+'_'+str(ls.tm_hour)+'_'+str(ls.tm_min)+'_'+str(ls.tm_sec)
df = pd.merge(df2,df1,how="inner",left_index=True,right_index=True)
df.to_excel('table{}.xlsx'.format(time))

结果展示

最终在excel表里面看起来不是很美观,细节方面还需进行美化,凑合着先看一下吧!
在这里插入图片描述

结语

如果想抓取多天比赛结果的朋友,可以分析每天赛果url的变化规律,在外面增加一个循环逐天进行抓取!最后欢迎大家在评论区不吝赐教,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/60980.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

世界杯太精彩了,带大家用Python做个足球游戏,边玩游戏边看比赛

文章目录 Python零基础快速制作足球游戏(附源代码) 前言 一、Python环境说明 二、游戏程序说明 1、游戏开始界面 2、人物移动规则说明,可支持两位玩家 3、足球规则 4、主方法调取 三、游戏运行效果与比赛结果 1、游戏开始界面 2、…

大数据平台 异“彩”纷呈你的每次“球”赛预测

关于彩球 北京彩球世纪科技有限公司(以下简称“彩球”)是一家专注于移动互联网体育比赛数据分析和服务的创新型科技公司。旗下产品“彩球”是一款通过大数据分析来为广大体育爱好者提供赛果预测参考的APP,目前提供足球、篮球比赛的分析。彩球…

FinTechthon赛果公布| 这些区块链脑洞如何实现?

通过“时间银行”的区块链公益平台,将志愿服务时间存证上链,牵引多方协作以构建公益体系;将区块链和硬件相结合,打造智能共享快递联盟;把婚姻登记搬到区块链上,将婚姻记录永久上链…… 10月29日&#xff0c…

足球大数据预测胜平负、走地之人工智能算法现状与改进措施

感谢华为云开发联盟收录我的两篇文章,有动力续写足球预测相关话题了。:) 续谈大数据之足球盘口赔率水位分析思路及其实现利器_sundayhost的博客-CSDN博客_足球大数据分析这套查询和验证报表的意义在于:一是,很多人长期…

腾讯控股2020年第一季度财报表现亮眼超预期

江北消息:2020年5月13日港股盘后腾讯发布2020年第一季度业绩报告. 数据显示: 2020财报超预期 第一季度收入1080.65亿元,去年同期854.65亿元,同比增26%。 第一季度净利润288.96亿元,去年同期272.1亿元,同比增6%。 第一…

价格便宜一半 这款智能座舱芯片实际性能却超越高通8155?

全球汽车产业正在经历颠覆式的变革转型,智能座舱作为汽车迈向智能化和网联化路径的关键人机接口,未来将成为满足用户个性化需求和高级驾乘体验的智能移动空间。 在这一过程中,随着智能座舱功能的不断增多,汽车产业对于先进制程、…

天宇优配|越南股指突然重挫超3%A股供销社概念再大涨

经过30多年开展,国家级高新区在创新产出方面,正逐步成为全国专利产出最丰盛的区域。 科技部印发《“十四五”国家高新技术工业开发区开展规划》 11月9日晚间,科技部印发了《“十四五”国家高新技术工业开发区开展规划》(下简称《…

中兴通讯年报或亏损29亿 (zz)

继2012年前三季度巨亏之后,四季度业绩依然表现不佳,亏损加剧。该公司今日发布的数据显示, 2012年全年预计最高亏损额将达到29亿元,同比大幅下降。不过,该公司表示,今年一季度有望实现盈利。上周五该公司报…

扬帆优配|半天翻倍,“蹭热点”翻车,前期“牛股”已近腰斩

周五上午,A股商场整体走低,多数职业板块和个股跌落,军工和核算机等板块逆势上涨,北向资金半天净卖出额约38亿元。 个股方面,昨夜公告被证监会立案查询的奥联电子股价再度大跌,盘中最贱价较近期高位已腰斩。…

Q1净亏损1.35亿元,4G增长乏力「困扰」车规通讯模组龙头

“汽车前装从4G到5G的切换需要一定的时间,现阶段,5G的价格更高,国内客户从4G向5G的转换会受到一些短期影响。”这是车载通讯模组市场龙头企业—移远通信在近日投资者互动上的公开表态。 4G渗透率趋于稳定,5G增速不及预期&#xff…

《扬帆优配》一度放量跌停,通信巨头被抄底,外资净买4.7亿元!

巴西与我国不再运用美元作为中间钱银,跨境付出概念午后走高。 中兴通讯盘中跌停 北上资金抄底 年内股价一路攀升的中兴通讯今天开盘之后一路走低,盘中股价触及跌停,最新收盘价31.6元/股,成交额达到65.12亿元,收跌8.9…

不忘初心牢记使命文化墙励志标语墙贴

不忘初心牢记使命手工剪纸 个性一百定制服务中心,可快速定制各类家居家具用品、工艺礼品、图案造型,提供从构思到设计到制作一条龙服务,您敢想我们敢做。

PressGrid 多用户墙贴(花瓣) WordPress主题[更新至v3.1]

PressGrid 多用户墙贴(花瓣) WordPress主题[更新至v3.1] PressGrid WordPress主题,一个墙贴、瀑布流、多用户收藏网站。主题特点:自适应各种设备,支持用户前端注册登录和提交,cron喜欢自动文章删除选项,100主题选项&am…

不忘初心牢记使命文化励志标语墙贴——个性一百剪纸

不忘初心牢记使命手工剪纸 个性一百定制服务中心,可快速定制各类家居家具用品、工艺礼品、图案造型,提供从构思到设计到制作一条龙服务,您敢想我们敢做。 不忘初心牢记使命绘画贴纸 我们不局限于某种商品,我们的特长就是定制服…

呈美墙贴 - 设计

墙贴是最近几年才欣起的东西,这东西在我们家乡几乎还没有。跟朋友合作搞个网店来玩玩,帮别人开发网店能赚钱,自己也来试试,当然既然是合作,我自然会供献我自己的网络营销知识。我用了一些不正当的网络营销手段&#xf…

利用css做出的图片墙效果_练习

效果: 鼠标触碰时: 代码: <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>相片墙</title><style>* {margin: 0;padding: 0;}ul {height: 400px;border: 1px solid #000;background-colo…

为老婆教5岁儿子学习英语单词做的一个基于微信公众平台的应用

起源:家里买了好些小孩子学习的墙贴&#xff0c;娘子都把其全教会了儿子。一天我问起娘子&#xff0c;最近有没有教儿子学习单词啊&#xff0c;她说她会的都教完了。我沉思了一会&#xff0c;好吧老婆&#xff0c;我做个应用给你。于是乎就有了下面的图: 想试下的同学可以关注…

亚马逊视频营销攻略解析,卖家不可错过的8种视频类型

一、为什么选择视频推广产品&#xff1f; 为什么视频如此重要&#xff1f;我们生活在一个快节奏的世界&#xff0c;人们希望快速获得准确的信息。即使是十秒钟的动画也可以提高销量。 视频多长才算完美&#xff1f;这是个有争议的问题。六十秒钟似乎是最棒的选择。虽然某些产…

cesium实现面状要素的立体拉伸效果

文章目录 1.实现效果2.实现方法2.1存在问题2.2实现代码 Cesium实战系列文章总目录&#xff1a; 传送门 1.实现效果 2.实现方法 2.1存在问题 在三维场景中&#xff0c;如果和二维场景一样&#xff0c;将面状要素简单可视化&#xff0c;则在三维场景中视觉效果不好&#xff0c…

清洁机器人规划控制方案

清洁机器人规划控制方案 作者联系方式Forrest709335543qq.com 文章目录 清洁机器人规划控制方案方案简介方案设计模块链路坐标变换算法框架 功能设计定点自主导航固定路线清洁区域覆盖清洁贴边沿墙清洁自主返航回充 仿真测试仿真测试准备定点自主导航测试固定路线清洁测试区域…