硬核看球,数据分析足坛转会窗口各队表现

本文转载自1024开发者社区,详情可以扫描下方二维码:



640




前言


各大联赛在7月初都打开了转会窗口,各路豪强纷纷出巨资对阵容进行补强,比如格列兹曼加盟巴塞罗那(文章图片源于懂球帝):

640?wx_fmt=jpeg

各家经纪人又到了收获的季节,媒体也是趁此机会大量炮制新闻,极其热闹,涌现出一批“弄潮儿”。

640?wx_fmt=jpeg


本文通过爬取“懂球帝”一个月来转会新闻,为您从数据角度分析转会市场波谲云诡的变化。

本文数据来源懂球帝,只用于学习交流,不用于商业获利,如对任何公司,个人造成不利影响,请告知删除。


640




一、数据获取


在懂球帝APP中搜索“转会”关键字,可以获取转会相关的新闻列表,如图:

640?wx_fmt=jpeg

通过Fiddler 对APP数据进行抓取,获得新闻列表页的URL:

640?wx_fmt=png

具体Fiddler 配置方法见:

https://blog.csdn.net/c406495762/article/details/76850843

通过URL爬取新闻列表中新闻的id,title等信息,代码如下:

for i in range(1, 91):  # 每一页20篇
url= '******************************* ' +str(i ) +'********'
html = requests.get(url=url ,headers=header).content
news = json.loads(html.decode('utf-8'))['news']
this_id = [k['id'] for k in news]
id_list = id_list + this_id
time.sleep(2)
flag += 1
print(flag)
pd_data = pd.DataFrame(id_list ,columns=['id_news'])
pd_data.to_excel('id_news.xls', na_rep=False)

根据得到的新闻id列表,对每一个新闻具体信息进行获取,并存入MongoDB数据库中,代码如下:

def main():
id_list = pd.read_excel('id_news.xls', usecols=['id_news'])
for i in range(1277,len(id_list)):

url = '**********************'+str(id_list.iloc[i,0])
tags = []
News_info = {
'article_id': None,
'title': None,
'visit_total': None,
'writer': None,
'time': None,
'source': None,
'tag': None,
} cookies = 'v=3; iuuid=1A6E888B4A4B29B16FBA1299108DBE9CDCB327A9713C232B36E4DB4FF222CF03; webp=true; ci=1%2C%E5%8C%97%E4%BA%AC; __guid=26581345.3954606544145667000.1530879049181.8303; _lxsdk_cuid=1646f808301c8-0a4e19f5421593-5d4e211f-100200-1646f808302c8; _lxsdk=1A6E888B4A4B29B16FBA1299108DBE9CDCB327A9713C232B36E4DB4FF222CF03; monitor_count=1; _lxsdk_s=16472ee89ec-de2-f91-ed0%7C%7C5; __mta=189118996.1530879050545.1530936763555.1530937843742.18'
    cookie = {}
for line in cookies.split(';'):
name, value = cookies.strip().split('=', 1)
cookie[name] = value
try:
html = requests.get(url=url,cookies=cookie, headers=header).content
except:
print('请求失败', id_list.iloc[i,0])
continue
    n = 1+ random.uniform(0, 2)
time.sleep(n)
try:
news_info = json.loads(html.decode('utf-8'))['data']
News_info['article_id'] = news_info['article_id']
News_info['title'] = news_info['title']
News_info['visit_total'] = news_info['visit_total']
News_info['writer'] = news_info['writer']
News_info['time'] = news_info['time']
News_info['source'] = news_info['source']
infos = news_info['infos']['channels'][:]
for info in infos:
infos_tag = info['tag']
tags.append(infos_tag)
News_info['tag'] = tags
save_to_mongo(News_info,MONGO_TABLE1)
except:
continue

一个月共获取新闻信息1742条:

640?wx_fmt=png

当然球迷的评论更是懂球帝好看的地方,所以讲每篇新闻热评也爬取下来,看看谁是这一个月热评王者。代码原理相同,此处不具体贴出。

主要获取热评文本,点赞数:

640?wx_fmt=png

下面开始我们的数据大餐。


640




二、数据分析


1、阅读量最高top15

转会新闻非常多,其中最火,关注度最高的是哪条消息呢?

通过对阅读量属性排序,R语言ggplot进行可视化(感谢数据森麟:麟哥的指导),效果如下:

640?wx_fmt=png

最受大家关注的果然还是德利赫特的归属问题。

2、哪个球员是被cue最多的?

提到转转会,就不得不说今年转会市场四小龙:

内马尔、德利赫特、格列兹曼、博格巴

下面看看他们到底在转会新闻中的关注度。

640?wx_fmt=png

开始的结果出乎我的意料,贝尔通过月末和江苏队的转会传闻,末段超车,登上榜首:

640?wx_fmt=jpeg

所有球员的云图:

640?wx_fmt=png

3、哪个球队出现频次最多?有你的主队吗?

直接上图:

640?wx_fmt=png

没错,结果在我心中毫无波澜,第一名正是曼抬,不对,是曼联,这里面半壁江山是博格巴和马奎尔贡献的,此外前几名还是被几个江湖老大哥占据,江苏苏宁能上榜也让人欣喜。

所有球队的云图:

640?wx_fmt=png

4、每天转会新闻发布量

足球转会挑时间吗?请看答案:

640?wx_fmt=jpeg

从每日转会新闻量来说,除了周末少一些外,其余时间没有较多规律。

5、哪个媒体发文最多?

球迷圈里一直流传着这样一张形容媒体可信度的图

640?wx_fmt=jpeg

下面来看懂球帝新闻来源的分布:

640?wx_fmt=png

由此看出,我懂消息来源还是比较丰富,自己也拥有大量的原创新闻。

6、新闻标题词云

对新闻标题进行分词和词频统计,通过jieba分词时要添加停用词和自定义词:

jieba.load_userdict('dict.txt')
jieba.analyse.set_stop_words('stop_words.txt')

生成词云如下:

640?wx_fmt=png

对于标题来说,频次最高的就是转会、转会费、官方等等。本图分词做的还不够细致,还有少部分没分好的词。

7、评论数据分析

懂球帝文章的评论区是一篇新闻的精华部分,下面就看一下最热的评论有哪些(由于评论较长,所以以文本的形式展示):

/TOP1/

题目:齐达内:球队正加紧处理贝尔的转会,他尽快离队对双方都好

评论:

就算贝尔离队了

大家别忘了2014年欧冠决赛长途奔袭的反超头球

别忘了2014国王杯的外道超车

别忘了2018年欧冠决赛的绝世倒钩

别忘了他为皇马付出的所有

感谢你!加雷斯

点赞数:12971

/TOP2/

题目:官方:德利赫特加盟尤文,转会费7500万欧+1050万额外费用

评论:

《德利赫特传》

目录:第一章-梦想的开始(阿贾克斯篇)

         第二章-初露锋芒

         第三章-逐梦之路(巴萨初篇)

         第四章-梦想还是现实?(巴黎篇)

         第五章-传说的神抬(曼联篇)

         第六章-眷恋与不舍(自宣可能留队篇)

         第七章-挖掘机哪家强(拜仁篇)

         第八章-白色之梦(皇马篇)

         第九章-突然杀出?老妇人的奋起直追(尤文篇)

         第十章-决战拉胖之巅(巴萨尤文篇)

         第十一章-神抬再次出山?(曼联最后的挣扎)

         第十二章-罗老头的真面目(懂得都懂)

         第十三章-老妇人的最终抉择

         第十四章-梦想终不敌现实(结束)

点赞数:12644

/TOP3/

题目:恩东贝莱加盟热刺,转会费最高7000万欧,热刺队史标王

评论:从此伦敦只有一个穷逼[狗头]

点赞数:8453


在这里不多列举了,对于第三名,为什么就这几个字就能排名如此高,答案不言自明:

640?wx_fmt=jpeg

所有评论的词云:

640?wx_fmt=png


没错,就是狗头,大家最爱的狗头!


◆ ◆ ◆  ◆ ◆


长按二维码关注我们



数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。


管理员二维码:



猜你喜欢

 


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/59724.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HTML球星简介,盘点足坛历史50大球星,第1-第3位

NO.3 马拉多纳(阿根廷),场上位置:前锋/前腰 主要荣誉: 1986年世界杯冠军 1979/1986/1989/1990/1992年南美足球先生 1979/1980/1981/1986年阿根廷足球先生 1986年世界杯金球奖 1979 世界青年足球锦标赛冠军,最佳球员 1985年意大利足…

原来聊天机械人这么厉害?2分钟了解为何各大企业都要使用Chatbot

关键词:跨境电商、Salsmartly(ss客服)、聊天机器人 无论你是想扩展业务范围,创立新公司还是寻找销售机会,那你一定不能错过社群平台助手-聊天机械人!或许你已经听过或是实际使用过,但是可以由阅…

telegram 创建机器人 bot 简介

今天看到一个电报群里说 利用BOT来签到,很好奇就想学学,来吧 ! 创建一个BOT!!! 1、先搜索BotFather 我这里搜索到好几个没有一个可用的,输入/help 返回俄文错误信息。 后来在官网找到了 h…

OBS Studio录制腾讯会议

关键要点 (1)在电脑上录制腾讯会议、(2)录制其他人的说话 OBS Studio使用说明 下载 下载地址 安装 使用默认安装即可。 OBS录制桌面说明 新建场景 给场景添加音频、视频 添加指定桌面捕获 给场景添加“来源”的菜单的说…

腾讯会议共享PPT使用演讲者模式

疫情当头,我们的毕设答辩改成了腾讯会议在线答辩。换做是平时使用投影仪演讲时,我们讲PPT便可以使用演讲者模式,这样就可以对着电脑愉快地念注释了。 问题来了!!!一旦用腾讯会议的共享桌面放映PPT时&#…

腾讯会议使用方法

下载链接: 电脑版https://www.eyunsou.com/soft/lt/txhy/ 手机版:http://mobile.baidu.com/item?pid3972473&docid5001114680&sourcealaddin%40wise_app13%40title&alastrong%405001114680%403972473%40%40title%40%E8%85%BE%E8%AE%AF%E4%BC%9A%E8%AE%AE&al…

Office PPT录屏功能

新建一个ppt 在 插入 的选项卡里找到媒体一栏 会发现确实有屏幕录制的功能,但不出意料的话应该是灰色的 这时候选择 文件 选项卡,将文件类型改成 .pptx 然后点击保存,再回到 插入 选项卡中会发现屏幕录制的功能可以用了

腾讯会议-录屏-转败终端-如何继续转码

答案: 还是使用电脑版的腾讯会议,找到没有转码成功的会议,进入会议,找到1个录制文件,点击转码,就会显示转码的进度条。 转码完成就可以打开视频了。 转码后的效果:

Camtasia2022电脑屏幕录像使用录屏教程

Camtasia屏幕录像机使用方便,视频编辑功能强大。与iSpring一样,可以捕获屏幕的任何部分,使用网络摄像头录制和插入视频,并支持音频、图像和文本的截屏。Camtasia包括绿屏在内的全套动画和视频效果。为了让课程更沉浸,你…

腾讯云多人视频会议 TUIRoom 功能体验

腾讯云多人视频会议 TUIRoom 功能体验 腾讯云 (Tencent Cloud) 是腾讯集团倾力打造的云计算品牌,提供全球领先的云计算和人工智能等技术产品与服务,推动产业互联网建设。 实时音视频(Tencent RTC)基于腾讯多年来在网络与音视频技…

局域网视频会议软件(PoloMeeting)

前言 搜索PoloMeeting试用版,免费试用,但是最大并发数只有3路(一个视频会议房间最多只能进三个账号) 一、安装 安装模块分为MCU服务器端和PC客户端,只参加会议,安装PC客户端即可。安装步骤略 二、使用方…

腾讯会议录屏后,忘记转码或转码不成功的补救方法(含详细图例转码示范)。

一、问题: 腾讯会议录屏后文件只能由腾讯会议识别,其他设备打不开,所以需要用腾讯会议转为MP4格式,通过利用历史会议中操作进行手动转码或者是创建一个新的会议模拟还原设备文件,例如无论是哪一个腾讯会议&#xff0c…

会议录屏没有声音怎么办? 腾讯、钉钉、Teams的解决方案都在这里

会议录屏没有声音怎么办?作为目前最主流的办公方式,远程会议的用户和工具越来越多,如腾讯会议、钉钉会议、Teams会议等。但是,在使用这些远程会议软件时,会出现一系列问题。我看到最多的是录屏会议没有声音。那么&…

腾讯会议录屏后,转码不成功的补救方法。

前两天接到同事求助,说笔记本用腾讯会议开会,本地录屏。完事了由于录制时间长,文件大,结束会议后自动转码没完成,就误把腾讯会议软件关了,导致存储目录里无.mp4文件,只有一堆这个(见…

会议录屏没有声音怎么办?教你一招解决,适用于腾讯会议、钉钉会议、Google会议、Zoom、Teams等

会议是现在最重要的办公方式之一,为了方便远程会议的用户,线上视频会议软件也越来越多了。如:腾讯会议、钉钉会议、Google Meet、Zoom、Teams会议等等。但是,很多人在使用这些线上会议软件的时候,遇到了一些问题。反馈…

为什么我用腾讯会议录屏没声音?教你一招搞定!

为什么我用腾讯会议录屏没声音?教你一招搞定! 最近,各地的疫情形势还是比较严峻,像是上海、北京这些城市每天都有新增病例。大部分企业还是采取远程办公的形式,包括很多的学校基本上都是线上教学,防止疫情…

Zoom会议怎么录屏,录屏存放在哪里,meetingrec文件转换

Zoom录屏是需要主持人同意的,会议主持人可以直接录屏。 首先找到录屏存储地址: 设置>录制>保存地址 一般会存储到zhumuintl(瞩目国际版)或Zoom文件夹中。 如果录制过程是被中断的,可能看到的文件就是meetingrec文件,如果…

腾讯会议发布录屏工具“会记”,让云端视频协作随用随录、随享随看

随着云端协同成为新常态,企业和组织沟通的形式也在不断丰富。1月5日,腾讯会议发布云端录屏工具“会记”, 用户在腾讯会议中就能自由使用人像、屏幕、声音、窗口等多种组合方式进行录制,录制完成后视频将自动上传至云端&#xff0c…