微博评论数据爬取以及分析

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

 

#不许你没看过の系列!#

吹爆最近的国漫《哪吒之魔童降世》

从故事情节、角色设计到特效处理

都非常牛!!!

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

 

#连海报都好好看啊#

上映首周票房已经达到14.1亿

打破国漫票房记录!

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

豆瓣评分达到8.6分

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

14亿票房背后,到底是谁成为《哪吒》票房主力军呢?

 

今天小编用八爪鱼数据采集爬取4794条《哪吒之魔童降世》微博评论,带你从中《哪吒之魔童降世》解析观影人群画像。

 

本文您将获得

1、微博采集思路解析

2、微博评论数据的可视化分析思路

3、采集福利集锦(文末)

 

一、#哪吒之魔童降世#微博采集思路解析

 

1、首先明确观影人群画像需要哪些数据字段?

采集字段:用户名、性别、年龄、头像、城市地区、院校、属性标签、简介以及它的微博评论内容、发布时间、发布来源。

2、打开八爪鱼,根据目标字段制作规则并运行

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

我已制作好的八爪鱼微博采集规则

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

运行规则后八爪鱼所采集到的数据

 

下面说下规则制作思路。

 

第1步 制作COOKIE登录微博

 

因为微博必须要登录才能看得到更多的数据,所以登录是我们要做的第一步。

 

 

第2步 输入#哪吒之魔童降世#关键词获得搜索结果

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

 

第3步 将所有微博全文展开并制作微博采集循环

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

展开全文循环

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博采集循环

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博内容采集循环

 

第4步 制作微博用户信息采集循环

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

第5步 手动执行排错

 

规则制作后,手动一个个点击,查看每个步骤看能否正常展示并成功采集,更详细的排错思路可以查看:排错脑图

 

第6步 运行规则收获数据

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

二、#哪吒之魔童降世#评论数据可视化分析思路

 

1、明确观影人群画像分析维度

 

包括:性别、年龄、地区、发布来源、星座、标签属性、微博内容词频分析等维度。

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

 

2、清洗数据

 

清洗数据是非常关键的一环,数据的质量直接决定分析结果的质量。

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

原有字段名称及内容

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

清洗过后的字段名称及内容

 

在原有的数据上,我根据一些背景数据和分析需要,做了颗粒度更细的划分,同时通过统一表述(原意不变),让数据可以更好地归类和呈现。

 

3、数据可视化分析

 

1)单一维度:如年龄、手机品牌

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

 

微博评论用户年龄分布

 

根据评论数据看,95后占比46.98%,是观影的核心人群。90+95占了72.21%,可见微博现在基本上已经是90后的天下,而95后是动漫题材作品的强劲消费群体。

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博评论用户发布手机/渠道划分

 

手机品牌iPhone占33.3%、华为16.15%、VIVO、小米、OPPO紧随其后。

iPhone以一单挑所有国产品牌手机,拔得头筹。看来90后中也有相当部分是忠实的“果粉”

 

2)交叉维度分析:性别+年龄

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博评论用户性别+年龄划分

可以初步得出结论,在微博发布用户中:

a)女性用户95后成为主要观影人群,男性用户年龄分布比较平均。

b)影视作品想要引发舆论话题,首先得带动女性用户的情绪。从数据中看出,女性用户的评论数是男性的2.41倍。在表达欲、情绪分享、态度表达上,女性更为活跃,也更容易影响周边的人。

 

3)交叉维度分析:转赞数+发布手机/渠道

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博评论用户转赞数+发布手机/渠道

 

a)在发布来源中,iPhone、微博客户端(应用程序)、华为手机最多,紧接是OPPO、VIVO、小米;说明绝大部分用户都愿意在手机上发布微博,而不是PC。

b)#超话#是微博的话题专区,用户评论可带上超话话题。在上映首周,由《哪吒》直接创建或关联的超话多达102个。最热门的超话有#藕饼超话#、#哪咤之魔童降世超话#、#我为电影狂超话#、#张碧晨超话#、#插画超话#等。

 

4)交叉维度分析:性别+星座

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博评论用户性别+星座

 

所以动漫和星座可以产生什么关联?

数据已将已经异常值筛出(如系统默认出生1月1日),发现摩羯座还是位列Top1和Top2?摩羯座的盆友,你们大多都是动漫爱好者嘛?

 

5)背景数据+数据分析:城市划分+微博数据

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博评论用户城市划分

 

数据呈阶梯分布,一线城市、新一线城市、二线城市依然是票房的主力军,制片投资人爸爸们,拿下这些城市的影院排期就看你们的了。

 

 

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博评论用户城市分布

 

6)微博内容词频分析

最强国漫诞生!是谁给《哪吒》贡献了14亿票房?

微博评论词频分布

 

词语的大小根据关键词出现的次数变化。筛去电影名称后,频次最多的词可以分为以下几类:

a)角色关系:敖丙、藕饼、李靖、申公豹、太乙、cp、锁死、朋友、形象、设定、红蓝

b)剧情:我命由我不由天、成见

c)电影:票房、国产、国漫、大圣、打破、动画电影、特效、导演、饺子、10亿元、冠军、配音、

d)周边效应:妆容、壁纸

e)评价:好看、喜欢、去看、超级好看、燃、太好、推荐、期待、哭、二刷、吹爆、丑、帅、啊啊啊、泪

转载联系:bzyskieer002(微信)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65887.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【写博客常用】论文代写代发的骗局之我是如何查骗子的ip地址的

【写博客常用】论文代写代发的骗局之我是如何查骗子的ip地址的 说明说明说明!!!遇到了骗子制作一个小的端口调用程序放到服务器上上传文档引诱骗子上钩然后就没有理他了查看上传文档查询位置 说明说明说明!!&#xff0…

推荐一个查询研究者方向和影响力的网站| 也可以查询杂志是否有专刊开放

查询一个科学家,Ralph Bock发表的文章总数,总引用数,世界排名,国家排名,学科内 H-index (D-index) D-index (Discipline H-index) only includes papers and citation values for an examined d…

吴恩达:AI 在2022年创造了这些奇迹

作者 | 吴恩达 翻译 | 核子可乐 策划 | 刘燕 吴恩达在圣诞节当天发布了一年一度的年终盘点,他从纯技术的角度出发,回顾 AI 科技在 2022 年创造出的那些奇迹。在过去的一年,AI 技术取得了巨大进步,生成…

快讯|马斯克宣布将卸任推特CEO:转战技术岗位

一分钟速览新闻点 科大讯飞否认星火大模型套壳ChatGPT王坚正式回归阿里云马斯克宣布将卸任推特CEO:转战技术岗位机器人足球争霸赛,加州大学洛杉矶分校机器人挑战世界冠军Intel“节节败退”!AMD x86处理器份额创新高所有内容均开源 AI2和AMD合…

GitHub 重拳出击,阻止令牌和 API 密钥泄露!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 作为全球最大的代码托管平台,GitHub 承载着数以亿计的代码库。 不过,一直以来,有关“Python、Docker 等 3.5 万个代码库被黑”、 “黑客盗用 OAuth 令牌,…

Chrome无法访问此网站 ,blog.csdn.net意外终止了连接

这两天使用Chrome浏览器总是出现下面这种情况 ,去网上看了许多的帖子,也没有解决问题。 最后 ,我将Chrome 浏览器中的 cookie都删除了, 发现浏览器又可以正常使用了 操作如下 【注 :Cookie清除后,原来账号自…

无法访问此网站 localhost 拒绝了我们的连接请求。

使用linux下的ssh或者windows下的xshell远程了服务器之后, 使用jupyter notebook命令想在本地浏览器打开服务器的jupyter, 复制login的链接如:http://localhost:8889/?token38e360e7365e07a875983bfddbaa3e9161660b0b7f11dfb2 至浏览器中…

无法访问此网站 localhost 拒绝了我们的连接请求

今天部署项目到云服务器上的时候,我改变了端口号,后来就无法访问了QAQ 后来百度到大佬的博客,https://blog.csdn.net/qq_36305327/article/details/73555351?t1506091971926 才知道,错误原因:服务没有开启。 解决办…

https访问出现无法访问此网站

ERR_HTTP2_INADEQUATE_TRANSPORT_SECURITY 在服务器的apache开启和正常的情况下https无法访问。 1.通过记事本管理员权限打开修改C:\Windows\System32\drivers\etc\hosts文件 通过网页已经能够访问到网址,但是这个只限于本机。如果不能访问就是服务器配置https错…

Chrome之“无法访问此网站 找不到服务器IP地址“解决方案

最近老是访问各种网站,提示无法访问此网站。然后刷新几下又能访问了 解决方案 dont怀疑,就是你的网络DNS被劫持了。修改你的DNS 国内通用的114DNS:114.114.114.114和114.114.115.115 步骤如下 以win10为例,其他win类似 1.控制…

网站使用了HSTS,谷歌浏览器无法访问,解决方法

1.在谷歌浏览器输入:chrome://net-internals/#hsts 2.找到 Delete domain security policies,输入域名或ip地址 delete 就能访问了

[问题解决][edge]你现在无法访问 XXX.com,因为网站使用的是 HSTS。网络错误和攻击通常是暂时的,因此该页面以后可能会恢复正常。

用edge今天访问公司的测试产品,出现 这样的问题。 HSTS:HSTS 是 HTTP 严格传输安全(HTTP Strict Transport Security) 的缩写。 这是一种网站用来声明他们只能使用安全连接(HTTPS)访问的方法。 如果一个网…

浏览器突然访问不了某个网址或者提示无法访问此网站

注意:仅限于提示浏览器认为该端口不安全,限制该请求访问的情况 解决办法: 谷歌桌面图标鼠标右键——>属性——>快捷方式——>目标——>加入 --explicitly-allowed-ports10080(前面要有空格 隔开,多个端口…

您目前无法访问XXXX,因为此网站使用了HSTS

目录 一、问题出现 二、问题解决 1、Chrome浏览器解决方法 2、IE浏览器 3、终极奥义 一、问题出现 早上来打开电脑,开始写代码!Link-Start!!! 遇到不会的,查! 您的链接不是私密连接。。。。…

谷歌浏览器无法访问网站

今天下载谷歌浏览器后,通过中文输入访问其他网站时,发现遇到下面这个问题 然后百度了一下原因,说是跟谷歌浏览器自签证有关,根据网上答主提供的以下方法:添加链接描述 根据上面的方法,并没有解决&#xff…

网站不加“www”无法访问怎么解决?

网站不加“www”无法访问怎么解决? 我什么情况下遇到了此问题如何解决此问题步骤图解 我什么情况下遇到了此问题 访问网站的时候,我们并不会输入网站前缀“WWW”而是直接访问网站。比如:baidu.com,正常情况下网站可以直接解析到www.baidu.c…

Chrome浏览器访问EasyDSS报错“无法访问此网站”的排查步骤及解决办法

我们也时常会有接到用户的反馈,在使用EasyDSS时会出现报错“无法访问此网站,网址为 http://demo.easydss.com:10080/ 的网页可能暂时无法连接,或者它已永久性地移动到了新网址。” 因为咨询的用户比较多,而且问题也很典型&#x…

自己搭建的网站,浏览器无法访问此页面解决方法

1.点击“网络与安全”,点击“安全组”,点击,点击“添加规则”。 2.点击你的域名找到解析 3.添加记录不懂的可以点击新手引导, 添加你的云服务器地址ip