占星术合理吗?各个星座最喜欢用的表情是什么?

本文转载自 读芯术

图片

图源:unsplash

通过分析数千条推文,我们找到了热门的星座推特账号,利用机器学习Bertmoticon包来分析预测每个星座的表情。结果让我们大吃一惊!

首先,我们在推特上进行搜索,通过粉丝的数量和最近推文的热度(点赞数)找到每个星座的最热推特账号,然后从每个推特账号中检索最近的推文。为过滤掉垃圾信息,我们找的这些推文至少要有100个赞。

图片

占星在推特上的点击量接近400万次,每个星座的潜在点击量平均达到11万次,可见占星学在推特上有相当多的粉丝。

我们对推文文本进行了预处理和清理,筛去了杂项信息,删除了标签、URL、用户名、停止词。这样,当我们把关于各星座的推文输入到Bertmoticon库中时,结果将更加准确。它推断出一本表情字典,我们将其转换为概率。

以一条来自@VirgoTerms且经过清理的推文为例:“处女座的人喜欢把工作中的收获带到家里的餐桌上,他们喜欢和家人分享这些事情。”

以下是Bertmoticon根据这条推文推断出的相关表情的前四名(已删去停止词):😂概率为26.2%,😍概率为18.0%,😊概率为10.3%,🙏概率为5.7%。

为了帮助理解如何在Python中清理推文,我们导入了上一步的CSV文件,并编写了几个不同的函数应用到CSV中的文本列。实现的功能如下:

  •   去掉停止词:停止词指的是那些不能增加信息价值的常见词,如“the”、“and”。这就减少了估计误差,尤其是在数据点较少的情况下。
stop_words =set(stopwords.words("english"))   text = tokenization(text) # breaks up text into a list of wordsfiltered_tweet = [w for w in text if not w in stop_words]
  • 使用SnowballStemmer进行词根处理:将单词还原为词根(例如“loves” “loved” “loving”都还原为 “love”)。虽然要以增加贝叶斯误差作为代价,但这大大降低了估计误差。
sb = SnowballStemmer("english")  # assumes text has already been tokenizedfor word in text:           print(word, " : ",sb.stem(word))
  • 从提取的推文中删除不必要的文本:链接、话题标签、@用户名、转发标志(“RT”)、数字,这些都与文本整体信息无关。​​​​​​​
import re# removes urls or image links with httppattern = r"httpS+"    text = re.sub(pattern, "",text)

清理完文本后,我们运行Bertmoticon,以给定的概率推断出每条推文相关表情的前四名。我们从CSV文件中生成一个推文列表,并对列表中的每个字符串运行Bertmoticon。​​​​​​​

import bertmoticonfrom csv import DictReaderwith open( gemini.csv , newline=  ) as f:       ls_of_strings =[row["text"] for row in DictReader(f)]emojis = bertmoticon.infer(ls_of_strings, 4)

 风象星座

图片

 

y轴上的概率表示表情符号被列入与推文相关表情符号前四名的次数。

水象星座

图片

火象星座

图片

火象星座与其他象星座的共通模式相差最大。

土象星座

图片

结果

图片

尽管按土象、气象、风象、火象进行了分组,除了一些异常值,检测到的各星座表情符号总体模式非常相似。

虽然我们不能根据表情符号的使用和选择来判断人们的性格特征,但各星座常用表情的大致趋势能帮助我们推断出,不同星座的性格特征比我们想象的更为相近。

例如,按照互联网上讨论的星座刻板印象内容来说,会是白羊座和双子座最常用的表情,因为他们被称为最情绪化和最有态度的星座。然而,最终结果告诉我们,表情符号对于处女座、射手座、双鱼座和天蝎座来说最为常见,而这些星座是不该有无礼或情绪化的特点的。

当根据不同星座的性格特征分析表情符号的类型时,可以发现很多方面都存在这种偏差。每个星座和表情的使用频率比其他4种表情的使用频率都要高。

尽管人们对不同星座有着相应的刻板印象,但从我们从代表各星座的推文中发现,这些星座特征比我们想象的更为相近。如上文的折线图所示,同一表情符号在不同的星座里出现的概率大致相同。快去看看自己星座的折线图吧!

原文链接:https://blog.csdn.net/duxinshuxiaobian/article/details/111713924

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50469.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

DragGAN图像生成原理与实现

DragGAN图像生成原理与实现 DragGAN模型是什么呢1. DragGAN背景介绍2. 模型方法2.1 算法原理2.1.1 Motion Supervision2.1.2 点跟踪 3. 实现部署步骤3.1 安装PyTorch3.2 安装 DragGAN3.3 运行 DragGAN Demo3.4 功能介绍 项目地址:https://github.com/Zeqiang-Lai/Dr…

实验六 UML建模工具应用

一、实验目的 1.掌握面向对象开发思想及实现机制 2.理解并掌握UML常用图(重点:类、对象图、用例图) 3.掌握并常见UML建模工具,并绘制UML各种图 二、实验准备与要求 1.StarUML(简称SU),是一种创建UML类图&#xff0c…

【Android项目开发】聊天功能-主界面设计(对标企业需求)

文章目录 一、引言二、详细设计1、解决需求(1)图形问题(2)文本长度问题(3)时间转换问题 2、UI设计(1)主界面(2)适配器 3、Adapter适配器4、测试参数 三、附录…

软件建模概述 UML模型图

软件建模 什么是软件建模 将想法通过模型可视化地表达出来,方便记忆和进一步分析,方便团队/同事交流,口语交流容易失真。 软件建模体现了软件设计的思想,在需求和实现之间架起了一座桥梁,通过模型指导软件系统的具体…

ChatGPT-4竟已经学会说谎——聪明又危险的AI

时间回到2023年3月,OpenAI正式发表GPT-4的最新模型,除了展示聊天机器人如何完成各种任务,还在官网发了一份90多页报告,提及各项特性与可能存在的风险。同时,OpenAI为了检测它可能带来的“潜在的威胁”,而让…

前 Twitter CEO 炮轰 Web 3,马斯克也来“掺和一脚”

前 Twitter CEO 的 Jack Dorsey 今日又登上了外网头条,但与上个月宣布辞任时的祝福不同,这次 Jack Dorsey 引起了很大的争议:他连续发推批评 Web 3 及加密风投,引得许多加密行业人士不满并反驳。 “你们并不拥有 Web 3&#xff0…

马斯克特斯拉内部邮件火了:痛恨开会,少说黑话

金磊 羿阁 发自 凹非寺量子位 | 公众号 QbitAI 马斯克给员工的一封内部邮件火了。 鼓励员工拒绝开会、公司规定不合理可以不遵守……俨然一个为员工着想的好老板。 一开始人们还奇怪马斯克的画风怎么变这么快,后来才发现原来这是他6年前写的。 对象也不是推特员工&a…

对csdn inscode产品对工作3年内的程序员的体验改进与思考

前言: inscode 的初衷就 在线IDE运行环境 ai辅助 ,能够通过云原生运行项目,帮助用户实现分享和学习创意。 InsCode支持AI编程,代码提问 、添加注释、优化代码应有尽有 inscode slogan 让你的灵感立刻落地 编程可以很有趣 InsCode 是一个无需…

20+ Prompt工具网站汇总;我用AI工具开了一家「无人公司」;如何10分钟上线一个AI导航网站;第一部AIGC中英双语图文辞典 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『MidJourney Prompt工具网站』加速生成与优化,持续更新中 ShowMeAI知识星球 | 资源标签:找工具 这是一个总结…

百度正式推出“文心一言”

我是卢松松,点点上面的头像,欢迎关注我哦! 备受瞩目的中国版ChatGPT,百度“文心一言”今日正式发布了。由百度老大李彦宏亲自主持,亲自讲解。可见“文心一言”已经在百度得到了举足轻重的地位。 也是从3月16日起&am…

百度语音接口调用详解

1.获取的API Key及Secret Key 1.1 在控制台中选择语音 1.2 进入到如下界面进行创建应用(“接口选择”这一项不用填写) 1.3 创建应用之后在“应用列表”中查看对应应用的AppID、API Key、Secret Key的值。 2.调用接口 2.1 pycharm中新建一个python文件(voice1.py),…

API网关|JD|pinduoduoAPI接入

API网关是什么 在日常工作中,不同的场合下,我们可能听说过很多次网关这个名称,这里说的网关特指API网关(API Gataway)。字面意思是指将所有API的调用统一接入API网关层,由网关层负责接入和输出。 那么在什…

主控全志R58-百度小度在家智能音箱拆解

*本文转自我爱音频网 作为一个还处于萌芽阶段的产品,近期智能音箱迎来了一种新的形态演化阶段,市面上不断出现像亚马逊Echo Show、京东叮咚Play等搭载触摸显示屏的智能音箱,屏幕的加入,让音箱的交互逐渐变得更加变得可视化&#…

拥有自我意识的AI:AutoGPT | 得物技术

1.引言 ChatGPT在当下已经风靡一时,作为自然语言处理模型的佼佼者,ChatGPT的优势在于其能够生成流畅、连贯的对话,同时还能够理解上下文并根据上下文进行回答。针对不同的应用场景可以进行快速定制,例如,在客服、教育…

移动端IM产品RainbowChat[专业版] iOS端 v6.0版已发布!

关于MobileIMSDK MobileIMSDK 是一套专门为移动端开发的开源IM即时通讯框架,超轻量级、高度提炼,一套API优雅支持UDP 、TCP 、WebSocket 三种协议,支持iOS、Android、H5、标准Java平台,服务端基于Netty编写。 工程开源地址是&…

Android与IOS的相爱相杀之客户端测试

一、Android Android 是google公司主导的一个开放的手机操作系统,不过目前已经超过了手机的局限,而定位于移动设备的操作系统。目前用于手机,平板,智能电视,智能导航,智能手环,智能眼镜以及智能家居设备 底层以Linux内核工作为基础,由C语言开…

[iPhone高级] 基于XMPP的IOS聊天客户端程序(IOS端三)

前两篇介绍了如何通过XMPP来发送消息和接收消息,这一篇我们主要介绍如何来美化我们的聊天程序,看一下最终效果呢,当然源程序也会在最后放出 好了,我们来看一下我们写的程序 这里我们自定义了TableViewCell 一行是显示发布日期,一行是显示发送的消息,还有一个是背景 -(id…

写综述如何降低查重率?

经过好几个月的打磨,论文终于写完了,你以为这就完事了?MO!下面就来到了很重要的一步——查重。很多小伙伴写完后还蛮开心的,可是看到这查重率,很多人是欲哭无泪。辛辛苦苦写的综述怎可重复率那么高!重复率过…

多智能体强化学习-G2ANet

Multi-Agent Game Abstraction via Graph Attention Neural Network 论文地址 代码地址 摘要 本文通过一个完整的图来建模智能体之间的关系,并创新性地提出一种基于两阶段注意力网络(G2ANet)的游戏抽象机制,表明两个智能体之间…

chatgpt赋能python:Python画轨迹图:认识、用法与优势

Python画轨迹图: 认识、用法与优势 Python的数据可视化能力十分强大。画图工具虽然千千万,但其中,轨迹图是同时准确又美观的图形表现。本文将向读者介绍Python画轨迹图的好处、如何使用以及如何在项目合适的地方使用轨迹图。 了解Python轨迹图 为了更…