用R语言,生成微信聊天记录词云。

 首先获取微信聊天记录:并导出为txt文件

 

基于R语言:

#install.packages("jiebaRD")
#install.packages("jiebaR")
#install.packages("data.table")
#install.packages("stringr")
#install.packages("rJava")
#install.packages("RColorBrewer")
#install.packages("devtools")
#devtools::install_github("lchiffon/wordcloud2")
#install.packages("Rwordseg")library(jiebaRD)
library(jiebaR)
library(data.table)
library(stringr)
library(rJava)
library(Rwordseg)
library(RColorBrewer)
library(Rwordseg)
library(wordcloud2)
library(readxl)#导入聊天记录
content <- read_excel("G:/R/love/ai.xlsx", col_types = c("text"))#分词预处理,建立分词模型
mixseg <-worker("mix")#分词、并将分词结果转换为向量
Ich.part <- segment(content$...1,mixseg)#去除你想去掉的
Ich.part <- gsub(pattern="http:[a-zA-Z\\/\\.0-9]+","", Ich.part) #删除网址
Ich.part <- gsub("\n","", Ich.part) #删除换行的
Ich.part <- gsub(" ","", Ich.part)  #删除空格
Ich.part <- gsub("[0-9]+?","",Ich.part) #去除数字
Ich.part <- gsub("表情","",Ich.part)
Ich.part <- gsub("动画","",Ich.part)
Ich.part <- gsub("捂脸","",Ich.part)#去除停用词
s <- read.table(file =file.choose(),colClasses = "character", quote = NULL)
stopwords_CN <- c(NULL)
for (i in 1:dim(s)[1]) 
{stopwords_CN = c(stopwords_CN,s[i,1])}
for(j in 1:length(stopwords_CN))
{Ich.part <-subset(Ich.part,Ich.part!=stopwords_CN[j])
}#过滤掉一个字的词
Ich.part <-subset(Ich.part,nchar(as.character(Ich.part))>1)#统计词频
Ich.freq <-table(unlist(Ich.part))
Ich.freq <-rev(sort(Ich.freq))
Ich.freq <-data.frame(Ich.freq)#按词频过滤
Ich.freq30 = subset(Ich.freq, Ich.freq$Freq > 10)
#形成词云# mycolors <- colorRampPalette(c("pink","white"))
# wordcloud2(Ich.freq100,fontFamily = "HYTangTangCuTiJ",size = 2,color = mycolors(1000),
#            figPath = "E:/R/R-3.6.0/library/wordcloud2/examples/t.png")t <-system.file("examples/c.png",package = "wordcloud2") #要使用的图片路径
wordcloud2(Ich.freq30, figPath = t, size = 5,color = "pink",backgroundColor = "white")#wordcloud2(Ich.freq50,shape = 'star',size = 3)letterCloud(Ich.freq30,"shub",wordSize = 1, backgroundColor = "grey",color = "pink")

                          

                           

如遇到问题或想看更多遥感数据处理知识,欢迎通过公众号留言给作者,以便共同探讨。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/34224.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

R语言中自带的一些数据集

在用R语言做数据分析的时候&#xff0c;我们经常需要一些数据做实验&#xff0c;尤其当学会一个新的方法或者算法的时候&#xff0c;就想赶快编程实现一下。那么&#xff0c;问题来了&#xff0c;用什么数据好呢&#xff0c;什么样的数据适合做这种实验呢&#xff1f; 好在R语…

R语言---使用RTCGA包获取TCGA数据---笔记整理

原文链接&#xff1a;https://mp.weixin.qq.com/s?__bizMzAxMDkxODM1Ng&mid2247486585&idx1&sn3035f6420904aad2c8161b362cdeb472&chksm9b484cc2ac3fc5d479fc5bce3d68d4666b763652a21a55b281aad8c0c4df9b56b4d3b353cc4c&scene21#wechat_redirect 1.RTCGA…

R语言实操记录——获取包的三种渠道及安装包的三种方式

R语言 R语言实操记录——获取包的三种渠道及安装包的三种方式 文章目录 R语言一、获取包的三种渠道二、安装包的三种方式2.1、CRAN2.2、Bioconductor2.3、Github注意 一、获取包的三种渠道 渠道1 、CRAN&#xff1a;R语言的官网&#xff0c;里面包含有绝大多部分领域的大部分…

【R语言】2022年末特辑——ggsci包色版最详分享

目录 一、前言二、官方教程2.1 NPG2.2 AAAS2.3 NEJM2.4 Lancet2.5 JAMA2.6 JCO2.7 UCSCGB2.8 d32.9 locuszoom2.10 igv2.11 uchicago2.12 startrek2.13 tron2.14 futurama2.15 rickandmorty2.16 simpsons2.17 gsea2.18 material 三、讨论 一、前言 部分新手直接化用代码跑出来…

R语言txt文件自定义词云图

在R语言中获取txt文件文本&#xff0c;并进行词频统计&#xff0c;然后自定义词云图。 先获取txt文本 wordfreqs read.table("E:\\Python实训\\哔哩哔哩弹幕爬取\\dan_mu.txt",encoding "UTF-8")这是事先用python爬虫准备好的B站番剧&#xff08;排球少…

基于R语言分析自带数据集heart

本文将对R语言中自带的heart数据集进行分析。本文会包含所有代码&#xff0c;尽可能多的使用有关可视化的函数以及数据分析的模型。 一、研究概述 1.1 数据集简介 数据集来源&#xff1a;使用R语言 glmpalh 包中自带的数据heart.data 数据集内容&#xff1a;该数据集描述了45…

摸鱼的小贤在瞎搞R - R语言内置数据集的使用

系列文章目录 1-R语言的安装及使用&#xff08;还没写这个&#xff0c;太简单了不太想写&#xff09; 2-R语言内置数据集的使用 …… 文章都会尽量详细&#xff0c;话多请见谅&#xff08;我是话痨 文章目录 系列文章目录1. 查看包中有哪些数据集2. 查看某一特定数据集的基本信…

ChatGPT对高校人才培养模式的挑战与应对策略思考

酷吗&#xff1f;输入指令后直接就能生成一大串代码&#xff0c;即使不懂相关技术也能玩转编程&#xff0c;这就是ChatGPT赋予你的“新能力”&#xff0c;除了写代码&#xff0c;ChatGPT还能帮你执行各种五花八门的任务。 AI工具如ChatGPT在行业中的广泛应用对于行业的人才结…

如何使用SMS向客户传递服务信息?指南在这里!

关键词&#xff1a;SMS运营、实时聊天客服、聊天机器人 SMS作为一种客户服务策略正变得越来越流行。了解如何使用它&#xff0c;并在此获得一些有用的模板。 通过SMS发送客户服务信息是提升客户体验的一种强有力的方式&#xff0c;并使客户获得超出他们预期的快乐。它是最近许…

SMS Call---发送短信和打电话的方法

发送短信的方法 有两种方法可以实现发送短信&#xff0c;其一是使用intent-startActivity&#xff0c;URI数据格式为"smsto:num"&#xff0c;调用的action为Intent.ACTION_SENDTO&#xff1a; Uri uri Uri.parse("smsto:5554"); Intent it new Intent(I…

ChatGPT token访问和API访问的区别,哪个更适合企业级应用?

文章目录 先介绍一下ChatGPT token访问和API访问的区别ChatGPT token访问和API访问哪种更适合企业级应用&#xff1f;如何搭建一个本地可以使用的 ChatGPT 聊天页面&#xff1f;微信公众号上如何对接 ChatGPT 并支持聊天&#xff1f; 先介绍一下 ChatGPT是基于OpenAI的GPT-4模…

UI设计:模仿淘宝App首页

UI设计&#xff1a;模仿淘宝App首页

场景导购系列一:个性化服饰搭配在淘宝搜索的实践

背景 日常生活中存在着各种各样的场景&#xff0c;比如参加晚会、海边度假、跑步、登山、垂钓等等。场景可以认为是在一些维度上相似的元素所构成的情境画面&#xff0c;不同场景会有不同的氛围、组成元素。 一些场景偏实用性&#xff0c;比如跑步&#xff0c;会让人想起要穿上…

仿淘宝商品详情,下拉切换到图片详情,上拉切换到图文简介

1&#xff1a;仿淘宝商品详情&#xff0c;下拉切换到图片详情&#xff0c;上拉切换到图文简介。 2&#xff1a;导航栏滑动显示时显示&#xff0c;静止时透明 有需要代码的可以私我

曾GMV过亿的淘宝品牌FFAN(泛泛)宣布店铺歇业

我是卢松松&#xff0c;点点上面的头像&#xff0c;欢迎关注我哦&#xff01; 成立于2008年&#xff0c;曾经淘宝排名前十、年销售过亿的女装店铺&#xff0c;FFAN(泛泛)宣布店铺歇业。据店主说&#xff0c;2020年就开始了亏损。 致FFAN女孩们: 感谢一路走来的有你们的关注和…

自定义ViewGroup实现仿淘宝的商品详情页

最近公司在新版本上有一个需要&#xff0c; 要在首页添加一个滑动效果&#xff0c; 具体就是仿照X宝的商品详情页&#xff0c; 拉到页面底部时有一个粘滞效果&#xff0c; 如下图 X东的商品详情页&#xff0c;如果用户继续向上拉的话就进入商品图文描述界面&#xff1a; 刚开始…

实战淘宝穿衣搭配

1. 说明 《淘宝穿衣搭配》比赛是2015年的一个天池算法比赛&#xff0c;现已开放为新人赛&#xff0c;仍可下载数据&#xff0c;上传结果及计算排名。具体地址是&#xff1a; https://tianchi.aliyun.com/getStart/information.htm?spm5176.100067.5678.2.78904065HrZLpP&…

【Android】仿淘宝商品详情页

话不多说---先上效果图&#xff1a; 图1 商品详情页 图2 加入购物车点击事件 需求分析&#xff1a; 图1中主要需要实现的效果&#xff1a; 1.轮播图 2.顶部导航栏的渐变 3.顶部导航栏随着滑动的位置选择对应的值以及点击滑动到对应位置 图2中主要需要实现的效果&#xff1…

仿淘宝— 商品图片切换

在线展示 html: <div id"box"><ul><li id"li01"><img src"./images/01.jpg" alt""></li><li id"li02"><img src"./images/02.jpg" alt""></li><l…

淘宝内容场下的人物理解系统

本文的人物理解特指对人的视觉特征的识别&#xff0c;即从视觉维度&#xff0c;获取视频或图片中人物的身份、性别、年龄、颜值、身材、服饰、人-物关系等各种信息。 背景介绍 随着网络通信技术的迅猛发展&#xff0c;主流的信息传播已经揉合了文本、图像、语音、视频等多种媒体…