前言
本文主要介绍通过python实现数据聚类、脚本开发、办公自动化。词频数据渲染词云图导出HTML。
一、业务逻辑
- 读取voc数据采集的数据
- 批处理,使用jieba进行分词,去除停用词
- 词频数据渲染词云图
- 将可视化结果保存到HTML文件中
二、具体产出
三、执行脚本
python wordCloud.py
四、关键代码
from pyecharts.charts import WordCloud
from pyecharts import options as opts# 假设我们有以下词频数据
word_freq = {'Python': 1000,'词云': 800,'生成': 600,'教程': 400,'pyecharts': 200,'数据可视化': 300,'图表': 250,'Python2': 1000,'词云2': 800,'生成2': 600,'教程2': 400,'pyecharts2': 200,'数据可视化2': 300,'图表2': 250,'Python3': 1000,'词云3': 800,