如何对cnki知网上的论文进行可视化文本分析
作者: AlexTan
CSDN: http://blog.csdn.net/alextan_
Github: https://github.com/AlexTan-b-z
e-mail: alextanbz@gmail.com
前言
要知道,目前cnki上是自带可视化分析功能的,但其只支持发文趋势、文献互引、关键词共现网络、作者合作网络以及作者分布等功能,并不支持更深入地对文本内容进行文本分析。
而目前专门对cnki论文进行分析的软件,大家耳熟能详的就是CiteSpace了,相信看到这篇文章的你也听说过吧?但CiteSpace安装过程繁杂,需要部署Java环境,对于技术小白来说,是比较困难的,那就没有其他办法了吗?
当然有!这篇文章就是为了解决此问题的!
步骤一、导出cnki文献数据为excel文件
-
进入cnki,检索并勾选你想要分析的文献:
-
导出文献,选择自定义:
-
勾选摘要,和发布时间,并点击
xls
按钮导出为xls
格式:
-
修改文件格式为
xlsx
。注意:导出的xls文件用Excel打开会报如下错误:
点击是
,然后点击启用编辑
按钮
点击左上角的文件
按钮,另存为xlsx
格式
保存后再次打开该文件,即可显示正常。
你会发现另存为xlsx格式文件后,文件大小也变小了,但内容并没有变!
步骤二、 使用智分析 SmartAnalyze
- 使用浏览器打开智分析,注册并登陆
-
点击
+
新建项目,上传刚才我们弄好的xlsx
格式的表格文件,然后点击新建项目
-
点击刚才创建的项目进入项目,再点击开始分析,即可开始对cnki论文摘要进行可视化文本分析
注意:如果未进行”步骤一里的第4步操作:修改文件格式为xlsx
“,这里可能会出现请求异常的错误,因为cnki目前导出的xls格式的文件是损坏的
接下来就可以调试结果做词库啦~可以参考智分析官方使用手册中的快速入门,很简单,技术小白也能上手!
常见问题
-
如果在进入项目时出现请求异常错误,请查看文件本身是否损坏,详情请参考步骤一里的第4步操作
-
如果在智分析中缺失趋势分析的相关的图,如图所示:
a. 请检查你的文件内容中是否有时间列,如果没有时间列,自然不支持趋势分析
b. 检查文件中时间项是否有缺失的或者不是时间格式的行:
在智分析中点击查看文件
仔细检查时间项有没有缺失的或者不是时间格式的,如图所示:
如果有,请删除对应的行,重新创建项目上传文件即可。
上述步骤也可以用Excel自带的筛选功能检查
想了解更多信息请关注公众号:码有引力