XINCheck文本查重可以对本地的文件进行查重。github上有它的开源版,可以访问https://github.com/tianlian0/paper_checking_system查看,开源版提供了查重的基本功能和源代码。
使用介绍
1、下载、安装
点此链接下载免费版安装包进行安装(提取码:ysbq),只支持win7及以上64位操作系统。
2、使用免费许可证启动软件
启动应用程序后,勾选“已完整阅读并同意遵守《软件许可协议》”。点击“免费获取”按钮自动获取授权,然后点击“开始试用”即可进入主页面。
3、开始查重
选择查重方式(支持同批次间查重、使用比对库查重两种方式)、选择待查文件所在的文件夹、保存查重报告的文件夹,点击开始查重按钮即可。
查重完毕后会生成如下样式的查重报告:
截图1:
截图2:
截图3:
4、排除部分文本
在进行标书查重或论文查重时,对于技术规格说明书、招标文件、专有名词列表中的内容,是允许重复的,XINCHECK文档查重软件提供了白名单排除功能,将允许重复的文件或文本添加进去,则可以在最后的查重报告中进行排除,适合标书查重。
5、排除部分文本
在制作标书或检查串标时,地名、供应商、关联公司等,很容易在复制时被遗漏,通过将这类关键词添加至重点关注列表,在查重时将以紫色和黄色重点标注这些关键词,便于工作人员检查。
注:重点关注列表中的关键词长度不能超过10个字符。
查重报告中紫色和黄色标注的部分即为命中重点关注列表的关键词(重复部分命中标记为紫色,非重复部分命中标记为黄色)。
6、其它功能
软件还支持自己建立比对库、切换查重算法、选择查重严格性、对文档属性和图片查重之类的功能,具体就请大家自行探索,不在这里过多介绍了。