文档文字提取功能功能介绍
文档文字提取是集简云的一款内置应用,用于提取某种文档类型中的文字,提取文字大小支持在10M以内,支持多种文档类型进行提取,包括PDF、DOCX、TXT、PPTX、HTML、XLSX等,便于用户更好地使用。
文档文字提取功能场景示例
企业为招募更多合适的人才,通常会通过BOSS直聘、51Job、智联等多渠道进行招聘。在接收到应聘者发送的简历后,人力资源部门需要对简历进行汇总和分析,提供招聘建议,并将这些信息录入到表单系统,例如明道云中,以便相关招聘部门能够查看和使用。
现在通过集简云搭建一个自动化流程,使用集简云邮件触发获取邮件中的文件,引入ChatGPT进行总结和评估,再同步到明道云,具体的流程图如下:
但在此流程中,文件转文字的步骤仍然需要人工手动来操作完成,面对大量简历,人工手动同步信息无疑费时费力且易出错,一旦其中的某项信息提取时出现不一致,还需重新核对,增加大量的工作量,同时也会引起不必要的麻烦。
基于此情况,集简云研发了文档文字提取功能,可以实现在短时间内完成大量文件的文字提取,提高工作效率,降低错误率,节省时间和精力。具体流程如下:
文档文字提取功能操作步骤
-
步骤1:邮件触发-当接收到邮件时
-
步骤2:文档文字提取-提取文档中的文字
-
步骤3:ChatGPT:对话ChatGPT (原生ChatGPT 3.5 Turbo模型)
-
步骤4:明道云应用-添加数据到指定工作表
其中步骤2-文档文字提取的操作如下:
(1)选择执行应用-执行动作:文档文字提取-提取文档中的文字
(2)字段匹配
-
文档类型:可选择PDF、DOCX、TXT、PPTX、HTML、XLSX等,示例:PDF
-
文件网站地址:插入变量(文件网址通常包含文件名和路径信息,以文件类型的扩展名结尾。示例:https://test.com/1.pdf. )
(3) 点击发送数据
(4)即可得到一条样本数据
文档文字提取功能更多场景示例
● 邮件系统+文档文字提取+OA系统:每当企业人员收到的邮件包含附件文档时,可以通过文档文字提取应用自动提取文档中所需要的文字信息,并通过企业微信/钉钉等OA系统发送消息通知。
● 表单系统+文档文字提取+表单系统:企业表单系统存储大量简历,常包含PDF、DOCX等多种格式,可以通过文档文字提取应用自动提取候选人文字信息,并将信息再返回至表单系统汇总,便于人事查看。