【新增功能】文档文字提取功能—支持多种类型的文档文字提取

文档文字提取功能功能介绍

文档文字提取是集简云的一款内置应用,用于提取某种文档类型中的文字,提取文字大小支持在10M以内,支持多种文档类型进行提取,包括PDF、DOCX、TXT、PPTX、HTML、XLSX等,便于用户更好地使用。

文档文字提取功能场景示例

企业为招募更多合适的人才,通常会通过BOSS直聘、51Job、智联等多渠道进行招聘。在接收到应聘者发送的简历后,人力资源部门需要对简历进行汇总和分析,提供招聘建议,并将这些信息录入到表单系统,例如明道云中,以便相关招聘部门能够查看和使用。

现在通过集简云搭建一个自动化流程,使用集简云邮件触发获取邮件中的文件,引入ChatGPT进行总结和评估,再同步到明道云,具体的流程图如下:

但在此流程中,文件转文字的步骤仍然需要人工手动来操作完成,面对大量简历,人工手动同步信息无疑费时费力且易出错,一旦其中的某项信息提取时出现不一致,还需重新核对,增加大量的工作量,同时也会引起不必要的麻烦。

基于此情况,集简云研发了文档文字提取功能,可以实现在短时间内完成大量文件的文字提取,提高工作效率,降低错误率,节省时间和精力。具体流程如下:

文档文字提取功能操作步骤

  • 步骤1:邮件触发-当接收到邮件时

  • 步骤2:文档文字提取-提取文档中的文字

  • 步骤3:ChatGPT:对话ChatGPT (原生ChatGPT 3.5 Turbo模型)

  • 步骤4:明道云应用-添加数据到指定工作表

其中步骤2-文档文字提取的操作如下:

(1)选择执行应用-执行动作:文档文字提取-提取文档中的文字

(2)字段匹配

  • 文档类型:可选择PDF、DOCX、TXT、PPTX、HTML、XLSX等,示例:PDF

  • 文件网站地址:插入变量(文件网址通常包含文件名和路径信息,以文件类型的扩展名结尾。示例:https://test.com/1.pdf. )

(3) 点击发送数据

(4)即可得到一条样本数据

​文档文字提取功能更多场景示例

● 邮件系统+文档文字提取+OA系统:每当企业人员收到的邮件包含附件文档时,可以通过文档文字提取应用自动提取文档中所需要的文字信息,并通过企业微信/钉钉等OA系统发送消息通知。

● 表单系统+文档文字提取+表单系统:企业表单系统存储大量简历,常包含PDF、DOCX等多种格式,可以通过文档文字提取应用自动提取候选人文字信息,并将信息再返回至表单系统汇总,便于人事查看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35881.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

集简云数据表公测上线,邀您体验

集简云数据表上线公测,欢迎体验 集简云上线轻量级数据存储表单工具——集简云数据表,帮助用户快速创建、管理、存储数据,提高数据采集与管理效率。 它支持多种数据类型和格式,提供了方便易用的界面和灵活的数据筛选功能&#xf…

chatgpt赋能python:Python如何设置画笔颜色

Python如何设置画笔颜色 在Python中,有很多库可以用来画图,比如常用的Matplotlib、Seaborn和Plotly等等,但无论是哪种库,设置画笔颜色都是非常基础且重要的操作,因为它可以让我们更好地展示数据图表,突出重…

有人已经在用AI画色图了...

文 | 雷叔说事知乎 一 最近,一些画师是真的有点急了。 倒不是因为参加美国科罗拉多州博览会美术比赛没得奖而无能狂怒。 是因为第一名,根本就不是个人。 原来,在这届比赛中获得“数字艺术/数字修饰照片”大奖的作品是AI生成的。 Jason Allen是…

chatgpt赋能python:Python如何给图形上色?

Python 如何给图形上色? Python是一种易于学习的编程语言,它适合初学者和专业程序员。作为一种多用途编程语言,Python也可以用于图形和图像处理。本文将介绍Python如何给图形上色,并提供有用的示例来演示如何使用Python库进行图形…

按键精灵手机助手连mumu模拟器

找到按键精灵安装地址 D:\ProgramData\按键精灵\按键精灵手机助手\android 找到木木安装地址,并搜索adb.exe,未找到 但是在D:\Program Files (x86)\MuMu\emulator\nemu\vmonitor\bin找到 adb_server.exe 以及另外两个.dll 复制着三个文件到按键精灵上述文件夹&…

第32章 TIM—高级定时器—零死角玩转STM32-F429系列

第32章 TIM—高级定时器 全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.com/firege 本章参考资料:《STM32F4xx 中文参考手册》、《STM32F4xx规格书》、库帮助文档《stm…

字符串转驼峰式

这道题描述起来也是十分地简单,就是把原先用 -,_隔开的字符串转为驼峰法,也就是单词紧贴在一起,且单词的首字母大写(除了第一个单词之外)。我的想法是,将字符串按照 -,_ 分割成多个数组,再将一个…

旋转编码器工作原理

旋转编码器工作原理 一、旋转编码器的原理和特点: 旋转编码器是集光机电技术于一体的速度位移传感器。当旋转编码器轴带动光栅盘旋转时,经发光元件发出的光被光栅盘狭缝切割成断续光线,并被接收元件接收产生初始信号。该信号经后继电路处理后…

坐标系之间的主要转换

一、两矢量之间的转换 二、平面坐标系之间的转换 在平面内逆时钟旋转角度theta 旋转前的坐标[x,y],旋转后的坐标[x’,y’] 三、三维坐标系之间的转换 1、绕z轴旋转(以z轴为轴在平面内逆时钟旋转角度alpha) 旋转前的坐标[xp,yp,zp],旋转后的坐标[xq,yq,zq] [ x q y q z q ]…

玩转MySQL ------使用java获取数据库的原信息

玩转数据库的元信息操作,主要是两个类: 1) DatabaseMetaData类: 包含驱动信息、数据库名、表名(视图、存储过程等) 通过con.getMetaData()可获得一个DatabaseMetaData类对象 2) ResultSetMetaData类: 包含表结构相关的信息,如:列(字段)的个数、名字、…

第4章 初识STM32—零死角玩转STM32-F429系列

第4章 初识STM32 全套200集视频教程和1000页PDF教程请到秉火论坛下载:www.firebbs.cn 野火视频教程优酷观看网址:http://i.youku.com/firege 本章参考资料:1、《STM8和STM32产品选型手册》2、SetupSTM32CubeMX-4.11.0.exe 4.1 什么是…

玩转大数据之——通过java操作office/wps的 EXCEL

操作Office文档,要用到apache公司的一个工具包: poi-3.7-20101029.jar poi插件的使用方式类似dom技术 不同版本: 接下来进行演示功能: 1.用纯Java技术实现创建一个名为a.xls的文件(工作薄), 在其中新建一个"表1"的sheet,往B9单元…

Pandas —— resample()重采样和asfreq()频度转换

一、resample resample()进行重采样。 重采样(Resampling)指的是把时间序列的频度变为另一个频度的过程。把高频度的数据变为低频度叫做降采样(downsampling),把低频度变为高频度叫做升采样(upsampling&am…

玩转MySQL(4)---多表关联

一、首先,我们可以查看数据库的各种变量: 1.SHOW VARIABLES 查看数据库的变量 2.查看当前数据库的编码 SHOW VARIABLES WHERE variable_name LIKE character%; 3.解决中文乱码,如下三个编码保持一致就可以。 character_set_client、charac…

adb连接木木模拟器

木木模拟器调试到开发模式,在一般在\Nemu\vmonitor\bin中,运行命令行adb connect 127.0.0.1:7555

玩转MySQL -----处理大数据对象

一、大数据对象简介 1.LOB(Large Object,大型对象)类型的字段现在用得越来越多了。因为这种类型的字段,容量大(最多能容纳4GB的数据),且一个表中可以有多个这种类型的字段,很灵活&am…

http 转 https 操作步骤

http 转https 花了很多的时间,走了很多的网弯路,最后还是弄好了 步骤: 第一步: 进入阿里云账号,进入 控制台 -》 安全(云盾) -》 CA证书服务 -》 购买证书 -》 注意:这里选项的时候…

python数据类型转换

Python数据类型转换 Python数据类型之间的转换 函数描述 int(x [,base]) 将x转换为一个整数 long(x [,base] ) 将x转换为一个长整数 float(x) 将x转换到一个浮点数 complex(real [,imag]) 创建一个复数 str(x) 将对象 x 转换为字符串 repr(x) 将对象 x 转换为表达式…

搭建frida+木木模拟器运行环境

目录 pip安装frida安装木木模拟器开启模拟器的root权限打开模拟器USB调试安装RE文件管理器 下载frida服务端-Android下载frida-server文件移动文件到tmp下 使用adb连接mumu模拟器设置frida-server权限并启动查看是否启动成功 使用python调用 pip安装frida 本机环境win10 (AMD6…

利用ChatGPT 5分钟制作一份思维导图

一、利用ChatGPT列出思维导图大纲 二、利用ChatGPT继续将大纲转化为markdown语法 三、将上面内容复制到txt文档中保存 四、修改文件名后缀为md 五、将生成的md文件导入到xmind中 打开xmind软件,通过「文件→导入→markdown」,选择我们刚刚创建的文件导入…