全面升级,票据识别新纪元:合合信息TextIn多票识别2.0

票据识别 - 自动化业务的守门员

发票、票据识别,是OCR技术和RPA、CMS系统结合的一个典型场景,从覆盖率、覆盖面的角度来说,应该也是结合得最成功的场景之一。

产品简介

国内通用票据识别V2.0(简称“多票识别2.0”)是一款凝聚了合合信息17年OCR技术积累的产品。目前,其1.0版本SaaS服务年调用次数已突破千万大关。

更新亮点

多票识别2.0支持17大类、26小类票面识别,能够实现智能分类与精准结构化提取。无论是主流图片格式、多页PDF还是多页OFD格式,多票识别2.0都能轻松应对。

一一化解传统票据识别产品的痛点

  • 难以试用
    • 传统OCR服务中,支持私有化服务的产品往往无法在线试用,而能在线试用的产品又难以原样部署到本地。这导致在项目或业务中的不同阶段,验证OCR服务的性能和能力边界变得困难。
    • 采用多端同步引擎架构,确保在线SaaS服务版本与私有化版本的引擎一致性,保障两者提供几乎一致的识别率和性能表现,让在线验证、线下部署成为可能。同时,SaaS版本和私有化版本还可以简单构成混合云架构,提供灵活的补位选择,满足复杂应用需求。
  • 分类困难
    • 票据识别OCR多用于报销或审核场景,但具体票据类别难以预测。传统逐票据分类方法通常针对某一票面提供单一的API接口,在高吞吐量、多票面场景下难以应对。
    • 多票识别2.0经过深度优化,提供单接口调用服务,自动分类票种并返回识别结果,大幅简化用户的集成难度。用户不必过度考量业务场景,只需交给多票识别2.0,即可便捷享受高效服务。
  • 显存膨胀
    • 传统票据识别引擎通常采用单一票据结合单一模型的结构,基于此框架的票据识别产品开发、维护相对简单,但当用户需要一次性识别多个票据类型时,同时启动多个模型所需的显存资源将会线性叠加
    • 2.0版本使用统一主干网络结构,将多种不同票据场景统一编码并提取信息,送入票据专属的轻量级解码模块。此外,面向票据中常见的表格抽取需求,2.0版本使用统一的关系模块处理不同票据场景。相比于1.0版本,票据场景的扩增对于显存资源的需求下降两个数量级。
  • 识别率受限
    • 传统OCR票据识别一般采用规则抽取方案,先对所有字符进行识别,然后基于特定规则,匹配字符串内容,映射Key和Value。规则抽取方案在研发初期需要投入的算法工作量较低,但高度依赖预设的规则来识别和解析票据上的信息。这意味着系统必须事先知道所有可能的票据格式和内容布局,这在实际应用中往往难以实现,因为票据的格式可能会有细微的变化或定制化设计。每当票据格式发生变化时,都需要人工重新设计和调整识别规则,这不仅耗时而且成本高昂。对于一些频繁更新格式的票据,这种依赖性会导致系统维护困难。并且,由于规则是针对特定情况设计的,当遇到新的或未预见的票据格式时,系统可能无法正确识别,导致识别率下降。
    • 更新后的票据识别2.0采用模型抽取方案,规避了人工设计规则对于一些排版变化的样例适配性差的问题。由于模型是通过大量数据训练得到的,它能够更好地泛化到未见过的票据样本上,提高识别的准确性和鲁棒性。模型抽取方案可以集成自动化的分类、回流和再训练流程。这意味着系统可以自动从错误中学习并优化自身,不断提高识别性能。并且,相比于传统OCR,模型抽取方案减少了对人工设计规则的依赖,从而降低了系统更新和维护的工作量。

新增票面

新增医疗发票识别,助力医保报销流程自动化

在各类报销场景中,医疗费用报销占据了相当高的比例。根据国家卫生健康委数据,中国医疗卫生机构每年总诊疗人次超过84.2亿次,医院次均门诊费用约342.7元,每年产生8.48万亿卫生医疗费用。

医保的报销不仅关乎医院与国家相关机构,也和商业保险公司、各企业的财务部门密切相关。多票识别2.0新增了电子医疗发票、纸质门诊发票、纸质住院发票的识别,助力报销流程自动化,实现:

  1. 提高效率:快速准确地从医疗发票中提取信息,减少人工输入工作量,显著提高处理速度。
  2. 减少错误:减少因人工输入错误导致的审核错误,提高审核准确性。
  3. 自动化流程:可与现有财务和保险系统整合,实现从发票识别到报销流程的自动化,减少人工干预。
  4. 节约成本:通过自动化处理,减少对人力资源的依赖,降低运营成本。
  5. 改善客户体验:通过顺畅的报销流程提升客户满意度,增强客户对保险机构或公司的信任。
  6. 对于异地就医,多票识别2.0使发票实现线上流转,无需物理传输,加快报销速度。
  7. 环境友好:减少纸质发票使用,有助于实现绿色办公,符合可持续发展理念。

新增电子发票(数电票)识别,贴合票务系统发展

全面数字化的电子发票(数电票)是与纸质发票具有同等法律效力的新型发票。2022年,国票信息发票通企业数字化税务协同管理平台全新升级数电票功能。2023年12月,数电票试点覆盖到西藏,彻底覆盖全部省/直辖市。

乐企系统(数电票管理平台)接入需满足“上一年度营业收入合计5000万元以上”、“发起接入请求月度前12个月累计发票开票量及受票量合计不低于5万份”等要求,对于中国5200万中小微企业来说存在一定的门槛。因此,数电票的物理票据或截图票面识别能力在相当长时间内仍是刚需。

多票识别2.0此次更新覆盖了火车票、飞机行程单、增值税发票三个常见票种的数电票,后续将持续扩大支持范围,为中小微企业的数字化、自动化转型提供有力支持。

扩展OFD版式兼容范围,全票种支持多页OFD输入

OFD格式作为我国电子学会牵头制定的国家标准,于2009年首次发布,2020年被指定为“增值税电子普通发票”标准文件格式,适用于政府、金融、教育等领域。多票识别2.0在继续支持全票种OFD格式的基础上,额外增加了多页OFD识别能力,为有强自动化、批处理需求的用户提供更好的体验,进一步提升效率。

票据识别 - 自动化业务的守门员

产品特点

  • 低成本:SaaS服务单次调用低至0.025元,新用户享受100次免费调用,支持Web前端使用,降低试用门槛。
  • 高精度:基于合合信息自研OCR引擎,清晰有效样本识别准确率超95%。
  • 高效率:单次识别速度<2秒,私有化版本采用全新模型架构,资源占用稳定。
  • 强兼容:支持多种图像格式、多页PDF和OFD输入,集成智能切边技术,支持单页多票据识别。
  • 简易集成:标准化API接口,支持智能分类,无需手动指定。
  • 灵活部署:支持私有化、公有云部署,提供前端识别预览和标准化JSON结果。

功能演示

  • Web前端直接调用,便于试用、体验
  • 多票混贴能够清晰区分,精准识别、定位到票面,也可以便捷地切换识别结果展示
  • OFD格式同样支持识别

业务场景

  • 保险理赔快人一步
    • 在保险行业中,OCR技术广泛应用于保单信息提取、理赔资料审核等领域。通过OCR技术,可以快速识别保单上的文字信息,提取关键信息,如投保人姓名、保险类型、保险金额等。
    • 传统保险理赔流程中,由于对原始单据人工录入的依赖,周期通常需要几周到一个月不等,涉及多家保险公司混合理赔耗时更长。
    • 通过多票识别2.0,无论业务流程是由用户端还是理赔公司发起,信息录入和校对的耗时都将大幅降低,提高业务吞吐量的同时显著优化用户体验,提高用户粘性。此外,更精准的大量票据数据也为保险机构提供了更全面的数据分析和挖掘基础,从而更好地了解客户需求,制定更精准的市场策略。
  • 财务报销效率提升
    • 无论对于大型企业还是中小微企业,企业内报销业务对于财务部门都是一大重要任务。
    • 传统的人工录入报销单据信息存在低效、易出错等问题,不仅降低员工工作积极性,还会导致一系列管理成本的上升。
    • OCR识别技术可以自动高精度识别单据信息,减少人工干预,降低人力成本,提高了企业财务工作的整体运营效率,为更有附加价值的企业财务工作腾出时间和精力,进一步赋能企业效率升级。

即刻试用

目前,所有用户都可以拥有每日100次前端试用额度,注册用户更可以享受100次API接口或工作台批量调用,欢迎大家前来体验~!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/354522.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 集合框架详谈及代码分析(Iterable->Collection->List、Set->各接口实现类、Map->各接口实现类)

目录 Java 集合框架详谈及代码分析&#xff08;Iterable->Collection->List、Set->各接口实现类、Map->各接口实现类&#xff09;1、集合概述1-1&#xff1a;Java 集合概述1-2&#xff1a;List、Set、Map 三者的区别&#xff1f;1-3&#xff1a;集合框架底层数据结…

SM4 国密——加密,解密

SM4 国密的使用 前言——引用管理包SM4解密——ECB模式SM4加密——ECB模式SM4解密——CBC模式SM4加密——CBC模式SM4工具类SM4主体类SM4实体类 前言——引用管理包 引用NuGet管理包BouncyCastle.Crypto SM4解密——ECB模式 public string CiphertextParsing(string json) {tr…

四十八、openlayers地图调色总结——锐化、模糊、浮雕滤镜,调整地图色相、饱和度、亮度

这篇是对滤镜的总结&#xff0c;方便工作中直接使用。 想要调整图层的颜色&#xff0c;有两种方法。 方法一&#xff1a; 加载图层时使用tileLoadFunction函数拿到context添加canvas滤镜效果。 this.imagery new TileLayer({source: new XYZ({url: "https://server.arc…

android串口助手apk下载 源码 演示 支持android 4-14及以上

android串口助手apk下载 1、自动获取串口列表 2、打开串口就开始接收 3、收发 字符或16进制 4、默认发送at\r\n 5、android串口助手apk 支持android 4-14 &#xff08;Google seral port 太老&#xff09; 源码找我 需要 用adb root 再setenforce 0进入SELinux 模式 才有权限…

关于docker无法正常下载镜像的问题

文章目录 之前还可以正常下载镜像&#xff0c;但是一段时间之后就无法下载了&#xff0c;猜测可能是政治原因&#xff0c;无法连接到国外服务器&#xff0c;所以我设置了阿里云的镜像加速器。 配置方法如下&#xff1a; 前往阿里云&#xff08;https://help.aliyun.com/zh/acr/…

理解HTTP请求格式

HTTP概念 HTTP全称HyperTextTransfer Protocol(超文本传输协议)是一种用于分布式、协作式和超媒体信息系统的应用层协议&#xff1b;HTTP是一个客户端&#xff08;用户&#xff09;和服务端&#xff08;网站&#xff09;之间请求和响应的标准。 HTTP 协议是以 ASCII 码传输&…

Ethena 更新代币经济学,逼着空投用户作长期 Hodler?

撰文&#xff1a;Yangz&#xff0c;Techub News 本文来源香港Web3媒体Techub News 6 月 18 日&#xff0c;Ethena 更新代币经济学&#xff0c;计划在 Ethena 生态和即将推出的 Ethena Chain 中引入通用再质押机制&#xff0c;并对任何通过空投获得 ENA 的用户实施「锁定」要求…

【黑马TS】学习资料Day4

五、在 React 中使用 TypeScript 现在&#xff0c;我们已经掌握了 TS 中基础类型、高级类型的使用了。但是&#xff0c;如果要在前端项目开发中使用 TS&#xff0c;还需要掌握 React、Vue、Angular 等这些库或框架中提供的 API 的类型&#xff0c;以及在 TS 中是如何使用的。 …

基于Redis提高查询性能(保持数据一致性)

Redis实战篇 | Kyles Blog (cyborg2077.github.io) 目录 背景 商户查询缓存(根据ID查询&#xff09; 根据店铺类型查询&#xff08;List型&#xff09; 缓存更新策略&#xff08;保证数据一致性&#xff09; 案例&#xff08;利用缓存更新策略&#xff09; 背景 起初客户端…

Hadoop3:MapReduce中的Shuffle机制

一、流程图 Shuffle是Map方法之后&#xff0c;Reduce方法之前的数据处理过程称。 二、图解说明 1、数据流向 map方法中context.write(outK, outV);开始&#xff0c;写入环形缓冲区&#xff0c;再进行分区排序&#xff0c;写到磁盘 reduce方法拉取磁盘上的数据&#xff0c;…

JavaSE 面向对象程序设计高级 方法引用 2024详解

在编程中&#xff0c;方法引用&#xff08;Method Reference&#xff09;是一种技术&#xff0c;它让你能够直接引用一个现有的函数或方法&#xff0c;而无需通过对象实例来调用。这种方法在函数式编程和高阶函数中非常有用&#xff0c;因为它提供了简洁的方式来传递函数行为&a…

【归档】maven的使用

学习自波波酱老师SSM企业级框架最全教学视频 maven篇 maven的设置 <?xml version"1.0" encoding"UTF-8"?> <settings xmlns"http://maven.apache.org/SETTINGS/1.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance&qu…

【ARMv8/ARMv9 硬件加速系列 3 -- SVE 硬件加速向量运算 1】

文章目录 SVE 使用介绍SVE 特点SVE2 特点 SVE 寄存器扩展的向量寄存器可扩展的谓词寄存器.d 与 .b 后缀的区别举例介绍使用 .d 后缀进行64位元素操作使用 .b 后缀进行8位元素操作 ptrue 指令小结 FFR 寄存器 SVE 使用介绍 前面文章:【ARMv8/ARMv9 硬件加速系列 1 – SVE | NEO…

AttributeError: module ‘numpy‘ has no attribute ‘int‘解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

C++ Windows Hook使用

GitHub - microsoft/Detours: Detours is a software package for monitoring and instrumenting API calls on Windows. It is distributed in source code form. /*挂载钩子 setdll /d:C:\Users\g\source\repos\LotTest\Release\lotDll.dll C:\Users\g\source\repos\LotTest…

React 通信:深层传递(Props、Context、Children Jsx)

在之前的文章 探讨&#xff1a;围绕 props 阐述 React 通信 中总结了关于“父子”组件传值&#xff0c;但是当需要在组件树中深层传递参数以及需要在组件间复用相同的参数时&#xff0c;传递 props 就会变得很麻烦。 实际案例&#xff1a; 下述展示有两种状态&#xff1a;① 详…

【无线传感网】LEACH路由算法

1、LEACH路由算法简介 LEACH协议,全称是“低功耗自适应集簇分层型协议” (Low Energy Adaptive Clustering Hierarchy),是一种无线传感器网络路由协议。基于LEACH协议的算法,称为LEACH算法。 2、LEACH路由算法的基本思想 LEACH路由协议与以往的路由协议的不同之处在于其改变…

<Rust><iced>基于rust使用iced构建GUI实例:如何将svg格式转为ico格式图片?

前言 本专栏是Rust实例应用。 环境配置 平台:windows 软件:vscode 语言:rust 库:iced、iced_aw 概述 本文是专栏第4篇实例,依旧是一个图像格式转换程序,基于rust的svg库resvg、图像处理库image以及文件处理库rfd。 流程是先用resvg获取svg图片的数据并将其转为png数据…

嵌入式实验---实验一 通用GPIO实验

一、实验目的 1、掌握STM32F103 GPIO程序设计流程&#xff1b; 2、熟悉STM32固件库的基本使用。 二、实验原理 1、通过按键实现&#xff1a;按键按下&#xff0c;LED点亮&#xff1b;按键释放&#xff0c;LED熄灭。 三、实验设备和器材 电脑、Keil uVision5软件、Proteus…

清凉夏日运动新选择——气膜体育馆—轻空间

随着气温的不断攀升&#xff0c;夏天成为许多运动爱好者的挑战季节。炎热的天气不仅容易让人感到疲倦&#xff0c;更可能带来中暑等健康风险。然而&#xff0c;气膜体育馆的出现&#xff0c;为爱好运动的你提供了一个理想的避暑之地。气膜体育馆以其独特的结构和诸多优势&#…