PP-ChatOCRv2、PP-TSv2、大模型半监督学习工具...PaddleX新特性等你来pick!

875e633d613adbf7f66b02d3286dfb1e.gif

小A是一名刚刚毕业的算法工程师,有一天,他被老板安排了一个活,要对一批合同扫描件进行自动化信息抽取,输出结构化的分析报表。OCR问题不大,但是怎么进行批量的结构化信息抽取呢?小A陷入了苦苦思索...

小B是一名项目经理,最近他接手了一个紧急的AI项目,客户提供的数据很多,但是标注的样本很少,很难达到客户要求的精度指标。而如果大量标注数据,时间上根本来不及。deadline一天天临近,小B整天愁眉苦脸...

小C是一家小型AI服务提供商的老板,长期做项目下来,他总觉得需要沉淀一套标准化的工具,快速应对多种多样的场景需求,尤其要满足多种复杂环境的模型部署,但公司的研发力量被项目缠身,陷入了恶性循环。小C一筹莫展...

俗话说的好,方法总比困难多,新版本的PaddleX有望解决小A、小B和小C的燃眉之急!

转眼间,距离飞桨AI套件PaddleX的正式发布Run in PaddleX!四步搞定10+任务场景36个精选产业模型开发与部署!已经过去了两个月。两个月期间,PaddleX团队快速响应AI落地的新需求、新功能,以期能在今天新内容发布中给大家交一个满意的答卷!接下来,就让我们看一看PaddleX都带来了什么新内容吧!

09f4f2d7f638b14f4ed4330467de1d59.png四大更新内容速览

强大的大小模型结合特色工具

  • PP-ChatOCRv2:PP-OCR与文心一言强强结合,支持1.5万+大字库解决生僻字、多页pdf、表格识别等难题,无需训练即可在20+场景实现关键信息抽取平均准确率80%以上。

  • PP-TSv2:支持时序预测时序异常检测任务。在用电负荷预测、预测性维护等多场景任务自适应寻优!电力场景预测误差降低20%以上,设备异常检测场景召回率提升5%。

  • 大模型半监督学习工具:借助少量有标注数据和大量无标注数据,大大提升模型的精度;在分类、检测、OCR识别3类任务的17个模型上,实现小模型精度提升10%~26%。

40+精选产业高精度模型库

新增RT-DETR-H、TimesNet_AD、PP-HGNetv2-B4等8个精选模型,扩充时序分类、时序异常检测等任务。PaddleX目前已覆盖目标检测、图像分割、3D、OCR、时序预测、图像识别系统、PDF转word等9大AI落地场景。

低代码工具箱全流程开发

新增数据格式转换、数据划分、评估指标说明等10+界面功能优化,工具箱/开发者双模式高低代码联动功能更丰富,布局更美观!

云端&本地端双平台按需使用

云端和Windows本地端能力同步升级,双平台按需选择!AI Studio云端资源随处可达,实现24小时随处AI开发。为充分利用本地算力、避免数据泄露,可一键下载本地端软件,满足多样需求。

小伙伴们还等什么,来AI Studio云端一键体验吧!这里偷偷爆个料,Linux离线版本地端距离发布很近了呦!

  • PaddleX云端快速体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX本地端下载:

    https://aistudio.baidu.com/intro/paddlex

想和志同道合的开发者交流开发经验?想和PaddleX官方开发者交流?欢迎来PaddleX频道交流:

https://aistudio.baidu.com/community/channel/610

接下来,让我们详细看一下更新内容吧!

64155a6ad99582289bd91b2e11a650d6.png新特性详解

b8c6c553818651fe845b4bb3aa4dfc6f.png强大的大小模型结合特色工具

PP-ChatOCRv2

相信大家对PP-ChatOCR的惊艳效果还有很深的印象(点击回顾PP-ChatOCR:基于文心大模型的通用图像关键信息抽取利器,开发提效50%!),现在,我们正式迎来了它的第2版。

PP-ChatOCRv2是一个融合了LLM大模型和OCR技术的通用文本图像智能分析系统,覆盖20+高频应用场景,支持5种文本图像智能分析能力和部署,包括通用场景关键信息抽取(快递单、营业执照和机动车行驶证等)、复杂文档场景关键信息抽取(解决生僻字、特殊标点、多页PDF、表格等难点问题)、通用OCR、文档场景专用OCR、通用表格识别。此外针对垂类业务场景,也支持模型训练、微调和Prompt优化。

6972eb4407f4a04abc25710cb4604b7b.gifPP-ChatOCRv2 多场景识别效果

PP-ChatOCRv2在PP-ChatOCR的基础上进一步升级,小模型+大模型串联逻辑不变,在通用信息抽取、复杂文档信息抽取、代码拓展性、基础功能完备四个方面做了更新。下面是v2的特性总结:

  • 场景丰富:支持5种智能文本图像分析能力,覆盖20+高频应用场景,尤其针对复杂文档场景进行了专项优化。

  • 精准度高:「PP-OCR」与「文心一言」强强结合,支持1.5万+大字库,解决生僻字、多页PDF、表格等难题,无需训练即可在20+场景关键信息抽取平均准确率80%以上。

  • 一键部署:一键获取PP-ChatOCRv2离线部署SDK,助力企业快速实现工程落地。

  • 便捷开发:针对垂类业务场景,通过简单点击UI界面按钮,可完成Prompt优化、模型训练和微调。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7050167

PP-TSv2

说到时序处理,大家一定还记得PaddleX重磅推出的PP-TS(点击回顾PP-TS基于启发式搜索和集成方法的时序预测模型,使预测更加准确),现在让我们看看v2带来了什么新特性。

9c6bc54e9269445fbd7f174407fd9bc7.gifPP-TSv2 电力和交通场景落地效果

  • 场景丰富:支持时序预测时序异常检测两大通用任务,在用电负荷预测、预测性维护、能耗分析、交流流量预估等场景中有重要应用价值。

  • 精准度高:多场景任务自适应寻优。时序预测,在电力场景预测误差降低20%以上;时序异常检测,在设备异常监控场景相同精度下,召回提升约5%。

  • 便捷开发:简单点击UI界面即可完数据的预处理一键化去重,数据格式转化以及划分,高精度的自定义训练,研发成本低。

  • 一键部署:一键获取PP-TSv2离线部署SDK和服务化部署,助力企业快速工程落地。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7044307

大模型半监督学习工具

不知道大家有没有遇到过数据标注成本高、周期长的困扰,有没有那么一种可能,精心标注少量的数据,配合大量的无标注数据,就能达到比肩全量标注的模型精度呢?是的,PaddleX就带来了这样一款提效神器——大模型半监督学习工具。

大模型半监督学习工具(LMSSL)利用视觉大模型的强大特征表征能力和PaddleX的特色半监督学习方法,在少量有标注数据和大量无标注数据的混合数据上学习到更好的特征,从而得到超高精度的大模型;该工具还内置了蒸馏和微调小模型的方法,进一步可以得到精度更高的小模型。

为了验证该工具的有效性,我们测试了其在公开数据集的指标。最终,该工具刷新了图像分类-10%ImageNet、目标检测-10%COCO的半监督学习SOTA精度。目前,该工具支持图像分类、目标检测、OCR识别三类视觉任务17个模型,大家无需关心细节,只需提供更多无标注数据,点击两次按钮,即可得到高精度的大模型和小模型。下面列举了使用该工具后,不同场景中大模型和小模型的精度提升情况。

de6b472d232ce975e18138f306872ff2.png

图像分类不同场景和指标提升情况

b4e5959abe3c020d81b628a1d1f27597.png

目标检测不同场景和指标题提升情况

立即在线体验:

  • 图像分类-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045718

  • 目标检测-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045736

  • OCR识别-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045737

以上这些特色工具有没有让大家眼前一亮呢?未来PaddleX将持续推出更多的特色工具,欢迎保持关注哦~

对这些特色工具很感兴趣,想了解得更深入一些?没问题,关注本公众号,后面陆续会有针对性讲解的文章~

55a388f712ddeb3fb94b38f9f551fedf.png40+精选产业高精度模型库

本次更新中,图像分类、目标检测任务方向分别新增了3个精选模型,为大家带来了更多的精度-速度权衡选择。另外,额外覆盖了时序异常检测、时序分类两个任务方向,各自新增一个精选模型。这些精选模型个个都很能打,有下面的实测数据为证。大家的模型选型又有新的选项啦!

e7f4c1e58579ef9e6464f5209ac485e8.png

PaddleX 本次发版新增模型list

PaddleX已支持的40+算法模型,可参考该链接:

https://aistudio.baidu.com/intro/paddlex/models

后续,PaddleX将持续扩大开发者心心念念的实例分割模型、LLM模型等,欢迎大家进入文章底部的交流频道,反馈对新模型的需求!

f4c610fa24c1f1b46055670d705252fd.png低代码工具箱全流程开发

新版PaddleX正式发布以来,用户对工具箱/开发者双模式高低代码联动的开发方式大家赞赏。PaddleX为了做好极致的AI开发全流程, 这次更新增加了数据分析工具、数据格式转换工具、数据划分工具、评估指标说明等10+功能,低代码工具箱模式功能更丰富,布局更美观!

95668a80648096047aff74dae3180fb9.gif

a50901ea1c545d874b32d10b3de4ed97.png云端&本地端双平台按需使用

云端AI Studio平台,PaddleX可以通过项目大厅和模型库两个入口使用。

Windows本地端PaddleX2.2.0版本也正式发布啦,除特色工具外,云端所有能力实现完全同步。一键下载安装windows本地端,即可完成模型开发全流程。

9b1cd4a1c9e32aab3f68bbd7401f452c.gif

57c908767efa57b4c32e4d14553ba05c.png结语

最后,稍微总结一下:

PaddleX是面向国内外主流AI硬件的,全流程、高效率的飞桨精选AI模型的一站式AI开发套件。PaddleX的使命是助力AI技术快速落地,愿景是使人人成为AI Developer!

在本次更新中,PaddleX带来了强大的大小模型结合特色工具、40+精选产业高精度模型库、低代码工具箱全流程开发、云端&本地端双平台按需使用等特性,希望能给大家带来更大的AI开发效率提升和更好的产品体验!

目前PaddleX依然处在快速迭代中,欢迎大家试用和指正!比心~

添加AI Studio飞桨AI套件官方频道,和大家一起讨论吧,传送门:

https://aistudio.baidu.com/community/channel/610

  • PaddleX云端在线体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX Windows本地端下载地址:

    https://aistudio.baidu.com/intro/paddlex

8b6b8581b46e2b5aa6fe687e68b07130.png

80a67fccfc0f5e974f861e945fa4cad5.jpeg

cb3653ea96efefe92c3b522f67d48b8b.jpeg

239d6b23a8b56b54df020d9311ba562f.jpeg

a401c99d528b126b3bf26ec9de96644e.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/190951.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python实现WOA智能鲸鱼优化算法优化BP神经网络回归模型(BP神经网络回归算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 鲸鱼优化算法 (whale optimization algorithm,WOA)是 2016 年由澳大利亚格里菲斯大学的Mirjalili 等提…

Element-Ui el-table 动态添加行

一、在项目需要使用 这个需求主要是在项目中需要用到 1.点击新增按钮,可以实现新增行。 2.在每个列里面可以进行输入。 3.可以删除新增的行,包括数据。 二、HTML代码 1.主要是循环每一个列,而且这些列都是动态,根据父组件传过来…

Kotlin之控制语句和表达式

原文链接 Kotlin Controls and Expressions 有结果返回的是表达式,没有返回的称之为语句,语句最大的问题是它没有返回值,那么想要保存结果就必然会产生副作用,比如改变变量。很多时候这是不够方便的,并且在多线程条件…

sass 生成辅助色

背景 一个按钮往往有 4 个状态。 默认状态hover鼠标按下禁用状态 为了表示这 4 个状态&#xff0c;需要设置 4 个颜色来提示用户。 按钮类型一般有 5 个&#xff1a; 以 primary 类型按钮为例&#xff0c;设置它不同状态下的颜色&#xff1a; <button class"btn…

[量子计算与量子信息] 2.1 线性代数

2.1 线性代数 符号对照表 量子力学中&#xff0c;向量使用 ∣ ψ ⟩ \ket \psi ∣ψ⟩ (ket)来表示&#xff0c;可以理解为一个列向量。其对偶向量为 ⟨ ψ ∣ \bra \psi ⟨ψ∣ &#xff0c;可以理解为行向量。 向量空间中零向量直接用 0 0 0 表示&#xff0c; ∣ 0 ⟩ \…

Spring后端HttpClient实现微信小程序登录

这是微信官方提供的时序图。我们需要关注的是前后端的交互&#xff0c;以及服务端如何收发网络请求。 小程序端 封装基本网络请求 我们先封装一个基本的网络请求。 const baseUrl"localhost:8080" export default{sendRequsetAsync } /* e url&#xff1a;目标页…

nodejs+vue+python+PHP+微信小程序-安卓-房产中介管理信息系统的设计与实现-计算机毕业设计

目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性&#xff1a;…

【学习辅助】Axure手机时间管理APP原型,告别手机控番茄任务模板

作品概况 页面数量&#xff1a;共 30 页 兼容软件&#xff1a;Axure RP 9/10&#xff0c;不支持低版本 应用领域&#xff1a;时间管理、系统工具 作品申明&#xff1a;页面内容仅用于功能演示&#xff0c;无实际功能 作品特色 本品为「手机时间管理」APP原型&#xff0c;…

机器视觉系统的组成

图像获取 光学系统采集图像&#xff0c;图像转换成模拟格式并传入计算机存储器。 图像处理和分析 处理器运用不同的算法来提高对结论有重要影响的图像要素并形成数据作为判决依据。 判决和输出 处理器的控制程序根据收到的数据做出结论并输出信息作反馈控制等应用。

EasyPOI实现excel文件导出

EasyPOI真的是一款非常好用的文件导出工具&#xff0c;相较于传统的一行一列的数据导出&#xff0c;这种以实体类绑定生成的方式真的非常方便&#xff0c;也希望大家能够了解、掌握其使用方法&#xff0c;下面就用一个实例来简单介绍一下EasyPOI的使用。 1.导入依赖 <!-- e…

P6入门:项目初始化9-项目详情之资源 Resource

前言 使用项目详细信息查看和编辑有关所选项目的详细信息&#xff0c;在项目创建完成后&#xff0c;初始化项目是一项非常重要的工作&#xff0c;涉及需要设置的内容包括项目名&#xff0c;ID,责任人&#xff0c;日历&#xff0c;预算&#xff0c;资金&#xff0c;分类码等等&…

数据结构 | 队列的实现

数据结构 | 队列的实现 文章目录 数据结构 | 队列的实现队列的概念及结构队列的实现队列的实现头文件&#xff0c;需要实现的接口 Queue.h初始化队列队尾入队列【重点】队头出队列【重点】获取队列头部元素获取队列队尾元素获取队列中有效元素个数检测队列是否为空销毁队列 Que…

ChatGPT 4 OpenAI 数据分析动态可视化案例

数据分析可视化是一种将原始数据转化为图形或图像的方法,使得数据更易理解和解读。这种方法能够帮助我们更清楚地看到数据中的模式、趋势和关联性,从而更好地理解数据,并据此做出决策。 数据分析可视化的一些常见形式包括: 1. 折线图:常用于展示数据随时间的变化趋势。 …

Maya v2024(3D动画制作软件)

Maya 2024是一款三维计算机图形动画制作软件。它被广泛应用于电影、电视、游戏、动画等领域中&#xff0c;用于创建各种三维模型、场景、特效和动画。 以下是Maya的主要特点&#xff1a; 强大的建模工具&#xff1a;Maya提供了各种建模工具&#xff0c;如多边形建模、NURBS建模…

基于XML的声明式事务

场景模拟 参考基于注解的声明式事务 修改Spring的配置文件 将Spring配置文件中去掉tx:annotation-driven标签&#xff0c;并添加配置&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <beans xmlns"http://www.springframework.org…

nacos适配达梦数据库

一、下载源码 源码我直接下载gitee上nacos2.2.3的&#xff0c;具体链接&#xff1a;https://gitee.com/mirrors/Nacos/tree/2.2.3&#xff0c;具体如下图&#xff1a; 二、集成达梦数据库驱动 解压源码包&#xff0c;用idea打开源码&#xff0c;等idea和maven编译完成&#xff…

el-table解决数据过少小于高度有留白的问题

问题:给el-table设置个高度,高度为500px,之后就添加如下4条数据,那么底部就没数据,直接就空白了,本文章就是为了解决这个问题,如果底部留白那么就添加几条空数据就行了.如果数据已达到高度了那么就不会留白了 1.效果 这个空列可以根据高度来决定添加几个空格子去铺满列表&…

P6入门:项目初始化5-项目支出计划Spending Plan

前言 使用项目详细信息查看和编辑有关所选项目的详细信息&#xff0c;在项目创建完成后&#xff0c;初始化项目是一项非常重要的工作&#xff0c;涉及需要设置的内容包括项目名&#xff0c;ID,责任人&#xff0c;日历&#xff0c;预算&#xff0c;资金&#xff0c;分类码等等&…

路由器的结构以及工作原理

目录 路由器的结构 交换结构三种常用的交换方式 1.通过存储器 2.通过总线 3.通过纵横交换结构&#xff08;crossbar switch fabric&#xff09; 路由器的结构 路由器结构可划分为两大部分&#xff1a;路由选择部分&#xff0c;分组转发部分 路由选择部分也叫做控制部分&…

VB.net TCP服务端监听端口接收客户端RFID网络读卡器上传的读卡数据

本 示例使用设备介绍&#xff1a;WIFI/TCP/UDP/HTTP协议RFID液显网络读卡器可二次开发语音播报POE-淘宝网 (taobao.com) Imports System.Threading Imports System.Net Imports System.Net.Sockets Public Class Form1Dim ListenSocket As SocketDim Dict As New Dictionary(Of…