最新开源的图像识别算法来了!

 Datawhale开源 

方向:图像识别开源项目

人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不好、价格昂贵、黑盒可控性低、技术壁垒难以形成多诸多痛点。

而今天小编要给大家推荐的是一个完全开源免费的覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目!

0019e17441d33aa1d14a914836a17e72.gif

图1 PaddleClas图像分类应用示意图

话不多说,赶紧送上传送门,识货的小伙伴赶紧尝试一下吧!

https://github.com/PaddlePaddle/PaddleClas

fa34025357fbc1b20620951af699a599.png

记得Star收藏防止走丢哦!

e0cdb0288b180e6431aeb049a4cfda76.gif

当然,小编不是只管吆喝的,下面小编就来详细拆解下这个项目的过人之处吧!

a9e55ba52b2526d9cdb0a269d47b9867.gif

图2 9大场景模型效果示意图

亮点一:完美平衡精度与速度

从大名鼎鼎的Resnet50到如今火热的Swin-Transformer,模型精度不断被刷新,但是预测效率并不高。即使是Swin-Transformer最小的模型,在CPU上的预测速度也超过100ms,远远无法满足产业实时预测的需求。

而使用MobileNet系列等轻量化模型可以保证较高的预测效率,在CPU上预测一张图像大约3ms,但是模型精度往往和大模型有很大差距。

而PaddleClas推出的超轻量图像分类方案(Practical Ultra Light Classification,简称PULC),就完美解决上述产业落地中算法精度和速度难以平衡的痛点。

29d425624f643bc6df71d953f6062a49.png

表1 不同模型精度速度结果对比

如图所示,它的精度与Swin-Transformer等大模型比肩,预测速度却可以快30倍以上,在CPU上的推理时长仅需2ms!

97bf0bfe76382aa573119c16b0704ce1.gif

亮点二:易用性极强

PULC方案不仅完美的平衡了精度与速度,还充分考虑了产业实践过程中需要定制化的对算法快速迭代的需求,只需一行命令,就可完成模型训练。

与此同时,PaddleClas 团队还发布了包括人、车、OCR在内的9大场景模型仅需2就能实现业务 POC 效果验证,训练、推理、部署一条龙,真正实现“开箱即用”。

96816d8416a8017443c2295f870c14bf.png

不仅如此,项目还匹配了详细的中文使用文档及产业实践范例教程。

243122cec20c5213db5b6f7980446ff3.png

图3 使用文档及范例示意图

ea5f3e60782e986e8ffc08b29cfff980.gif

亮点三:集成超多硬核技术

超轻量图像分类方案(PULC)集成了业界4大业界领先的优化策略:

1212e1b8ef467689f1b0e0f73f941eca.png

图4 超轻量图像分类方案(PULC)示意图

PP-LCNet轻量级骨干网络

PP-LCNet作为针对CPU量身打造的骨干网络模型,在速度、精度方面均远超如MobileNetV3等同体量算法,多个场景模型优化后,速度较SwinTransformer的模型快30倍以上,精度较MobileNetV3_small_0.35x高18个点。

SSLD预训练权重

SSLD半监督蒸馏算法可以使小模型学习到大模型的特征和ImageNet22k无标签大规模数据的知识。在训练小模型时,使用SSLD预训练权重作为模型的初始化参数,可以使不同场景的应用分类模型获得1-2.5个点的精度提升。

数据增强策略集成

该方案融合了图像变换、图像裁剪和图像混叠3种数据增强方法,并支持自定义调整触发概率,能使模型的泛化能力大大增强,提升模型在实际场景中的性能。模型可以在上一步的基础上,精度再提升1个点左右。

SKL-UGI知识蒸馏算法

SKL(symmetric-KL)在经典的KL知识蒸馏算法的基础上引入对称信息,提升了算法的鲁棒性。同时,该方案可以方便的在训练中加入无标签训练数据(Unlabeled General Image),可以进一步提升模型效果。该算法可以使模型精度继续提升1-2个点。

PaddleClas技术交流群

入群学习:

1.获取PaddleClas详解本次升级内容的直播课链接。

2.获取PaddleClas团队整理的10G重磅图像分类学习大礼包,包括:

b97537183ac61ed145f781bf2a8bf583.png

图5 PaddleClas入群学习内容

入群方式:

SETP1:微信扫描二维码,填写问卷

SETP2:加入交流群领取福利

56ba557b598db27a20f22b09068867f5.png

PaddleClas产业落地工具集

不仅如此,PaddleClas团队考虑到真实产业应用面对的各种软硬件环境和不同的场景需求,在提供PULC方案的同时,还提供了包括3种训练方式、5种训练环境、3种模型压缩策略和9种推理部署方式在内的20种产业算法落地方案:

b86498e9b727172bb98944e5061779bf.png

表3 图像分类产业落地工具集训练推理部署功能支持列表

集中值得高度关注的有:

01

分布式训练

飞桨分布式训练架构具备4D混合并行、端到端自适应分布式训练等多项特色技术。在PP-LCNet训练中,4机8卡相较于单机8卡加速比达到3.48倍,加速效率87%,精度无损。

02

模型压缩

飞桨模型压缩工具PaddleSlim功能完备,覆盖模型裁剪、量化、蒸馏和NAS。图像分类模型经过量化裁剪后,移动端平均预测耗时减少24%。

03

移动端/边缘端部署

飞桨轻量化推理引擎Paddle Lite适配了20+ AI 加速芯片,可以快速实现图像分类模型在移动设备、嵌入式设备和IOT设备等高效设备的部署。

以上所有模型、代码均在PaddleClas中开源提供,还有超详细文档教程和范例项目,赶紧查看全部开源代码并Star收藏吧~

链接指路:https://github.com/PaddlePaddle/PaddleClas

相关学习

为了让开发者们更深入的了解PaddleClas这次 发布的全新内容,解决落地应用难点,掌握产业实践的核心能力,6月15-6月17日晚20:30飞桨团队精心准备了为期三天的直播课程!

百度资深工程师将为我们详细介绍超轻量图像分类方案,对各场景模型优化原理及使用方式进行拆解,之后还有产业案例全流程实操,对各类痛难点解决方案进行手把手教学,加上直播现场互动答疑,还在等什么!抓紧扫码上车吧!

e73018613bf3ab79fc94dbcc9c73d2d1.png

更多阅读

官网地址:https://www.paddlepaddle.org.cn

PaddleClas项目地址:

GitHub: https://github.com/PaddlePaddle/PaddleClas

Gitee: https://gitee.com/paddlepaddle/PaddleClas

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/58895.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图像识别最好的算法,图片相似度识别算法

现在人脸识别最有效的算法是什么? 最好的人脸识别系统在理想情况下比人类识别的表现要好的多。但是一旦环境情况变糟,系统的表现就差强人意了。而计算机科学家们当然是非常想要开发出一种算法,在各种情况下都能够表现优异。 现在&#xff0…

图像识别技术OpenCV | C++版本

基础入门 图像与信号 图像 图像是人对视觉感知的物质再现。图像可以由光学设备获取,也可以人为创作。随着数字采集技术和信号处理理论的发展,越来越多的图像以数字形式存储。因而,有些情况下”图像“一词实际上是指数字图像。图像相关的话…

主流深度学习OCR文字识别方法对比:Tesseract(LSTM)、CTPN+CRNN、Densenet

作者 | Raini 出品 | 北京图特摩斯科技有限公司 (www.thutmose.cn) 也是几个月前的项目了,由于手头事儿多,也已经转交给别的同事去继续优化。本博客仅做个简单的记录用。 这里是 Tesseract(LSTM)、CTPNCRN…

吐槽 Twitter 后,马斯克用 30 亿美元入股 Twitter,成为最大股东

作者 | 苏宓 出品 | CSDN(ID:CSDNnews) 曾一年登上 74 次热搜、曾考虑辞职做全职“网红”,掌握流量密码的硅谷“钢铁侠”埃隆马斯克算是把互联网玩得明明白白。 这不,这两天在国内外热榜、科技网站的头版头条再现马斯克…

chatgpt赋能python:Python怎样使用断言?

Python怎样使用断言? 在Python中,断言是一种在程序执行中自动检查程序是否具有给定条件的方法。在程序的开发和调试过程中,通过正确使用断言,可以增强代码的可靠性并提升编程效率。 Python中的断言语法 Python中的断言语法非常…

chatgpt赋能python:如何撤销Python代码的错误

如何撤销Python代码的错误 Python是一种优秀的编程语言,但每个程序员都会面临代码错误的问题。在Python中,难免会出现语法错误、逻辑错误或运行时错误。因此,本文将介绍一些常见的问题,并提供一些解决方法。 1. 语法错误 语法错…

chatgpt赋能python:Python查错技巧:快速定位和解决代码错误

Python查错技巧:快速定位和解决代码错误 作为一名10年Python编程经验的工程师,我深知在Python编程过程中,查错是一个必须掌握的技能。无论你是初学者还是资深工程师,在Python编程过程中,都会遇到各种各样的问题&#…

chatgpt赋能python:Python编写错误怎么改?

Python编写错误怎么改? 为什么需要改错误? 在Python编程中,错误是不可避免的。它们可能会使你的程序崩溃或者在运行时出现奇怪的行为。虽然有时候错误是你打的故意的代码,但是大多数情况下它们是意外的、不必要的,并…

chatgpt赋能python:PythonRepair:针对代码错误的Python自动修复工具

Python Repair: 针对代码错误的Python自动修复工具 介绍 Python是一种著名的高级编程语言,许多开发人员使用它来创建各种类型的程序。在开发这些程序的过程中,许多人都遇到过代码错误的问题。这些错误可能会耗费大量时间和精力来诊断和修复。在这种情况…

chatgpt赋能python:如何正确处理Python代码中的错误提示

如何正确处理Python代码中的错误提示 Python是一种非常广泛使用的编程语言,因其易读性和简洁性而备受青睐。在编写代码时,错误提示很常见,这些错误提示含有重要信息,可以帮助我们找到代码中的问题。但是,如何正确处理…

chatgpt赋能python:Python出现错误的解决方案

Python出现错误的解决方案 Python是一门广泛应用于数据科学、网站开发和人工智能领域的强大编程语言。它的简洁性、易读性和高效性吸引了越来越多的开发者。不过,就像任何一门编程语言一样,Python也会出现错误。这篇文章将介绍Python出现错误的常见原因…

chatgpt赋能python:Python如何删除错误代码

Python如何删除错误代码 Python是一种简单易学且功能强大的编程语言,但在编写代码时难免会出现错误。在这篇文章中,我们将介绍如何找到和删除Python代码中的错误,并提供一些实用技巧来避免这些错误。 检查错误代码 当您发现Python代码无法…

chatgpt赋能python:Python错误处理:概述

Python错误处理:概述 在Python编程中,错误处理是非常重要的一环。错误可能在程序执行的任何时刻出现,并可能导致程序崩溃或产生不可预期的结果。在这篇文章中,我们将介绍Python中的错误处理机制,包括常见的错误类型、…

chatgpt赋能python:Python找错误入门指南

Python找错误入门指南 Python是一种简单易学、功能强大的高级编程语言,广泛应用于各种领域。但是在编写Python程序时,难免会遇到各种错误,这时就需要我们用一些方法来快速找到错误所在,以便及时修复。 常见的Python错误类型 在…

chatgpt赋能python:Python出错处理指南:了解常见错误类型和避免错误

Python出错处理指南:了解常见错误类型和避免错误 Python是一种功能强大的编程语言,但是在编码过程中,偶尔会出现错误。如何有效地处理Python错误是一个需要深入了解的问题。在本文中,我们将介绍常见的Python错误类型以及如何避免…

chatgpt赋能python:Python如何定位错误

Python如何定位错误 在Python编程中,定位错误是非常重要的一环。在开发过程中,程序难免会出现各种各样的bug,而快速准确地定位错误可以提高工作效率,节省时间。 常见错误 Python编程中,常见的错误类型包括语法错误、…

chatgpt赋能python:Python代码报错怎么办?——解答常见的Python错误信息

Python代码报错怎么办?——解答常见的Python错误信息 如果你在写Python代码时经常遇到报错的情况,无论是因为语法错误、引用错误还是其他原因,你并不孤单。许多Python程序员都曾经遇到过各种各样的错误信息,这里将为你介绍如何应…

chatgpt赋能python:如何纠正Python程序中的错误?

如何纠正Python程序中的错误? Python作为一门简单易学的高级编程语言,被广泛应用于Web开发、数据科学、人工智能等领域。然而,编写Python程序时难免会出现错误,这就需要我们及时发现和纠正这些错误,才能确保程序的正常…

chatgpt赋能python:Python断言错误指南

Python断言错误指南 在Python编程中,断言(assertion)是一种常用的错误检查和调试工具。断言可以在程序中明确表示某个条件为真,一旦该条件为假,Python解释器就会引发断言错误并中断程序的执行。本文将通过介绍Python断…

原型图都可以用什么软件做?分享这9款给你

设计师在进行原型设计师时,会使用原型图软件,从产生想法到向开发人员提交项目。无论是构建基本线框还是功能齐全的原型,原型图软件都可以为你节省大量的时间和精力。 如果你是这个领域的新手或者想更新你的原型图软件包,请快速看…