用CPU 0.2秒轻松识别十万类,超强图像识别系统PP-ShiTu重磅发布

说到图像识别,有些人可能会一头雾水,其实图像识别早已经成熟地应用在了各行各业。比如,正在进行中的双十一全民剁手节,相信很多小伙伴们都在某宝上解锁过以图搜图购物;越来越先进的自动驾驶道路街景识别;工业制造中不同组件的缺陷识别检测等等。

ed6e739408ba6b3b57edb629af5f5c33.gif

有的开发者看到这里可能会心存疑问:上面所说的场景为什么不直接用图像分类或者目标检测算法实现呢?

别急,让我们看看下面这些实际的产业难题你就会恍然大悟:

  • 【品类更新频率高】像新零售这种行业,新品几乎都是按小时级别在更新!

  • 【目标区分难度大】细分类差别极其细微,实际图像角度多变刁钻!

  • 【算法复杂速度慢】业务上线预测速度要求极高,在闸机前不可能还需要等!

2524cb81d37dd8d7744d71955d824a41.png

一个优秀的图像识别系统就是上述产业难题的最佳解决方案,需要综合目标检测、图像分类、度量学习、图像检索等多重技术,然而对一些开发者来说,确实存在较高的开发门槛。而近期,飞桨推出了一个全开源、轻量级图像识别系统PP-ShiTu,完美解决上述产业落地中的重重难点,CPU上仅需0.2s轻松识别十万类,而且十分简单易用。

PP-ShiTu技术报告地址:

http://arxiv.org/abs/2111.00775

链接指路:

https://github.com/PaddlePaddle/PaddleClas

(Star收藏一下,不易走丢哦~)

话不多说,让我们直接来看看这个图像识别系统的架构:

7897a6170a5f91d2fda3b04f349de230.png图1 PP-ShiTu架构示意图

  • 轻量的主体检测

PP-ShiTu的第一个模块是主体检测,它的作用是在图像中找出主体目标的区域。PP-ShiTu在这个模块中采用了超高性价比的目标检测算法——PP-PicoDet。PP-PicoDet在骁龙865上,单张图像21ms的预测速度下,在COCO数据集mAP可以达到36.3%;相同环境下,精度优于YOLOv5n和YOLOX-nano 8个点以上。而它的出现,使PP-ShiTu的主体检测模块,相比上一个版本在精度几乎不变的情况下,预测速度提升了15倍以上!

73685eee31ba06d2c0ea85f15712e9f3.png图2 主体检测新旧版本指标对比图

PP-PicoDet技术报告地址:

https://arxiv.org/abs/2111.00902

  • 高效的特征提取模块

PP-ShiTu的第二个模块是特征向量提取。它的作用是将图像转换成特征向量,方便后续进行检索识别。PP-ShiTu采用CPU级轻量化骨干网络PP-LCNet,并结合arcmargin算法,得到轻量化的特征提取模型。在 Intel至强6148处理器,PP-LCNet的单张图像5.39ms的预测速度下,在ImageNet上Top1识别准确率可以达到80.82%,准确率超越大模型ResNet50的模型效果,而预测速度却可以达到后者的3倍!PP-ShiTu充分挖掘该网络的潜力,学习一个具有超强泛化能力的特征提取模型,同一模型可在多个数据集上同时达到较高精度。

9bfbb90ae6d47ae1e2163c76f001b367.png

图3 特征提取模型新旧版本指标对比图

PP-LCNet技术报告地址:

https://arxiv.org/abs/2109.15099

ArcMargin文章地址:

https://arxiv.org/abs/1801.07698

  • 向量检索模块

PP-ShiTu的第三个模块是向量检索。当获得了图像特征后,我们通过计算向量距离来获得两张图像的相似度,进一步通过向量检索获取最终识别结果。这种方式最大的优点是,当增加新的品类时,不需要重新训练提取特征模型,仅需要更新检索库即可识别新的目标。为了更好地兼容(Linux, Windows, MacOS)多平台,PP-ShiTu使用的向量搜索模块Faiss。

Faiss技术报告地址:

https://arxiv.org/pdf/1702.08734.pdf

而这样一个高效的识别系统使用起来却只需三步,绝对的 ”开箱即用”

  • 第一步通过目标检测模型,进行主体检测;

  • 第二步对每个候选区域进行特征提取;

  • 第三步将特征提取后的向量在检索库中进行检索,完成匹配,返回识别结果。

da177b81058c8ce50ef3611acdf79d94.png

图4 PP-ShiTu使用流程示例

直播预告

为了让开发者更深入的了解PaddleClas并手把手教大家完成图像识别系统的搭建,项目团队还精心准备了为期4天的直播课程。11月2日-5日百度高工将为我们讲解图像识别产业应用的方法和技巧,对各类痛难点解决方案进行详细拆解分析,现场还可以直接为大家进行答疑,还在等什么!赶紧扫码上车吧!

扫码报名直播课,加入技术交流群

2d30f3eda6ec6fbabcda06570b1b3a34.png

精彩内容抢先看!长按收藏海报~

4379b2f6464b1996dfdb74a974b574e4.png

4631705578368bf5ef31a208ce6d43b8.png

飞桨官网网址:

www.paddlepaddle.org.cn/

【PaddleClas】项目地址:

GitHub: 

https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3

Gitee:

https://gitee.com/paddlepaddle/PaddleClas

这么强大、用心的项目 ,还不赶紧给各位开发者一个Star🌟的鼓励!

f9e3535a9c44732a13022e6c7cf65a1d.gif

注:文中表情包来自网络,不做商业用途使用,如侵权可删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/58904.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软语音识别

广告关闭 2017年12月,云社区对外发布,从最开始的技术博客到现在拥有多个社区产品。未来,我们一起乘风破浪,创造无限可能。 【新智元导读】微软语音识别系统取得最新突破:微软的语音对话研究小组在switchboard语音识别…

微软研究员在ImageNet计算机视觉识别挑战中实现里程碑式突破

微软研究员在ImageNet计算机视觉识别挑战中实现里程碑式突破 微软亚洲研究院 2015年2月11日 本文翻译自:Microsoft Researchers Algorithm Sets ImageNet Challenge Milestone 一直以来,计算科学家一直在为建立世界上最精确的计算机视觉系统孜孜不倦地努…

opencv 图像识别

opencv的目标是使计算机可以快速准确地从数字图像中提取和分析特征。它使用了许多新的算法和技术,例如改进的模板匹配、基于统计的特征分析以及深度学习等。opencv支持多种平台,包括 Windows、 MacOS、 Linux和 Android,开发者可以使用 OpenC…

人工智能-图像识别

图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。简单…

深度学习与图像识别 图像检测

主要做了基于深度学习的图像识别与检测的研究,下面是一些整理内容 1、深度学习的优势 (1)从统计,计算的角度看,DL特别适合处理大数据 a、用较为复杂的模型降低模型偏差 b、用大数据提升统计估计的准确度 c、用可扩展的…

图像识别

图像识别主要用到了两个第三方的iOS框架:OpenCV和TesseractOCR,OpenCV用来做图像处理,定位到身份证号码的区域,TesseractOCR则是对定位到的区域内的内容进行识别。 OpenCV中的一些简单的处理图像的方法:灰度处理、二…

tesseract -图像识别

20230306 下载链接:https://digi.bib.uni-mannheim.de/tesseract/ 如下选择最新的版本,这里我选择tesseract-ocr-w64-setup-5.3.0.20221222.exe 配置tesseract的环境变量 在用户变量path中,添加安装路径如:D:\Program Files\Tesse…

机器图像识别常用算法,图像对比识别技术

图像识别算法都有哪些 图像识别算法:1人脸识别类(Eigenface,Fisherface算法特别多),人脸检测类(j-v算法,mtcnn)2车牌识别类,车型识别类(cnn)3字符识别&#…

最新开源的图像识别算法来了!

Datawhale开源 方向:图像识别开源项目 人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不…

图像识别最好的算法,图片相似度识别算法

现在人脸识别最有效的算法是什么? 最好的人脸识别系统在理想情况下比人类识别的表现要好的多。但是一旦环境情况变糟,系统的表现就差强人意了。而计算机科学家们当然是非常想要开发出一种算法,在各种情况下都能够表现优异。 现在&#xff0…

图像识别技术OpenCV | C++版本

基础入门 图像与信号 图像 图像是人对视觉感知的物质再现。图像可以由光学设备获取,也可以人为创作。随着数字采集技术和信号处理理论的发展,越来越多的图像以数字形式存储。因而,有些情况下”图像“一词实际上是指数字图像。图像相关的话…

主流深度学习OCR文字识别方法对比:Tesseract(LSTM)、CTPN+CRNN、Densenet

作者 | Raini 出品 | 北京图特摩斯科技有限公司 (www.thutmose.cn) 也是几个月前的项目了,由于手头事儿多,也已经转交给别的同事去继续优化。本博客仅做个简单的记录用。 这里是 Tesseract(LSTM)、CTPNCRN…

吐槽 Twitter 后,马斯克用 30 亿美元入股 Twitter,成为最大股东

作者 | 苏宓 出品 | CSDN(ID:CSDNnews) 曾一年登上 74 次热搜、曾考虑辞职做全职“网红”,掌握流量密码的硅谷“钢铁侠”埃隆马斯克算是把互联网玩得明明白白。 这不,这两天在国内外热榜、科技网站的头版头条再现马斯克…

chatgpt赋能python:Python怎样使用断言?

Python怎样使用断言? 在Python中,断言是一种在程序执行中自动检查程序是否具有给定条件的方法。在程序的开发和调试过程中,通过正确使用断言,可以增强代码的可靠性并提升编程效率。 Python中的断言语法 Python中的断言语法非常…

chatgpt赋能python:如何撤销Python代码的错误

如何撤销Python代码的错误 Python是一种优秀的编程语言,但每个程序员都会面临代码错误的问题。在Python中,难免会出现语法错误、逻辑错误或运行时错误。因此,本文将介绍一些常见的问题,并提供一些解决方法。 1. 语法错误 语法错…

chatgpt赋能python:Python查错技巧:快速定位和解决代码错误

Python查错技巧:快速定位和解决代码错误 作为一名10年Python编程经验的工程师,我深知在Python编程过程中,查错是一个必须掌握的技能。无论你是初学者还是资深工程师,在Python编程过程中,都会遇到各种各样的问题&#…

chatgpt赋能python:Python编写错误怎么改?

Python编写错误怎么改? 为什么需要改错误? 在Python编程中,错误是不可避免的。它们可能会使你的程序崩溃或者在运行时出现奇怪的行为。虽然有时候错误是你打的故意的代码,但是大多数情况下它们是意外的、不必要的,并…

chatgpt赋能python:PythonRepair:针对代码错误的Python自动修复工具

Python Repair: 针对代码错误的Python自动修复工具 介绍 Python是一种著名的高级编程语言,许多开发人员使用它来创建各种类型的程序。在开发这些程序的过程中,许多人都遇到过代码错误的问题。这些错误可能会耗费大量时间和精力来诊断和修复。在这种情况…

chatgpt赋能python:如何正确处理Python代码中的错误提示

如何正确处理Python代码中的错误提示 Python是一种非常广泛使用的编程语言,因其易读性和简洁性而备受青睐。在编写代码时,错误提示很常见,这些错误提示含有重要信息,可以帮助我们找到代码中的问题。但是,如何正确处理…

chatgpt赋能python:Python出现错误的解决方案

Python出现错误的解决方案 Python是一门广泛应用于数据科学、网站开发和人工智能领域的强大编程语言。它的简洁性、易读性和高效性吸引了越来越多的开发者。不过,就像任何一门编程语言一样,Python也会出现错误。这篇文章将介绍Python出现错误的常见原因…