谷歌 TensorFlow 物理检测 API,目前最好的物体识别方案?

原文:Is Google Tensorflow Object Detection API the easiest way to implement image recognition?
作者:Priya Dwivedi
译者:聂震坤
审校:屠敏


用大数据干大事!

目前有很多种图像识别的方案,而 Google 近日最近发布了其最新的 Tensorflow 物理检测接口(Object Detection API),使计算机视觉无处不在。Google 的产品通常都是黑科技,所以笔者决定尝试一下这个新的 API,并用 YouTube 上的一个视频来进行检测。如下:

完整的代码可以在我的 Github 上找到:https://github.com/priya-dwivedi/Deep-Learning/blob/master/Object_Detection_Tensorflow_API.ipynb。

所以,它的的体验到底如何?让我们先从理解 API 开始。

了解 API

此 API 经过 COCO 数据库训练。COCO 数据库拥有三十万张包括九十大类的图像集合,一部分类别如下:

API 提供了五种不同的模式来在识别速度与准确率中进行协调,详情见下表:

使用 API

我决定使用最轻量化的模块(ssd_mobilenet)。主要步骤如下:

  1. 下载冻结模型(.pb——protobuf)并将其导入内存
  2. 使用內建代码来导入标签,分类,可视化效果工具等等
  3. 打开一个新的会话并在一个图像上运行模型

这是一个相对来说较为简单的步骤。API 介绍里也提供了关于如何进行相关步骤的指导。

此模型在样本图像上的表现不错(详见下图):

运行视频

接下来,用视频来测试此 API。此操作通过 Python moviepy 库来实现。主要步骤如下:

  • 使用 VedioFileClip 方法从视频中提取图像
  • fl_image 方法可以快速从视频中抽取并替代图片。使用此方法来将视频的每一帧提取出来
  • 将处理后的每帧图片合并为一个新的图像

此段代码需要一定的时间(3-4秒的剪辑需要1分钟左右)。但是由于使用的是一个加载到内存的冻结模型,所以这些都可以在没有显卡的计算机上完成。

结果很惊人!只需要一小段代码,就可以准确识别并标记视屏中的人物。

在有些情况下它的功能还有待提升。比如在下图中,它并不能识别出视屏中的鸭子。

下一步

关于此 API 以后的想法

  • 使用更精确但抽象的模型来看看结果会如何;
  • 优化识别速度,使其可以在移动设备上使用;
  • Google 还提供使用这些模型进行转移学习的能力,即加载冻结模型,并添加具有不同图像类别的另一个输出图层。

参考

  • Google Tensorflow Object Detection Github:https://github.com/tensorflow/models/tree/master/object_detection
  • COCO dataset:http://mscoco.org/home/

由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017)将于 7 月 22-23 日在杭州召开。作为中国国内高规格、规模空前的人工智能大会,本次大会由中国科学院院士、中国人工智能学会副理事长谭铁牛,阿里巴巴技术委员会主席王坚,香港科技大学计算机系主任、AAAI Fellow 杨强,蚂蚁金服副总裁、首席数据科学家漆远,南京大学教授、AAAI Fellow 周志华共同甄选出在人工智能领域本年度海内外最值得关注的学术与研发进展,汇聚了超过 40 位顶级人工智能专家,带来 9 场权威主题报告,以及“语言智能与应用论坛”、“智能金融论坛”、“人工智能科学与艺术论坛”、“人工智能青年论坛”4 大专题论坛,届时将有超过 2000 位人工智能专业人士参与。

目前,大会火热报名中,扫描下方图片中的二维码或直接点击链接火速抢票。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32416.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

姿态识别、手势识别(附代码)

姿态识别技术是一种基于计算机视觉的人体姿态分析方法,可以通过分析人体的姿态,提取出人体的关键点和骨架信息,并对人体的姿态进行建模和识别。随着深度学习技术的发展,近年来姿态识别技术得到了广泛的应用和研究,其中Pose是一种基于深度学习的姿态识别工具包。本篇博客将…

用户手势检测-GestureDetector使用详解

前言:今天终于可以正常上班了,阿里的百技真的真的太累了,作为队长,不仅要考虑到每一个人的感受,而且要最大程度地使大家团结起来,共同完成一个任务,四天的时间,14个人的小组完成一个…

如何使用OpenCV对物体进行搜索检测与识别

在本教程中,我们将了解对象检测中称为“选择性搜索”的重要概念。我们还将用C 和Python共享OpenCV代码。 物体检测与物体识别 对象识别算法识别图像中存在哪些对象。它将整个图像作为输入,并输出该图像中存在的对象的类标签和类概率。例如,类…

通用物体识别使用攻略

作者:让天涯 一、需求描述 大家在出去旅游的时候,往往会对景点里的特色事物感兴趣,而一般情况下,如果没有导游的介绍,我们不太清楚这个景区里的特色景点是什么,有时候即使看到了一个事物,都不…

python姿态检测实现多人多姿态识别python行为识别openpose行为骨骼框架检测动作识别动作检测行为动作分类

效果演示: 视频演示: python行为识别行为骨骼框架检测动作识别动作检测行为动作分类 项目下载链接:https://download.csdn.net/download/babyai996/87552750 0环境项目配置教程:https://download.csdn.net/download/babyai996/87…

Win11集成 ChatGPT,任务栏取消分组真的回来了

时隔两月微软如期发布了 Win11 Moments 3 更新,版本号 22621.1778 。 微软这次更新带来了许多质量更新和功能改进。 直观的改动是任务栏,网络图标在连接加密隧道时会上锁,时间显示到秒也重新回归。 日常会用到的 AltTab 任务选项卡被限制到最…

​干货!影视剪辑大神常用避免侵权的8个秘籍首次公开【覃小龙课堂】

哈罗,我是您的老朋友:覃小龙,您可以称呼我为覃总,因为我是腾然MCN和火星电商的老板,我2016年创办腾然MCN至今,已经是自媒体的骨灰级老司机了,所以今天给您带来的主题是: 干货&#x…

影视剪辑,视频剪辑的万能剪辑技巧来啦,剪辑技巧合集

好多人在学习视频剪辑时不知道如何入手! 今天这一篇总结来啦! 首先要掌握的就是关于正确的视频剪辑流程 ①建立好项目文件夹。根据时间、地点、大体拍摄内容等分类,在不同的文件夹存入对应的物料和工程。 ②获取素材。提前收集好要用的包装…

影视剪辑,PR剪辑软件两个转场教程

一、古风渐变擦除转场:拖入视频1和视频2,将视频2放到视频1上面的轨道,2者重叠部分就是转场部分。 【效果】【渐变擦除】,拖到视频2。 在开头K关键帧,【效果控件】【渐变擦除】【过渡完成】K帧调到100。 在2段视频交接…

影视剪辑,你应该掌握的剪辑流程和技巧

很多朋友想学视频剪辑,但是不知道如何入手?今天就把我的压箱底都告诉你们啦! 应该先掌握的剪辑流程! 建立好项目文件夹。在每个级的文件夹存入对应的物料和工程。 获取素材。先收集要用的所有素材与音乐。 回看和分类。按照脚本的结构进行素材分类&am…

影视剪辑视频制作教程,必备私藏软件工具分享给大家

影视剪辑最直接粗暴的方式就是送钱给作者,你只要发出剪辑的视频,有流量就有钱。所以现在很多新手自媒体都会选择影视解说赛道,但是影视剪辑视频的创作过程也是有很多重点要抓的,不搞清楚,账号也很难做起来!…

我们要被淘汰了?从科技变革看"ChatGPT"与"无代码开发"

现在只要一上网,就能看见GPT都在说“好厉害”、“太牛了”、“新技术要诞生了”、“我们人类要被淘汰了”之类的话题。 但是这伟大的技术变革到底给我们带来了什么呢?答案好像又比较模糊。现在ChatGPT的代写、问答,以及开始做的搜索、办公是目…

计算机相关专业混体制的解决方案(考公务员)

文章目录 序:编制介绍1、公务员报考要求2、公务员工作待遇3、公务员工作内容4、公务员报考复习 序:编制介绍 编制介绍:编制,也就是常说的铁饭碗。 编制的诞生为了控制吃财政饭的人员数量无限膨胀而设置的,所以名额有限…

在线LLM应用集锦(持续更新ing...)

诸神缄默不语-个人CSDN博文目录 本博文关注能够在线直接用的AI大模型应用。 大模型冲鸭!加速! 最近更新时间:2023.7.24 最早更新时间:2023.6.8 文章目录 1. 自研2. 非自研3. LLM衍生服务 1. 自研 聊天机器人 ChatGPT https://c…

“云炬众创”小程序的操作演示

1是什么 “云炬众创”是云炬网络公司在国家“大众创新、万众创业”口号号召下开发的一个探索创业性的小程序,目前主要内容是考研真题等学习资料的免费分享和下载。 2为什么 (1)考研真题等学习有很重要的价值 (2)考…

ChatGPT应用|科大讯飞星火杯认知大模型场景创新赛开始报名了!

ChatGPT发布带来的 AI 浪潮在全球疯狂蔓延,国内掀起的大模型混战已经持续半年之久,国产大模型数量正以惊人的速度增长,据不完全统计,截止7月14号已经达到了111个,所谓的“神仙打架”不过如此了吧。 ( 包括但…

chatgpt赋能python:Python中的迭代器

Python中的迭代器 在Python中,迭代器是一种对象,它可以让我们可以遍历(或迭代)序列中的元素而不必了解它们如何存储在内存中。迭代器是Python中许多高级构造的基础 - 他们节省了空间,并且它们能够帮助我们更有效地处理…

chatgpt赋能python:Python迭代次数

Python迭代次数 Python作为一个动态语言,具有简单易学、易读易写、适用于快速开发等优点,已经成为众多开发者的首选语言。而其中的迭代功能更是方便快捷,可以用于处理数据集合或者处理流程控制等方面。但是,迭代次数同样是一个需…

2022年中考英语热点话题作文预测(满分范文15篇)

01 北京冬奥会 假设你是李华,最近收到新西兰笔友Peter的电子邮件,说他对北京冬奥会的吉祥物冰墩墩和冬残奥会的吉祥物雪容融非常感兴趣,但对其具体寓意不太清楚,请你参照下面表格的内容,给他回一封电子邮件。 注意&a…

CET4之作文

目录 一、议论文 1.1、现象解释类 1.1.1、18年12月 1.1.2、20年12月 1.1.3、20年7月 1.2、观点选择类 1.2.1、16年12月 1.4、图片表格类 二、应用文 2.1、感谢信 2.2、建议信 2.3、推荐信 2.4、邀请信 一、议论文 1.1、现象解释类 1.1.1、18年12月 the challeng…