CNN张量输入形状和特征图

CNN张量输入形状和特征图

这个是比较容易理解的张量的解释,比较直观

卷积神经网络

在这个神经网络编程系列中,我们正在逐步构建一个卷积神经网络(CNN),所以让我们看看CNN的张量输入。

在这里插入图片描述

在最后两篇文章中,我们介绍了张量和基本的张量属性秩、轴和形状。如果你还没有看过那些文章,我强烈建议你去查看。

我现在想做的是,用一个实际的例子来应用秩、轴和形状的概念。为此,我们将考虑将图像输入作为CNN的张量。

卷积神经网络是图像识别任务的首选网络,因为它们非常适合检测空间模式。

在这里插入图片描述

记住,张量的形状编码了关于张量轴、秩和索引的所有相关信息,所以我们将在示例中考虑形状,这将使我们能够计算出其他值。让我们开始。

CNN输入的形状

CNN输入的形状通常有四个长度。这意味着我们有一个秩为4的张量,有四个轴。张量形状中的每个索引代表一个特定的轴,每个索引处的值给出了相应轴的长度。

张量的每个轴通常代表输入数据的某种现实世界或逻辑特征。如果我们理解这些特征及其在张量中的轴位置,那么我们就可以很好地理解张量数据结构的整体。

为了分解这一点,我们将从右到左反向工作,考虑轴。记住,我们从最后一个轴开始,这是我们将要开始的地方,是实际数字或数据值所在的位置。

如果我们沿着最后一个轴运行并在那里检查一个元素,我们将看到一个数字。如果我们沿着任何其他轴运行,元素是多维数组。

对于图像,原始数据以像素的形式出现,由数字表示,并使用两个维度(高度和宽度)布局。

图像高度和宽度

为了表示两个维度,我们需要两个轴。

在这里插入图片描述

图像的高度和宽度在最后两个轴上表示。这里可能的值是28 x 28​,就像我们将在CNN项目中使用的fashion-MNIST数据集中的图像数据一样,或者是VGG16神经网络使用的224 x 224​图像大小,或者我们可以想象的任何其他图像尺寸。

图像颜色通道

下一个轴代表颜色通道。这里典型的值是3​,对于RGB图像,或者是1​,如果我们处理的是灰度图像。这种颜色通道的解释只适用于输入张量。

我们将在片刻后揭示,这个轴的解释在张量通过卷积层后会发生变化。

到目前为止,使用最后三个轴,我们已经将一个完整的图像表示为一个张量。我们有了颜色通道和高度和宽度,都以张量形式布局,使用了三个轴。

在这一点上,为了访问数据,我们需要三个索引。我们选择一个颜色通道,一个高度和一个宽度,以到达一个特定的像素值。

图像批次

这使我们来到了四个轴中的第一个,它代表批量大小。在神经网络中,我们通常使用样本的批次而不是单个样本,所以这个轴的长度告诉我们批次中有多少个样本。

这使我们能够看到,整个图像批次使用一个秩为4的张量表示。

假设我们有一个给定张量的形状[3, 1, 28, 28]​。使用形状,我们可以确定我们有三个图像的批次。

[批次大小,颜色通道,高度,宽度]

每张图像有一个单一的颜色通道,图像的高度和宽度分别是28 x 28​。

  1. 批次大小
  2. 颜色通道
  3. 高度
  4. 宽度

这给我们一个单一的秩为4的张量,最终将流经我们的卷积神经网络。

给定这样的图像张量,我们可以使用四个索引导航到批次中特定图像的特定颜色通道的特定像素。

NCHW vs NHWC vs CHWN

在阅读API文档和学术论文时,通常可以看到B​被N​替换。N​代表批次中的_样本数量_。

此外,我们在实际中经常遇到的另一个区别是维度的_重新排序_。常见的排序如下:

  • NCHW
  • NHWC
  • CHWN

正如我们所看到的,PyTorch使用NCHW​,而TensorFlow和Keras默认使用NHWC​(可以配置)。最终,选择使用哪一个主要取决于性能。一些库和算法更适合这些排序中的一种或另一种。

输出通道和特征图

让我们看看张量通过卷积层转换后,颜色通道轴的解释如何变化。

假设我们有一个张量,包含来自单个28 x 28​灰度图像的数据。这给我们提供了以下张量形状:[1, 1, 28, 28]​。

现在假设这个图像被传递到我们的CNN,并通过第一个卷积层。当这种情况发生时,我们的张量形状和底层数据将被卷积操作改变。

卷积改变了高度和宽度维度以及通道数量。输出通道的数量根据卷积层中使用的过滤器数量而变化。

在这里插入图片描述

假设我们有三个卷积过滤器,让我们看看通道轴会发生什么变化。

由于我们有三个卷积过滤器,我们将有三个来自卷积层的通道输出。这些通道是卷积层的输出,因此被称为输出_通道,而不是_颜色通道_。

三个过滤器中的每一个都对原始的单一输入通道进行卷积,产生三个输出通道。输出通道仍然由像素组成,但像素已经被卷积操作修改。根据过滤器的大小,输出的高度和宽度维度也会改变,但我们将在未来的文章中讨论这些细节。

特征图

有了输出通道,我们不再有颜色通道,而是有我们称之为_特征图_的修改后的通道。这些所谓的特征图是使用输入颜色通道和卷积过滤器进行卷积的结果。

特征图是由卷积产生的输出通道。

“特征”这个词被使用是因为输出代表了图像中的特定特征,例如边缘,并且这些映射在训练过程中网络学习时出现,并随着我们在网络中深入而变得更加复杂。

总结

我们现在应该对CNN输入张量的总体形状,以及秩、轴和形状的概念如何适用于这种理解有了很好的理解。

当我们开始构建CNN时,我们将在未来的文章中加深对这些概念的理解。在此之前,我们将在下一篇文章中见到你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/1473.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【数据可视化-12】数据分析岗位招聘分析

🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…

(12)springMVC文件的上传

SpringMVC文件上传 首先是快速搭建一个springMVC项目 新建项目mvn依赖导入添加webMoudle添加Tomcat运行环境.在配置tomcat时ApplicationContext置为"/"配置Artfact的lib配置WEB-INF配置文件(记得添加乱码过滤)配置springmvc-servlet文件&…

Ubuntu中双击自动运行shell脚本

方法1: 修改文件双击反应 参考: https://blog.csdn.net/miffywm/article/details/103382405 chmod x test.sh鼠标选中待执行文件,在窗口左上角edit菜单中选择preference设计双击执行快捷键,如下图: 方法2: 设置一个应用 参考: https://blo…

Linux(Centos7)安装Mysql/Redis/MinIO

安装Mysql 安装Redis 搜索Redis最先版本所在的在线安装yum库 查看以上两个组件是否是开机自启 安装MinIO 开源的对象存储服务,存储非结构化数据,兼容亚马逊S3协议。 minio --help #查询命令帮助minio --server --help #查询--server帮助minio serve…

金融项目实战 01|功能测试分析与设计

前置内容:金融项目准备的内容笔记可直接看如下笔记 只看:一、投资专业术语 和 二、项目简介 两部分文章浏览阅读2.3k次,点赞70次,收藏67次。安享智慧理财金融系统测试项目,测试用例,接口测试,金…

【Rust】控制流

目录 思维导图 一、选择结构 1. if表达式 2. 处理多个条件的else if 3. 使用if在let语句中 二、循环结构 1. loop 2. while循环 3. for循环 4. 使用范围Range进行循环 思维导图 一、选择结构 控制流是编程语言的基本构建块,Rust使用if表达式和循环来控制代…

FastDDS安装测试记录

1、安装依赖的软件 sudo apt install cmake g python3-pip wget git sudo apt install libasio-dev libtinyxml2-dev sudo apt install libssl-dev sudo apt install libp11-dev libengine-pkcs11-openssl sudo apt install softhsm22、安装foonathan_memory_vendor cd ~/Fas…

浅谈云计算01 | 云计算服务的特点

在当今数字化时代,云计算作为一种强大的技术解决方案,正逐渐改变着企业和个人对信息技术的使用方式。本文将详细探讨云计算的五个主要特点,包括按需自助服务、广泛的网络接入、资源池化、快速弹性伸缩以及可计量服务。 一、按需自助服务 云…

《使用 YOLOV8 和 KerasCV 进行高效目标检测》

《使用 YOLOV8 和 KerasCV 进行高效目标检测》 作者:Gitesh Chawda创建日期:2023/06/26最后修改时间:2023/06/26描述:使用 KerasCV 训练自定义 YOLOV8 对象检测模型。 (i) 此示例使用 Keras 2 在 Colab 中…

vue3+ts+element-plus 对话框el-dialog设置圆角

对话框el-dialog设置圆角,实现的需求效果: 目前只能通过行内样式(style"border-radius: 20px")来实现圆角效果:

pycharm-pyspark 环境安装

1、环境准备:java、scala、pyspark、python-anaconda、pycharm vi ~/.bash_profile export SCALA_HOME/Users/xunyongsun/Documents/scala-2.13.0 export PATH P A T H : PATH: PATH:SCALA_HOME/bin export SPARK_HOME/Users/xunyongsun/Documents/spark-3.5.4-bin…

UnityXR Interaction Toolkit 如何检测HandGestures

前言 随着VR设备的不断发展,从最初的手柄操作,逐渐演变出了手部交互,即头显可以直接识别玩家的手部动作,来完成手柄的交互功能。我们今天就来介绍下如何使用Unity的XR Interaction Toolkit 来检测手势Hand Gesture。 环境配置 1.使用Unity 2021或者更高版本,创建一个项…

thinkphp 5.0 结合redis 做延迟队列,队列无法被消费

目录 一、Linux 环境下 二、如何验证消息队列被正确监听 一、Linux 环境下 项目部署在Linux 环境下,首先找到项目的部署路径,接着输入命令,这个命令是以守护进程方式进行监听你的队列,只要redis 不关闭 就可以一直监听这个队列 nohup php …

E10.【C语言】练习:编写一个猜数字游戏

目录 1.规则 2.准备 3.游戏代码 1.规则 1.程序生成1-100间的随机数 2.用户猜数字 猜对了:游戏结束 猜错了:程序会告知猜大了或猜小了,继续进行游戏,直到猜对 3.游戏可以一直玩除非退出游戏 2.准备 1.框架:循…

【HTML+CSS+JS+VUE】web前端教程-31-css3新特性

圆角 div{width: 100px;height: 100px;background-color: saddlebrown;border-radius: 5px;}阴影 div{width: 200px;height: 100px;background-color: saddlebrown;margin: 0 auto;box-shadow: 10px 10px 20px rgba(0, 0, 0, 0.5);}

【高阶数据结构】位图

位图 一.位图相关面试题二.位图的设计及实现三.C库中的位图bitset四.位图的优缺点五.位图相关考察题目 一.位图相关面试题 问题:给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中(本…

解决Qt打印中文字符出现乱码

在 Windows 平台上,默认的控制台编码可能不是 UTF-8,这可能会导致中文字符的显示问题。 下面是在 Qt 应用程序中设置中文字体,并确保控制台输出为 UTF-8 编码: 1. Qt 应用程序代码 在 Qt 中,我们可以使用 QApplic…

hutool糊涂工具通过注解设置excel宽度

import java.lang.annotation.*;Documented Retention(RetentionPolicy.RUNTIME) Target({ElementType.METHOD, ElementType.FIELD, ElementType.PARAMETER}) public interface ExcelStyle {int width() default 0; }/*** 聊天记录*/ Data public class DialogContentInfo {/**…

【算法学习】——整数划分问题详解(动态规划)

🧮整数划分问题是一个较为常见的算法题,很多问题从整数划分这里出发,进行包装,形成新的题目,所以完全理解整数划分的解决思路对于之后的进一步学习算法是很有帮助的。 「整数划分」通常使用「动态规划」解决&#xff0…

【Elasticsearch7.11】postman批量导入少量数据

JSON 文件内的数据格式,json文件数据条数不要过多,会请求参数过大,最好控制再10000以内。 {"index":{"_id":"baec07466732902d22a24ba01ff09751"}} {"uuid":"baec07466732902d22a24ba01ff0975…