从MLP到卷积

1.从MLP到卷积层

最近要做多通道的实验,所以重新将处理图像的基础模型回顾一下,什么是卷积?卷积本质是是一种特殊的全连接层。

 1.1怎么w的权重从一个值变成了4维呢?可以这样理解,在此举一个例子:

其实本质可以看成,将w的权重从一个值拉成了一个向量,ij就是宽与高,对应的向量就是具体的元素值,我们在这里假设w形状为2*2*3*3.这个怎么理解四维张量呢?2是两个批次,

对于输入矩阵和输出矩阵的维度,以及四维张量权重的形状,可以用一个具体的示例来说明它们之间的关系。

示例设定

  • 输入矩阵 𝑋X 大小为 3×3。
  • 输出矩阵 𝐻H 大小为 2×2。
  • 权重张量 𝑊W 形状为 2×2×3×3

#第一个输出神经元x11  ---- W1111 ----x12  ---- W1112 ----x13  ---- W1113 ----x21  ---- W1121 ----> h11x22  ---- W1122 ----x23  ---- W1123 ----x31  ---- W1131 ----x32  ---- W1132 ----x33  ---- W1133 ----
#第二个输出神经元x11  ---- W1211 ----x12  ---- W1212 ----x13  ---- W1213 ----x21  ---- W1221 ----> h12x22  ---- W1222 ----x23  ---- W1223 ----x31  ---- W1231 ----x32  ---- W1232 ----x33  ---- W1233 ----
#第三个输出神经元x11  ---- W2111 ----x12  ---- W2112 ----x13  ---- W2113 ----x21  ---- W2121 ----> h21x22  ---- W2122 ----x23  ---- W2123 ----x31  ---- W2131 ----x32  ---- W2132 ----x33  ---- W2133 ----
#第四个输出神经元x11  ---- W2211 ----x12  ---- W2212 ----x13  ---- W2213 ----x21  ---- W2221 ----> h22x22  ---- W2222 ----x23  ---- W2223 ----x31  ---- W2231 ----x32  ---- W2232 ----x33  ---- W2233 ----

这个对应的是输出。也就是2*2的一个输出。2*2*3*3前者是输出的维度,后者是输入的维度。其实权重就是把w原先的1维变成了矩阵,每个都对应相乘了。这个是mlp和卷积的关系。卷积是一种特殊的mlp。所以一般的卷积是什么呢?

一般的卷积满足下面两个性质:

(1)平移不变性

(2)局部性

给一个图和一个卷积核的定义就能理解了:在这里卷积核就是3*3了,平移确实没有变化卷积核,卷积核就是权重矩阵,局部性就是每个卷积核就那么大,滚来滚去还是那么大。

1.2怎么理解卷积呢?

1.3多个输入与输出通道

一个自己写的例子:

多对一

import torch
from d2l import torch as d2l
import numpy as np
def corr2d_multi_in(X,K):return sum(d2l.corr2d(x,k) for x,k in zip(X,K))
X = torch.tensor([[[0,1,2],[3,4,5],[6,7,8]],[[1,2,3],[4,5,6],[7,8,9]],[[2,3,4],[5,6,7],[8,9,10]]])K = torch.tensor([[[0,1],[2,3]],[[1,2],[3,4]],[[5,6],[7,8]]])
print(corr2d_multi_in(X,K))

这个怎么理解呢?就是三个卷积核对应着三个不同的通道。

结果如下最后要将三个卷积核计算的结果进行相加。sum三个卷积核。

多对多(多通道输入及多通道输出):

老样子,我还是举个例子:

(1)定义输入和卷积核

import torch# 定义输入张量 X
X = torch.tensor([[[0, 1, 2], [3, 4, 5], [6, 7, 8]], [[1, 2, 3], [4, 5, 6], [7, 8, 9]]])# 定义原始卷积核 K
K = torch.tensor([[[0, 1], [2, 3]], [[1, 2], [3, 4]]])# 扩展 K
K = torch.stack((K, K + 1, K + 2), 0)

(2)扩展后的卷积核

K = torch.stack((K, K+1, K+2), 0)# 结果
K = tensor([[[[0, 1], [2, 3]],  # 第一个卷积核[[1, 2], [3, 4]]], [[[1, 2], [3, 4]],  # 第二个卷积核 (K+1)[[2, 3], [4, 5]]], [[[2, 3], [4, 5]],  # 第三个卷积核 (K+2)[[3, 4], [5, 6]]]])

(3)定义二维卷积函数

def corr2d(X, K):h, w = K.shapeY = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))for i in range(Y.shape[0]):for j in range(Y.shape[1]):Y[i, j] = (X[i: i + h, j: j + w] * K).sum()#这一块是卷积核,对应的就是移动小方框的累计求和return Y

(4)多通道输入二维卷积函数

def corr2d_multi_in(X, K):return sum(corr2d(x, k) for x, k in zip(X, K))

(5)最终多输入多输出的卷积函数

def corr2d_multi_in_out(X, K):return torch.stack([corr2d_multi_in(X, k) for k in K], 0)

(6)调用并打印结果

result = corr2d_multi_in_out(X, K)
print(result)

给出结果:

(1)第一个卷积核 k = K[0]:

k = tensor([[[0, 1], [2, 3]], [[1, 2], [3, 4]]])

(2)对第一个通道:

x = X[0] = tensor([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
k[0] = tensor([[0, 1], [2, 3]])result = corr2d(x, k[0])
# result: tensor([[19, 25], [37, 43]])

(3)对第二个通道:

x = X[1] = tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
k[1] = tensor([[1, 2], [3, 4]])result = corr2d(x, k[1])
# result: tensor([[42, 52], [72, 82]])

(4)两个通道结果相加:

total_result = tensor([[19, 25], [37, 43]]) + tensor([[42, 52], [72, 82]])
# total_result: tensor([[ 61,  77], [109, 125]])

(5)第二个卷积核 k = K[1]:

k = tensor([[[1, 2], [3, 4]], [[2, 3], [4, 5]]])

(6)对第一个通道:

x = X[0] = tensor([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
k[0] = tensor([[1, 2], [3, 4]])result = corr2d(x, k[0])
# result: tensor([[39, 49], [69, 79]])

(7)对于第二个通道

x = X[1] = tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
k[1] = tensor([[2, 3], [4, 5]])result = corr2d(x, k[1])
# result: tensor([[64, 79], [109, 124]])

(8)两个通道结果相加:

total_result = tensor([[39, 49], [69, 79]]) + tensor([[64, 79], [109, 124]])
# total_result: tensor([[103, 128], [178, 203]])

(9)第三个卷积核 k = K[2]:

k = tensor([[[2, 3], [4, 5]], [[3, 4], [5, 6]]])

(10)对第一个通道:

x = X[0] = tensor([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
k[0] = tensor([[2, 3], [4, 5]])result = corr2d(x, k[0])
# result: tensor([[59, 73], [101, 115]])

(11)对第二个通道:

x = X[1] = tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
k[1] = tensor([[3, 4], [5, 6]])result = corr2d(x, k[1])
# result: tensor([[86, 106], [146, 166]])

(12)两个通道结果相加:

total_result = tensor([[59, 73], [101, 115]]) + tensor([[86, 106], [146, 166]])
# total_result: tensor([[145, 179], [247, 281]])

(13)堆叠所有结果

final_result = torch.stack([tensor([[ 61,  77], [109, 125]]),tensor([[103, 128], [178, 203]]),tensor([[145, 179], [247, 281]])], 0)# final_result:
# tensor([[[ 61,  77],
#          [109, 125]],#         [[103, 128],
#          [178, 203]],#         [[145, 179],
#          [247, 281]]])

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/339878.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安防综合管理系统EasyCVR平台GA/T1400视图库:基于XML的消息体格式

GA/T 1400标准的应用范围广泛,涵盖了公安系统的视频图像信息应用系统,如警务综合平台、治安防控系统、交通管理系统等。在视频监控系统中,GA/T 1400公安视图库的对接是实现视频图像信息传输、处理和管理的重要环节。 以视频汇聚EasyCVR视频监…

Flink中因java的泛型擦除导致的报错及解决

【报错】 Exception in thread "main" org.apache.flink.api.common.functions.InvalidTypesException: The return type of function Custom Source could not be determined automatically, due to type erasure. You can give type information hints by using th…

使用Xshell一键在多个会话中执行多个命令

背景 平时在工作中经常通过ssh远程操作Linux,由于我们负责的服务部署在超过5台服务器(相同的代码及路径),每次发布后执行重启都得重复操作5次关闭、检查、启动、查看日志,特别繁琐。 后来发现Xshell 7可以录制脚本&am…

【MyBatis】MyBatis操作数据库(二):动态SQL、#{}与${}的区别

目录 一、 动态SQL1.1 \<if>标签1.2 \<trim>标签1.3 \<where>标签1.4 \<set>标签1.5 \<foreach>标签1.6 \<include>标签 二、 #{}与${}的区别2.1 #{}是预编译sql&#xff0c;${}是即时sql2.2 SQL注入2.3 #{}性能高于${}2.4 ${}用于排序功能…

洛谷 P10566 「Daily OI Round 4」Analysis 题解

先弄个 ASCII 码表&#xff1a; 分析 很明显&#xff0c;想要节省时间&#xff0c;就要把这些字符转换成和它们的 ASCII 值最接近的大写字母。 通过 ASCII 码表&#xff0c;很容易就可以发现&#xff1a; ASCII 值与数字最接近的大写字母是 A \texttt A A。ASCII 值与小写…

JVM学习-监控工具(二)

jmap&#xff1a;导出内存映像文件&内存使用情况 基本情况 jmap(JVM Memory Map)&#xff1a;一方法获取dump文件(堆转储快照文件&#xff0c;二进制文件)&#xff0c;还可以获取目标Java进程的内存相关信息&#xff0c;包括Java堆各区域的使用情况、堆中对象的统计信息、…

多线程新手村5--线程池

1.1 线程池是什么 线程诞生的意义是因为进程的创建/销毁开销太大&#xff0c;所以使用线程提高代码的执行效率&#xff1b;那如果想要进一步提升执行效率&#xff0c;该怎么办呢&#xff1f;有一个方法是使用线程池。 首先&#xff0c;什么是线程池&#xff1a;池就是池子&am…

奶茶店、女装店、餐饮店是高危创业方向,原因如下:

关注卢松松&#xff0c;会经常给你分享一些我的经验和观点。 现在的俊男靓女们&#xff0c;心中都有一个执念&#xff1a; (1)想证明自己了&#xff0c;开个奶茶去…… (2)想多赚点钱了&#xff0c;加盟餐饮店去…… (3)工作不顺心了&#xff0c;搞个女装店去…… 但凡抱着…

102.网络游戏逆向分析与漏洞攻防-ui界面的设计-反隐身功能的界面设计与实现(有不使用MFC生成,自己手写代码创建复选框与事件的例子)

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 如果看不懂、不知道现在做的什么&#xff0c;那就跟着做完看效果&#xff0c;代码看不懂是正常的&#xff0c;只要会抄就行&#xff0c;抄着抄着就能懂了 内容…

独立游戏开发的 6 个步骤

&#x1f482; 个人网站:【 摸鱼游戏】【神级代码资源网站】【工具大全】&#x1f91f; 一站式轻松构建小程序、Web网站、移动应用&#xff1a;&#x1f449;注册地址&#x1f91f; 基于Web端打造的&#xff1a;&#x1f449;轻量化工具创作平台&#x1f485; 想寻找共同学习交…

discuz论坛怎么修改备案信息

大家好&#xff0c;今天给大家分享下discuz如何填写备案信息并且展示在网站首页。大家都知道国内网站都需要备案&#xff0c;不通过备案的网站上是没办法通过域名打开的。大家也可以通过搜索网创有方&#xff0c;或者直接点击网创有方 查看悬挂备案号后的效果。 首先大家可以看…

MySQL表的增删改查初阶(上篇)

本篇会加入个人的所谓鱼式疯言 ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. &#x1f92d;&#x1f92d;&#x1f92d;可能说的不是那么严谨.但小编初心是能让更多人…

成人本科毕业论文怎么写?分享自己的经验

撰写成人本科毕业论文是一个系统而深入的过程&#xff0c;以下是我个人的经验分享&#xff0c;希望能帮助你更好地完成这一任务&#xff1a; 1. 明确论文选题 兴趣与专长&#xff1a;选择自己感兴趣且有一定专长的领域&#xff0c;这样更容易深入研究。可行性&#xff1a;确保…

【全开源】种草分享|动态朋友圈|瀑布流|uniapp

一款基于FastadminThinkPHP和Uniapp开发的种草分享评论点赞消息提醒系统&#xff0c;发布动态&#xff0c;分享种草生活&#xff0c;可以收藏关注点赞&#xff0c;消息提醒&#xff0c;同时支持H5/小程序/app多端。 ​让每一次互动都不再错过&#x1f514; &#x1f331; 种草…

spring boot 中的异步@Async

spring boot 开启异步调用 1、启动类上添加EnableAsync注解&#xff0c;表示启动异步 2、在具体实现异步的方法上添加Async注解 package com.example.demo;import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootAppli…

HTML5的标签(文本链接、图片路径详解)

目录 前言 一、文本链接 超链接表述 二、图片路径详解 绝对路径 相对路径 网络路径 前言 一、文本链接 超链接表述 HTML 使用标签<a>来设置超文本链接 超链接可以是一个字&#xff0c;一个词&#xff0c;或者一组词&#xff0c;也可以是一幅图像&#xff0c;…

[FreeRTOS 基础知识] 堆

文章目录 堆的概念使用C语言实现 堆堆空间解析 堆的概念 所谓的堆就是一块空间的内存&#xff0c;可以来管理这块内存。从这块内存中取出一部分然后再释放回去。 使用C语言实现 堆 char heap_buf[1024]; // 定义一个堆空间 int pos0; // 当前…

文件上传题目练习

[HNCTF 2022 Week1]easy_upload 先尝试上传一个php文件&#xff0c;发现直接就成功了 用蚁剑测试连接成功 找到flag [NISACTF 2022]bingdundun~ 白名单上传 这里因为尝试了很多绕过方式都不成功&#xff0c;去搜索了一下wp&#xff0c;发现要用到Phar://伪协议 补充&#xff…

恒创科技:无法与服务器建立安全连接怎么解决?

在使用互联网服务时&#xff0c;有时会出现无法与服务器建立安全连接的问题&#xff0c;此错误消息通常出现在尝试访问需要安全连接的网站(例如使用 HTTPS 的网站)时&#xff0c;这可能是由于多种原因造成的&#xff0c;以下是一些常见的解决方法&#xff0c;帮助你解决问题。 …

VR导航的实现原理、技术优势和应用场景

VR导航通过虚拟现实技术提供沉浸式环境&#xff0c;结合室内定位技术实现精准导航。目前&#xff0c;VR导航已在多个领域展现出其独特的价值和潜力&#xff0c;预示着智能导航系统的未来发展。 一、实现原理 VR导航技术依托于虚拟现实(VR)和室内定位系统。VR技术利用计算机模…