Pytorch 转向TFConv过程中的卷积转换

转换知识基础

图像中使用的卷积一般为,正方形卷积核针对一个同等面积邻域的,进行相乘后邻域叠加到中心,相当于考虑中心像素的周围信息,做了一定的信息融合。

卷积相关参数

卷积前: input c1

卷积中: kernel 卷积核  stride 步长  padding 填充  group 分组卷积   w预训练权重

卷积后: BN 归一化  act  激活函数 

SAME: 相同的PAD

VALD: 不做任何填充

SAME和VASLID的优劣对比

 总结:stride=1 时使用 "SAME" 的优势

维度说明
输出尺寸稳定保持输入与输出尺寸一致,避免网络深层特征图过度缩小。
对称填充保证自动计算对称填充量,与 PyTorch 的默认行为对齐,便于模型迁移。
代码简洁性无需手动计算和添加填充层,减少冗余代码。
计算效率框架原生优化填充操作,通常比手动填充更高效。

附:不同参数下的填充行为对比表

参数stride=1 + "SAME"stride=2 + 手动填充 + "VALID"
输出尺寸与输入相同按公式 ⌊H+2p−ks⌋+1⌊sH+2p−k​⌋+1 计算
填充方式自动对称或轻微不对称手动对称填充
跨框架一致性与 PyTorch 的 padding=k//2 对齐强制对齐 PyTorch 的填充逻辑
典型应用场景密集特征提取(如残差块)下采样(如网络前半部分)

# 注释版本 2025 03 10
class TFConv(keras.layers.Layer):"""实现标准卷积层,可选批归一化与激活函数,适用于TensorFlow。"""def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True, w=None):"""参数说明:c1 (int): 输入通道数(代码中未直接使用,可能通过权重自动推断)c2 (int): 输出通道数(即卷积核数量)k (int/tuple): 卷积核尺寸,默认为1s (int/tuple): 卷积步长,默认为1p (int/tuple/None): 填充大小,None时自动计算为k//2g (int): 分组卷积组数,默认1(代码支持但原注释提示可能限制)act (bool/str): 是否使用激活函数,默认Truew (object): 预训练权重对象,包含卷积和BN参数"""super().__init__()# 当步长s=1时使用"SAME"填充,否则手动填充后使用"VALID"卷积以对齐PyTorch行为# 创建Conv2D层,配置参数conv = keras.layers.Conv2D(filters=c2,kernel_size=k,strides=s,padding="SAME" if s == 1 else "VALID",  # s=1用自动填充,s>1需手动填充use_bias=not hasattr(w, "bn"),  # 存在BN层时禁用偏置groups=g,  # 分组卷积参数(需确认TF版本支持性)kernel_initializer=keras.initializers.Constant(w.conv.weight.permute(2, 3, 1, 0).numpy()  # 调整PyTorch权重维度到TF格式 (kH, kW, in, out)),bias_initializer="zeros" if hasattr(w, "bn") else keras.initializers.Constant(w.conv.bias.numpy()),)# 组合层:当s>1时,先填充再卷积self.conv = conv if s == 1 else keras.Sequential([TFPad(autopad(k, p)), conv])  # 自定义填充层处理非1步长# 批归一化层(存在BN参数时)或恒等映射self.bn = TFBN(w.bn) if hasattr(w, "bn") else tf.identity# 激活函数(根据act参数选择)或恒等函数self.act = activations(w.act) if act else tf.identitydef call(self, inputs):"""执行卷积、批归一化与激活函数的前向传播"""return self.act(self.bn(self.conv(inputs)))  # 顺序: Conv -> BN -> Act

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31528.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

“量子心灵AI“的监控仪表盘 - javascript网页设计案例

【前端实战】基于Three.js和Chart.js打造未来科技风AI监控仪表盘 本文通过AI辅助开发,详细记录了一个高级前端项目的完整实现过程。文章包含核心代码片段、技术要点及遇到的问题与解决方案。适合有一定前端基础的开发者学习参考。 1. 项目概述 本文详细介绍了一个名…

vtkDepthSortPolyData 根据相机视图方向对多边形数据进行排序

1. 作用 在 3D 渲染中,透明对象的渲染顺序非常重要。如果透明对象的渲染顺序不正确,可能会导致错误的视觉效果(例如,远处的透明对象遮挡了近处的透明对象)。vtkDepthSortPolyData 通过对多边形数据进行深度排序&#…

第十五章:go package 包的管理

import f "fmt"   // 注意 这里 f 是包的别名 init初始化函数 在每一个Go源文件中,都可以定义任意个如下格式的特殊函数: func init(){// ... } package:声明包的关键字 packagename:包名,可以不与文…

【从零开始学习计算机科学】计算机组成原理(七)存储器与存储器系统

【从零开始学习计算机科学】计算机组成原理(七)存储器与存储器系统 存储器存储器相关概念存储器分类存储器系统存储器性能指标存储器层次概述程序访问的局部性原理SRAM存储器存储器的读写周期DRAM存储器DRAM控制器高性能的主存储器存储器扩展只读存储器ROM光擦可编程只读存储…

开源!速度100Kb/s的有线和无线双模ESP32S3芯片的DAP-Link调试器

开源!速度100Kb/s的有线和无线双模ESP32S3芯片的DAP-Link调试器 目录 开源!速度100Kb/s的有线和无线双模ESP32S3芯片的DAP-Link调试器本项目未经授权,禁止商用!本项目未经授权,禁止商用!本项目未经授权&…

20250212:linux系统DNS解析卡顿5秒的bug

问题: 1:人脸离线识别记录可以正常上传云端 2:人脸在线识别请求却一直超时 3:客户使用在线网络 思路:

爱普生温补晶振 TG5032CFN高精度稳定时钟的典范

在科技日新月异的当下,众多领域对时钟信号的稳定性与精准度提出了极为严苛的要求。爱普生温补晶振TG5032CFN是一款高稳定性温度补偿晶体振荡器(TCXO)。该器件通过内置温度补偿电路,有效抑制环境温度变化对频率稳定性的影响&#x…

【病毒分析】熊猫烧香病毒分析及其查杀修复

目录 前言 一、样本概况 1.1 样本信息 1.2 测试环境及工具 1.3 分析目标 二、具体行为分析 2.1 主要行为 2.1.1 恶意程序对用户造成的危害 2.2 恶意代码分析 2.2.1 加固后的恶意代码树结构图(是否有加固) 2.2.2 恶意程序的代码分析片段 三、解决方案(或总结) 3.1 …

JavaWeb后端基础(7)AOP

AOP是Spring框架的核心之一,那什么是AOP?AOP:Aspect Oriented Programming(面向切面编程、面向方面编程),其实说白了,面向切面编程就是面向特定方法编程。AOP是一种思想,而在Spring框…

AutoDL平台租借GPU,创建transformers环境,使用VSCode SSH登录

AutoDL平台租借GPU,创建transformers环境,使用VSCode SSH登录 一、AutoDl平台租用GPU 1.注册并登录AutoDl官网:https://www.autodl.com/home 2.选择算力市场,找到需要的GPU: 我这里选择3090显卡 3.这里我们就选择P…

三维建模与视频融合(3D-Video Integration)技术初探。

三维建模与视频融合(3D-Video Integration)是一种将虚拟三维模型无缝嵌入实拍视频场景的技术,广泛应用于影视特效、增强现实(AR)、游戏开发、广告制作 、视频监控 等领域。 一、技术核心流程 三维建模与动画 使用工具…

天津大学:《深度解读DeepSeek:部署、使用、安全》

大家好,我是吾鳴。 吾鳴之前给大家分享过由天津大学出品的报告《DeepSeek原理与效应》,今天吾鳴再给大家分享一份由天津大学出品的报告——《深度解读DeepSeek:部署、使用、安全》。 报告主要从DeepSeek本地化部署、DeepSeek使用方法与技巧、…

用android studio模拟器,模拟安卓手机访问网页,使用Chrome 开发者工具查看控制台信息

web 网页项目在安卓手机打开时出现问题,想要查看控制台调试信息。记录一下使用android studio 模拟器访问的方式。 步骤如下: 1.安装android studio,新增虚拟设备(VDM- virtual device manager) 点击Virtual Device Manager后会…

【音视频】ffmpeg命令提取像素格式

1、提取YUV数据 提取yuv数据,并保持分辨率与原视频一致 使用-pix_fmt或-pixel_format指定yuv格式提取数据,并保持原来的分辨率 ffmpeg -i music.mp4 -t "01:00" -pixel_format yuv420p music.yuv提取成功后,可以使用ffplay指定y…

同为科技智能PDU在数据中心场景的应用与解决方案

数据中心当前处于一个快速发展和技术变革的特殊时期,全新的人工智能应用正在重塑整个世界,为社会带来便捷的同时,也为数据中心的发展带来了新的机遇和挑战。智能算例的爆发式增长,对数据中心提出了大算力、高性能的新需求&#xf…

deepseek在pycharm中的配置和简单应用

对于最常用的调试python脚本开发环境pycharm,如何接入deepseek是我们窥探ai代码编写的第一步,熟悉起来总没坏处。 1、官网安装pycharm社区版(免费),如果需要安装专业版,需要另外找破解码。 2、安装Ollama…

汽车一键启动按钮更换注意事项

汽车一键启动开关更换教程 一键启动开关是现代汽车中常见的便捷配置,但随着时间的推移,这个部件可能会出现失灵的情况。当一键启动开关发生故障时,许多车主选择自行更换。以下是整理的一键启动开关更换教程: 更换前的准备 选择匹…

群晖DS223 Docker搭建为知笔记

群晖DS223 Docker搭建为知笔记,打造你的专属知识宝库 一、引言 在数字化信息爆炸的时代,笔记软件成为了我们管理知识、记录灵感的得力助手。为知笔记,作为一款专注于工作笔记和团队协作的云笔记产品,以其丰富的功能和便捷的使用体…

①Modbus TCP转Modbus RTU/ASCII网关同步采集无需编程高速轻松组网

Modbus TCP转Modbus RTU/ASCII网关同步采集无需编程高速轻松组网https://item.taobao.com/item.htm?ftt&id784749793551 MODBUS TCP 通信单元 MODBUS TCP 转 RS485 MS-A1-50X1 系列概述 MS-A1-50X1 系列概述 MS-A1-50X1系列作为MODBUS TCP通信的服务器进行动作。可通…

BI 工具响应慢?可能是 OLAP 层拖了后腿

在数据驱动决策的时代,BI 已成为企业洞察业务、辅助决策的必备工具。然而,随着数据量激增和分析需求复杂化,BI 系统“卡”、“响应慢”的问题日益突出,严重影响分析效率和用户体验。 本文将深入 BI 性能问题的根源,并…