在 VS Code 中调试 Tensor 形状不显示的问题及解决方案



文章目录

  • 常见问题
  • 解决方案
    • 1. 定制类包装和 `__repr__` 方法
  • 解释
  • 如何应用
  • 总结


在使用 VS Code 调试 PyTorch 代码时,可能会遇到一个常见问题:调试时 variables 窗口中不显示 Tensor 的形状信息。这会使得调试时观察数据的结构变得不便,尤其是在处理高维度的张量时。

在这篇博客中,我将提供一个改进方案,通过自定义 __repr__ 方法,让 PyTorch Tensor 的形状在调试信息中更清晰地呈现。我们还将展示如何针对其他 Python 对象(如 listdict 以及 pandas.DataFrame)进行类似的处理,使调试时可以直观地看到这些对象的尺寸或内容。


常见问题

在调试 PyTorch 项目时,VS Code 的 variables 窗口默认不会显示张量的形状信息,除非你展开查看具体的变量内容。这种行为对于需要快速检查张量维度的场景是比较不便的。Python 的内置类型(如 boolintstr)也无法直接继承,因此我们不能简单地扩展这些类型来自定义调试信息。

为了解决这些问题,我们可以通过创建包装类(wrapper classes)或直接重写对象的 __repr__ 方法,来定制它们在调试窗口中的显示内容。


解决方案

我们可以通过以下步骤来自定义调试时 Tensor 以及其他对象的显示方式。

1. 定制类包装和 __repr__ 方法

  • 我们可以为 Python 的内置类型创建包装类,重写 __repr__ 方法以自定义它们的显示形式。
  • 对于 PyTorch 的 Tensorpandas.DataFrame,可以直接重写它们的 __repr__ 方法来显示额外的信息(如张量形状或 DataFrame 的维度)。

下面是一个完整的代码示例:

import torch
import pandas as pd# -------------------- 自定义包装类 --------------------class CustomBool:def __init__(self, value):self.value = bool(value)def __repr__(self):return f'{{bool}} {self.value}'class CustomInt:def __init__(self, value):self.value = int(value)def __repr__(self):return f'{{int}} {self.value}'class CustomStr:def __init__(self, value):self.value = str(value)def __repr__(self):return f'{{str}} {self.value}'# 自定义 list 和 dict 子类
class CustomList(list):def __repr__(self):return f'{{list: {len(self)}}} {super().__repr__()}'class CustomDict(dict):def __repr__(self):return f'{{dict: {len(self)}}} {super().__repr__()}'# 自定义 Tensor 的 __repr__ (Torch)
original_tensor_repr = torch.Tensor.__repr__
def custom_tensor_repr(self):return f'{{Tensor: {tuple(self.shape)}}} {original_tensor_repr(self)}'
torch.Tensor.__repr__ = custom_tensor_repr# 自定义 DataFrame 的 __repr__ (Pandas)
original_dataframe_repr = pd.DataFrame.__repr__
def custom_dataframe_repr(self):return f'{{DataFrame: {self.shape}}} {original_dataframe_repr(self)}'
pd.DataFrame.__repr__ = custom_dataframe_repr# 自定义 DataLoader 的类
class DataLoader:def __init__(self, data_size):self.data_size = data_sizedef __len__(self):return self.data_sizedef __repr__(self):return f'{{DataLoader: {len(self)}}} DataLoader object'# -------------------- __main__ 函数 --------------------
def main():# 使用自定义类型代替原生类型my_list = CustomList([1, 2, 3, 4, 5, 6])my_dict = CustomDict({'a': 1, 'b': 2, 'c': 3})my_bool = CustomBool(True)my_int = CustomInt(42)my_str = CustomStr("hello")# 测试 Tensormy_tensor = torch.randn(100, 512)# 测试 DataFramemy_dataframe = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})# 测试 DataLoadermy_dataloader = DataLoader(220)# 输出内容print(my_list)        # {list: 6} [1, 2, 3, 4, 5, 6]print(my_dict)        # {dict: 3} {'a': 1, 'b': 2, 'c': 3}print(my_bool)        # {bool} Trueprint(my_int)         # {int} 42print(my_str)         # {str} 'hello'print(my_tensor)      # {Tensor: (100, 512)} tensor([...])print(my_dataframe)   # {DataFrame: (3, 3)}    A  B  Cprint(my_dataloader)  # {DataLoader: 220} DataLoader object# 如果是直接运行文件,则调用 main 函数
if __name__ == "__main__":main()

解释

  1. 包装类的实现

    • 我们为 boolintstr 创建了包装类 CustomBoolCustomIntCustomStr,并通过重写 __repr__ 方法来定制它们的显示格式。
  2. 自定义 listdict

    • 使用 CustomListCustomDict 继承自 Python 的内置 listdict 类型,并且通过重写 __repr__ 方法来显示列表或字典的长度。这对于调试包含大量数据的容器类非常有用。
  3. Tensor 和 DataFrame 的自定义 __repr__

    • 我们通过直接修改 torch.Tensorpandas.DataFrame__repr__ 方法,分别让它们在打印时显示张量的形状和 DataFrame 的维度信息。这在调试过程中可以让你一眼就看到数据的结构,而不需要展开变量。
  4. DataLoader 自定义类

    • 我们还创建了一个自定义的 DataLoader 类,并重写了它的 __repr__ 方法来显示加载的数据大小。这对于在训练模型时检查数据集大小十分有用。

如何应用

  1. 直接运行

    • 你可以在 VS Code 中直接运行该文件,main() 函数会自动执行,并在控制台中打印所有对象的自定义表示。
  2. 模块化使用

    • 如果你需要将这些自定义类和方法用于其他项目,只需导入相应的类或函数即可,而无需重复定义。

总结

通过自定义 __repr__ 方法,我们成功地解决了 VS Code 中调试 Tensor 变量时无法快速查看其形状的问题。我们同样可以使用类似的方式来扩展其他数据类型,使得调试时变量信息更加直观清晰。该方法非常实用,尤其适合处理大型数据集或高维度张量的深度学习项目。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/452775.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Three.js和Force-Directed Graph实现3D知识图谱可视化

先看样式: 在当今信息爆炸的时代,如何有效地组织和展示复杂的知识结构成为一个重要的挑战。3D知识图谱可视化是一种直观、交互性强的方式来呈现知识之间的关系。本文将详细介绍如何使用HTML、JavaScript、Three.js和Force-Directed Graph库来实现一个交互…

【动态规划】【路径问题】下降路经最小和、最小路径和、地下城游戏

4. 下降路径最小和 931. 下降路径最小和 算法原理 确定状态表示 dp[i][j] 表示:到达 [i, j] 位置,最小的下降路径 状态转移方程 dp[i][j] 从 [i-1, j-1] 到达 [i, j] > dp[i-1][j-1] m[i][j]从 [i-1, j] 到达 [i, j] > dp[i-1][j] m[i][j]从 …

已解决:ModuleNotFoundError: No module named ‘pip‘

[已解决] ModuleNotFoundError: No module named ‘pip‘ 文章目录 写在前面问题描述报错原因分析 解决思路解决办法1. 手动安装或升级 pip2. 使用 get-pip.py 脚本3. 检查环境变量配置4. 重新安装 Python 并确保添加到 PATH5. 在虚拟环境中安装 pip6. 使用 conda 安装 pip&…

智简魔方业务管理系统v10 好用的IDC业务管理软件

智简魔方业务管理系统v10,您一直在寻找的IDC业务管理软件,基于PHPMYSQL开发的一套小型易于部署的业务管理核心,具有极强的扩展能力,非常方便的安装方式,用户可在5分钟内部署属于自己的业务管理系统,ZJMF-CB…

路由表来源(基于华为模拟器eNSP)

概叙 在交换网络中,若要实现不同网段之间的通信,需要依靠三层设备(路由器、三层交换机等),而路由器只知道其直连网段的路由条目,对于非直连的网段,在默认情况下,路由器是不可达的&a…

Goland 搭建Gin脚手架

一、使用编辑器goland 搭建gin 打开编辑器 新建项目后 点击 create 二、获得Gin框架的代码 命令行安装 go get -u github.com/gin-gonic/gin 如果安装不上,配置一下环境 下载完成 官网git上下载 这样就下载完成了。、 不过这种方法需要设置一下GOPATH 然后再执…

【An】Animate 2024 for【Mac】 An动画设计制作软件 安装教程——保姆级教程

Mac分享吧 文章目录 【An】Animate 2024 Mac版 An动画设计制作软件 安装完成,打开效果Mac电脑【An】Animate 2024 动画设计制作软件——v24.0.4⚠️注意事项:1️⃣:下载软件2️⃣:安装AntiCC组件,步骤见文章或下图3️…

springboot+uinapp基于Android的固定资产借用管理平台

文章目录 前言项目介绍技术介绍功能介绍核心代码数据库参考 系统效果图论文效果图 前言 文章底部名片,获取项目的完整演示视频,免费解答技术疑问 项目介绍 固定资产借用管理平台设计的目的是为用户提供使用申请、故障报修、设备归还、意见反馈等管理方…

嘉立创EDA个人学习笔记2(绘制51单片机核心板)

前言 本篇文章属于嘉立创EDA的学习笔记,来源于B站教学视频。下面是这位up主的视频链接。本文为个人学习笔记,只能做参考,细节方面建议观看视频,肯定受益匪浅。 【教程】零基础入门PCB设计-国一学长带你学立创EDA专业版 全程保姆…

新手入门之Spring Bean

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、初识SpringBootSpringBoot 的主要特点1、自动配置:2、外部化配置:3、嵌入式服务器支持:4、启动器依赖(Start…

大数据新视界 --大数据大厂之数据脱敏技术在大数据中的应用与挑战

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

R语言机器学习算法实战系列(十)自适应提升分类算法 (Adaptive Boosting)

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍原理步骤教程下载数据加载R包导入数据数据预处理数据描述数据切割调节参数构建模型预测测试数据评估模型模型准确性混淆矩阵模型评估指标ROC CurvePRC Curve特征的重要性保存模型总…

【图解版】力扣第162题:寻找峰值

注意 题目只要求找到一个峰值就可以了。nums[-1]和nums[n]这两个位置是负无穷,也就是说,除了数组的位置之外,其它地方都是负无穷。对于所有有效的 i 都有 nums[i] ! nums[i 1] 方法一 遍历整个数组,找到最高的那个点。时间复杂…

大数据治理:数据时代的挑战与应对

目录 大数据治理:数据时代的挑战与应对 一、大数据治理的概念与内涵 二、大数据治理的重要性 1. 提高数据质量与可用性 2. 确保数据安全与合规 3. 支持数据驱动的决策 4. 提高业务效率与竞争力 三、大数据治理的实施策略 1. 建立健全的数据治理框架 2. 数…

C++STL--------list

文章目录 一、list链表的使用1、迭代器2、头插、头删3、insert任意位置插入4、erase任意位置删除5、push_back 和 pop_back()6、emplace_back尾插7、swap交换链表8、reverse逆置9、merge归并10、unique去重11、remove删除指定的值12、splice把一个链表的结点转移个另一个链表13…

Java入门4——输入输出+实用的函数

在本篇博客,采用代码解释的方法,帮助大家熟悉Java的语法 一、输入和输出 在Java当中,我们一般有这样输入输出: import java.util.Scanner;public class javaSchool {public static void main(String[] args) {Scanner scanner …

【配色网站分享】

个人比较喜欢收藏一些好看的插画、UI设计图和配色,于是有了此篇,推荐一些配色网站,希望能对自己和大家有些帮助。 1.uiGradients 一个主打渐变风网站,还可以直接复制颜色。 左上角的“show all gradients”可以查看一些预设的渐…

Nginx安装于环境配置

1. Nginx-概述 1.1 介绍 ​ Nginx是一款轻量级的Web服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器。其特点是占有内存少,并发能力强,事实上nginx的并发能力在同类型的网页服务器中表现较好,中国大陆使用ngi…

场景化运营与定制开发链动 2+1 模式 S2B2C 商城小程序的融合

摘要:本文深入探讨了场景化运营的重要性以及其在商业领域的广泛应用。通过分析电梯广告、视频网站和电商产品的场景化运营方式,引入关键词“定制开发链动 21 模式 S2B2C 商城小程序”,阐述了如何将场景化运营理念融入到该小程序的开发与推广中…

Cyber RT 之 Timer Component 实践(apollo 9.0)

实验内容 Component 是 Cyber RT 提供的用来构建功能模块的基础类,Component 有两种类型,分别为 Component 和 TimerComponent。 相较于 Component,TimerComponent 不提供消息融合,也不由消息触发运行,而是由系统定时…