(done) 关于 pytorch 代码里常出现的 batch

(done) 关于 pytorch 代码里常出现的 batch_first 到底是啥？

参考文章：https://pytorch.org/docs/stable/generated/torch.nn.utils.rnn.pad_sequence.html

首先看参考文章里的解释，如下图
在这里插入图片描述

从文章描述来看，当 batch_first = True 时，输出的张量的 size 是 B x T x *。当 batch_first = False 时，输出的张量的 size 是 T x B x *

一个例子如下代码：

seqs = [torch.tensor([1,2,3]), torch.tensor([3,4])] # Sequences
seq_lens = torch.tensor([3,2]) # Actual lengths of sequences# First, pad the sequences to the same length
# 在处理序列数据时，由于序列的长度可能不一致，为了能够将它们组织成一个张量以便进行批处理，
# 通常需要对这些序列进行填充，使它们的长度保持一致。pad_sequence 函数的作用就是对一批序列进行填充，
# 使得它们的长度都与最长序列的长度相同。
padded_seqs = nn.utils.rnn.pad_sequence(seqs, batch_first=True)
print(padded_seqs)
print(padded_seqs.size())
padded_seqs = nn.utils.rnn.pad_sequence(seqs, batch_first=False)
print(padded_seqs)
print(padded_seqs.size())

输出日志如下：

tensor([[1, 2, 3],[3, 4, 0]])
torch.Size([2, 3])
tensor([[1, 3],[2, 4],[3, 0]])
torch.Size([3, 2])

正好映证了文章里的解释

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/327526.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

(done) 关于 pytorch 代码里常出现的 batch_first 到底是啥？

相关文章

618速递丨各平台内卷严重，这些行业能否率先炸场？

[BJDCTF 2020]easy_md5、[HNCTF 2022 Week1]Interesting_include、[GDOUCTF 2023]泄露的伪装

【多模态】30、Monkey | 支持大尺寸图像输入的多任务多模态大模型

【JS面试题】this

MacApp自动化测试之Automator初体验

【C/C++笔试练习】DNS劫持、三次握手、TCP协议、HTTPS、四次挥手、HTTP报文、拥塞窗口、POP3协议、UDP协议、收件人列表、养兔子

JVM面试题：85道JVM虚拟机面试题及答案

【AI学习】聊两句昨夜OpenAI的GPT-4o

C++数据结构——红黑树

一个不知名的开源项目可以带来多少收入

Kafka学习-Java使用Kafka

【C语言】/操作符(下)/

【Spring】初识 Spring AOP（面向切面编程）

[动画详解]LeetCode151.翻转字符串里的单词

十二生肖Midjourney绘画大挑战：释放你的创意火花

Python进行excel处理-01

vscode 通过ssh 远程执行ipynb +可以切换conda env

计算机vcruntime140.dll找不到如何修复，分享5种靠谱的修复教程

（四十二）第 6 章树和二叉树（树的二叉链表(孩子－兄弟)存储）

15-ps命令