PyTorch模型参数初始化

什么时候需要参数初始化

在 PyTorch 中，许多模型的参数会自动初始化，例如当你定义 nn.Linear、nn.Conv2d 等模块时，PyTorch 会根据某些默认策略自动初始化权重和偏置。但是在以下情况下，你可能需要显式初始化参数：

1. 自定义层或模型

如果你定义了一个自定义的层或模型，并且参数不是通过现有的 PyTorch 模块创建（如 nn.Linear），则你需要自己初始化这些参数。例如：

import torch
import torch.nn as nnclass MyModel(nn.Module):def __init__(self):super(MyModel, self).__init__()self.weight = nn.Parameter(torch.empty(10, 10))  # 定义参数但未初始化self.bias = nn.Parameter(torch.empty(10))        # 定义参数但未初始化self._initialize_weights()  # 显式初始化def _initialize_weights(self):nn.init.xavier_uniform_(self.weight)  # 使用Xavier初始化nn.init.zeros_(self.bias)             # 使用0初始化偏置def forward(self, x):return torch.matmul(x, self.weight) + self.bias

2. 特定的初始化策略

当你希望使用某种特定的初始化策略，而默认的初始化方式不符合需求时，显式初始化是必须的。PyTorch 提供了多种初始化方法，例如：

nn.init.xavier_uniform_
nn.init.kaiming_uniform_
nn.init.constant_
nn.init.normal_

例如：

import torch.nn.init as initlayer = nn.Linear(100, 200)
init.kaiming_uniform_(layer.weight, nonlinearity='relu')  # 显式使用Kaiming初始化
init.constant_(layer.bias, 0)  # 将偏置显式初始化为0