pytorch 固定部分参数训练的方法

弱柳千条杏一枝,半含春雨半垂丝。风景再美,若没人一起欣赏,也会有种莫名的忧伤。满山满谷乳白色的雾气,那样的深,那样的浓,像流动的浆液,能把人浮起来似的。

需要自己过滤

optimizer.SGD(filter(lambda p: p.requires_grad, model.parameters()), lr=1e-3)

另外,如果是Variable,则可以初始化时指定

j = Variable(torch.randn(5,5), requires_grad=True)

但是如果是

m = nn.Linear(10,10)

是没有requires_grad传入的

m.requires_grad也没有

需要

for i in m.parameters():
  i.requires_grad=False

另外一个小技巧就是在nn.Module里,可以在中间插入这个

for p in self.parameters():
  p.requires_grad=False

这样前面的参数就是False,而后面的不变

class Net(nn.Module):
  def __init__(self):
    super(Net, self).__init__()
    self.conv1 = nn.Conv2d(1, 6, 5)
    self.conv2 = nn.Conv2d(6, 16, 5)

    for p in self.parameters():
      p.requires_grad=False

    self.fc1 = nn.Linear(16 * 5 * 5, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 10)

以上这篇pytorch 固定部分参数训练的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

您可能有感兴趣的文章
pytorch--之halfTensor的使用详解

解决pytorch中的kl divergence计算问题

pytorch交叉熵损失函数的weight参数的使用

pytorch 实现变分自动编码器的操作

PyTorch梯度裁剪避免训练loss nan的操作