pytorch 对特征进行mean_pytorch使用hook打印中间特征图、计算网络算力等

0、参考1、背景在神经网络的反向传播当中个，流程只保存叶子节点的梯度，对于中间变量的梯度没有进行保存。import torchx = torch.tensor([1,2],dtype=torch.float32,requires_grad=True)y = x+2z = torch.mean(torch.pow(y, 2))lr = 1e-3z.backward()x.data -= lr*x.g

weixin_39568232

161人浏览 · 2020-12-19 09:32:11

weixin_39568232 · 2020-12-19 09:32:11 发布

0、参考

1、背景

在神经网络的反向传播当中个，流程只保存叶子节点的梯度，对于中间变量的梯度没有进行保存。

import torch

x = torch.tensor([1,2],dtype=torch.float32,requires_grad=True)

y = x+2

z = torch.mean(torch.pow(y, 2))

lr = 1e-3

z.backward()

x.data -= lr*x.grad.data

print(y.grad)

此时输出就是：None，这个时候hook的作用就派上，hook可以通过自定义一些函数，从而完成中间变量的输出，比如中间特征图、中间层梯度修正等。

在pytorch docs搜索hook，可以发现有四个hook相关的函数，分别为register_hook，register_backward_hook，register_forward_hook，register_forward_pre_hook。其中register_hook属于tensor类，而后面三个属于moudule类。register_hook函数属于torch.tensor类，函数在tensor梯度计算的时候就会执行，这个函数主要处理梯度相关的数据，表现形式$hook(grad) \rightarrow Tensor\ or\ None$.

import torch

x = torch.tensor([1,2],dtype=torch.float32,requires_grad=True)

y = x * 2

y.register_hook(print)

z = torch.mean(y)

z.backward()

tensor([ 0.5000, 0.5000])Register_backward_hook等三个属于torch.nn，属于moudule中的方法。

hook(module, grad_input, grad_output) -> Tensor or None

写个demo，参考:

下面的计算为

import torch

import torch.nn as nn

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

def print_hook(grad):

print ("register hook:", grad)

return grad

class TestNet(nn.Module):

def __init__(self):

super(TestNet, self).__init__()

self.f1 = nn.Linear(4, 1, bias=True)

self.weights_init()

def weights_init(self):

self.f1.weight.data.fill_(4)

self.f1.bias.data.fill_(0.1)

def forward(self, input):

self.input = input

out = input * 0.75

out = self.f1(out)

out = out / 4

return out

def back_hook(self, moudle, grad_input, grad_output):

print ("back hook in:", grad_input)

print ("back hook out:", grad_output)

# 修改梯度

# grad_input = list(grad_input)

# grad_input[0] = grad_input[0] * 100

# print (grad_input)

return tuple(grad_input)

if __name__ == '__main__':

input = torch.tensor([1, 2, 3, 4], dtype=torch.float32, requires_grad=True).to(device)

net = TestNet()

net.to(device)

net.register_backward_hook(net.back_hook)

ret = net(input)

print ("result", ret)

ret.backward()

print('input.grad:', input.grad)

for param in net.parameters():

print('{}:grad->{}'.format(param, param.grad))

输出：

result tensor([7.5250], grad_fn=)

back hook in: (tensor([0.2500]), None)

back hook out: (tensor([1.]),)

input.grad: tensor([0.7500, 0.7500, 0.7500, 0.7500])

Parameter containing:

tensor([[4., 4., 4., 4.]], requires_grad=True):grad->tensor([[0.1875, 0.3750, 0.5625, 0.7500]])

Parameter containing:

tensor([0.1000], requires_grad=True):grad->tensor([0.2500])

输出结果以及梯度都很明显，简单分析一下w权重的梯度，

另外，hook中有个bug，假设我们bug，假设我们注释掉out = out / 4这行，可以发现输出变成back hook in: (tensor([1.]), tensor([1.]))。这种情况就不符合上面我们的梯度计算公式，是因为这个时候：

则此时的偏导只是对

和

进行计算，所以都是1，1。这是pytorch的设计缺陷

register_forward_hook跟Register_backward_hook差不多，就不过多复述。

register_forward_pre_hook，可以发现其输入只有

hook(module, input) -> None

其主要是针对推理时的hook.

2、应用

2.1 特征图打印

直接利用pytorch已有的resnet18进行特征图打印，只打印卷积层的特征图，

import torch

from torchvision.models import resnet18

import torch.nn as nn

from torchvision import transforms

import matplotlib.pyplot as plt

def viz(module, input):

x = input[0][0]

#最多显示4张图

min_num = np.minimum(4, x.size()[0])

for i in range(min_num):

plt.subplot(1, 4, i+1)

plt.imshow(x[i].cpu())

plt.show()

import cv2

import numpy as np

def main():

t = transforms.Compose([transforms.ToPILImage(),

transforms.Resize((224, 224)),

transforms.ToTensor(),

transforms.Normalize(mean=[0.485, 0.456, 0.406],

std=[0.229, 0.224, 0.225])

])

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model = resnet18(pretrained=True).to(device)

for name, m in model.named_modules():

# if not isinstance(m, torch.nn.ModuleList) and \

# not isinstance(m, torch.nn.Sequential) and \

# type(m) in torch.nn.__dict__.values():

# 这里只对卷积层的feature map进行显示

if isinstance(m, torch.nn.Conv2d):

m.register_forward_pre_hook(viz)

img = cv2.imread('./cat.jpeg')

img = t(img).unsqueeze(0).to(device)

with torch.no_grad():

model(img)

if __name__ == '__main__':

main()

直接放几张中间层的图图1 第一层卷积层输入图2 第四层卷积层的输入

2.2 模型大小，算力计算

同样的用法，可以直接参考pytorch-summary这个项目。

九章云极普惠算力

更多推荐

阿里云 Coding Plan Lite 下架，各家算力吃紧，上哪买还能支持GLM-5和5.1的coding plan？_2026-04-15

九章云极普惠算力

看遍了市面上的coding plan，我发现还是这个好用

九章云极普惠算力

Kandinsky-5.0-I2V-Lite-5s惊艳效果展示：赛博朋克街景→霓虹闪烁+雨滴滑落动态视频

本文介绍了如何在星图GPU平台上自动化部署Kandinsky-5.0-I2V-Lite-5s镜像，实现高效图生视频转换。该工具能将静态赛博朋克街景图片快速转换为动态视频，添加霓虹闪烁、雨滴滑落等效果，适用于短视频制作、广告创意等场景，显著提升内容创作效率。

九章云极普惠算力

所有评论(0)

查看更多评论

weixin_39568232

@weixin_39568232

已为社区贡献1条内容

pytorch 对特征进行mean_pytorch使用hook打印中间特征图、计算网络算力等

weixin_39568232

所有评论(0)

温馨提示：您尚未绑定手机号

weixin_39568232