Pytorch迁移学习——修改训练好的网络结构及不同层设置不同的学习速率

目录1. 修改最后一层的网络结构2. 不同网络层设置不同的学习速率3. Demo在使用深度学习的时候有时候需要用到迁移学习，但是由于不同的任务最终的输出可能不同因此需要修改最后的网络结构，并且由于最后一层前面的权重是已经训练好的，因此不用再花大量的精力集中在它们上面只需要对最后一层的权重进行重点训练即可。1. 修改最后一层的网络结构以为分类为题为例，如果在Imagenet上...

非典型废言

3917人浏览 · 2019-11-28 14:47:59

非典型废言 · 2019-11-28 14:47:59 发布

1. 修改最后一层的网络结构

2. 不同网络层设置不同的学习速率

3. Demo

在使用深度学习的时候有时候需要用到迁移学习，但是由于不同的任务最终的输出可能不同因此需要修改最后的网络结构，并且由于最后一层前面的权重是已经训练好的，因此不用再花大量的精力集中在它们上面只需要对最后一层的权重进行重点训练即可。

1. 修改最后一层的网络结构

以为分类为题为例，如果在Imagenet上训练，那么其最后一层有1000个结点。但是我们的数据集可能没有那么多种类，因此需要将其修改为合适的数目。可以构造如下的网络来将训练好的网络结构的最后一层替换为我们所需要的。值得注意的是，如果不知道倒数第二层的输出，可以先随便写个数，反正会报错，然后根据错误信息进行相应的修改。

class TransferNet(nn.Module):
    def __init__(self, model, input_dim, output_dim):
        super(TransferNet, self).__init__()
        
        self.pre_layers = nn.Sequential(*list(model.children()))[:-1]
        self.last_layer = nn.Linear(input_dim, output_dim)
    
    def forward(self, x):
        x = self.pre_layers(x)
        x = x.view(x.size(0), -1)
        x = self.last_layer(x)
        return x

2. 不同网络层设置不同的学习速率

由于在迁移学习中，前面的网络层已经得到充分的训练，因此在fine-tune中需要对最后一层进行学习速率进行调整，代码如下：

def set_optimizer(model, lr_base, momentum, w_decay):
    last_params = map(id, model.last_layer.parameters())
    pre_params = filter(lambda addr: id(addr) not in last_params, model.parameters())
    optimizer = torch.optim.SGD([
        {'params': pre_params},
        {'params': model.last_layer.parameters(), 'lr': 0.1}], lr=lr_base, momentum = momentum, weight_decay=w_decay)

    return optimizer

3. Demo

# -*- coding: UTF-8 -*-
"""
@FileName: Demo.py
@Description: Implement Transfer learning
@Author: Lj
@CreateDate: 2019/11/28 14:01
@LastEditTime: 2019/11/28 14:47
@LastEditors: Please set LastEditors
@Version: v1.0
"""

import torch
import torch.nn as nn
from torchvision.models import resnet50

class TransferNet(nn.Module):
    def __init__(self, model, input_dim, output_dim):
        super(TransferNet, self).__init__()

        self.pre_layers = nn.Sequential(*list(model.children()))[:-1]
        self.last_layer = nn.Linear(input_dim, output_dim)

    def forward(self, x):
        x = self.pre_layers(x)
        x = x.view(x.size(0), -1)
        x = self.last_layer(x)
        return x

def set_optimizer(model, lr_base, momentum, w_decay):
    last_params = map(id, model.last_layer.parameters())
    pre_params = filter(lambda addr: id(addr) not in last_params, model.parameters())
    optimizer = torch.optim.SGD([
        {'params': pre_params},
        {'params': model.last_layer.parameters(), 'lr': 0.1}], lr=lr_base, momentum = momentum, weight_decay=w_decay)

    return optimizer


if __name__ == '__main__':
    model = resnet50()
    model = TransferNet(model, 2048, 100)
    x = torch.randn(1,3,224,224)
    print(model(x))

九章云极普惠算力

更多推荐

gh_mirrors/core92/core容器化部署：Kubernetes环境下的最佳实践

🚀 作为一款**生产就绪的AI助手框架**，gh_mirrors/core92/core提供了强大的AI对话能力和插件扩展机制。本文将为您详细介绍如何在Kubernetes环境中实现这一AI框架的高效容器化部署，确保系统稳定性和可扩展性。## 🎯 为什么选择Kubernetes部署AI助手框架在当今AI技术快速发展的时代，**容器化部署**已成为企业级应用的标配。Kubernetes作

九章云极普惠算力

Modern C++ constexpr if：编译时条件实例化的终极指南

现代C++编程中，`constexpr if` 是一个革命性的功能，它允许在编译时根据条件实例化不同的代码路径。这个强大的C++17特性彻底改变了模板编程的方式，让代码更加简洁高效！🚀## 什么是constexpr if？**constexpr if** 是C++17引入的编译时条件语句，它能够在编译期间根据条件选择性地实例化代码块。与传统的`if`语句不同，`constexpr if`

九章云极普惠算力

如何用OSINT工具保护个人安全：网络骚扰与跟踪防护完全指南

在数字时代，个人安全面临着前所未有的挑战。网络骚扰、在线跟踪和信息泄露已成为许多人面临的现实威胁。开源情报（OSINT）不仅是安全专家的工具，更是每个人保护自己免受网络威胁的必备技能。本文将为你详细介绍如何利用OSINT工具和技巧来防范网络骚扰与跟踪，确保你的数字生活安全无忧。😊## 🤔 什么是OSINT及其在个人安全中的作用开源情报（OSINT）是指从公开可获取的来源收集和分析信息的