pytorch加载预训练模型与自己模型不匹配的解决方案

Lani ·

更新时间:2024-11-13

· 531 次阅读

pytorch中如果自己搭建网络并且加载别人的与训练模型的话，如果模型和参数不严格匹配，就可能会出问题，接下来记录一下我的解决方法。

两个有序字典找不同

模型的参数和pth文件的参数都是有序字典(OrderedDict)，把字典中的键转为列表就可以在for循环里迭代找不同了。


model = ResNet18(1)
model_dict1 = torch.load('resnet18.pth')
model_dict2 = model.state_dict()
model_list1 = list(model_dict1.keys())
model_list2 = list(model_dict2.keys())
len1 = len(model_list1)
len2 = len(model_list2)
minlen = min(len1, len2)
for n in range(minlen):
    if model_dict1[model_list1[n]].shape != model_dict2[model_list2[n]].shape:
        err = 1

自己搭建模型的注意事项

搭网络时要对照pth文件的字典顺序搭，字典顺序、权重尺寸(shape)和变量命名必须与pth文件完全一致。如果仅仅是变量命名不同，可采用类似的方法对模型的权重重新赋值。


model = ResNet18(1)
model_dict1 = torch.load('resnet18.pth')
model_dict2 = model.state_dict()
model_list1 = list(model_dict1.keys())
model_list2 = list(model_dict2.keys())
len1 = len(model_list1)
len2 = len(model_list2)
minlen = min(len1, len2)
for n in range(minlen):
    if model_dict1[model_list1[n]].shape != model_dict2[model_list2[n]].shape:
        continue
    model_dict1[model_list1[n]] = model_dict2[model_list2[n]]
model.load_state_dict(model_dict2)

完整的代码见自己搭建resnet18网络并加载torchvision自带权重

新增的改进代码


model_dict1 = torch.load('yolov5.pth')
model_dict2 = model.state_dict()
model_list1 = list(model_dict1.keys())
model_list2 = list(model_dict2.keys())
len1 = len(model_list1)
len2 = len(model_list2)
m, n = 0, 0
while True:
    if m >= len1 or n >= len2:
        break
    layername1, layername2 = model_list1[m], model_list2[n]
    w1, w2 = model_dict1[layername1], model_dict2[layername2]
    if w1.shape != w2.shape:
        continue
    model_dict2[layername2] = model_dict1[layername1]
    m += 1
    n += 1
model.load_state_dict(model_dict2)

如果因为模型不匹配，运行第14行语句后，可看自己情况手动对m或n加上1。

补充：pytorch的一些坑：用预训练的vgg模型的部分层的特征报错，如张量不匹配

看代码吧~


#打算取VGG19的第二个全连接层的输出，那么就需要构建一个类，这个类要包含VGG的全部卷积层，
#以及到第二个全连接层的全部网络还有他们对应的参数
class Classification_att(nn.Module):
    def __init__(self, rgb_range):
        super(Classification_att, self).__init__()
        self.vgg19 =models.vgg19(pretrained=True)
        vgg = models.vgg19(pretrained=True).features
        conv_modules = [m for m in vgg]
        self.vgg_conv = nn.Sequential(*conv_modules[:37])
        classfi = models.vgg19(pretrained=True).classifier
        classif_modules = [n for n in classfi]
        self.vgg_class = nn.Sequential(*classif_modules[:4])
        vgg_mean = (0.485, 0.456, 0.406)
        vgg_std = (0.229 * rgb_range, 0.224 * rgb_range, 0.225 * rgb_range)
        self.sub_mean = common.MeanShift(rgb_range, vgg_mean, vgg_std)
        for p in self.vgg_conv.parameters():
            p.requires_grad = False
        for p in self.vgg_class.parameters():
            p.requires_grad = False
        self.classifi = nn.Sequential(
            nn.Linear(4096, 1024),
            nn.ReLU(True),
            nn.Linear(1024, 256),
            nn.ReLU(True),
            nn.Linear(256, 64),
        )
    def forward(self, x):
        x = F.interpolate(x, size=[224, 224], scale_factor=None, mode='bilinear', 
        align_corners=False)
        x = self.sub_mean(x)
        x = self.vgg_conv(x)  
        x = self.vgg_class(x)  #执行这部报错，说张量不匹配

原因是因为卷积层的输出不能直接连接全连接层，即使输出的张量的总的大小是一致的

查看vgg的pytorch源码发现是


x = self.features(x)
x = self.avgpool(x)
x = torch.flatten(x, 1)
x = self.classifier(x)
#自己的代码没有torch.flatten(x, 1)这步

所以自己的少了一步


x = torch.flatten(x, 1)

补上就好了！

以上为个人经验，希望能给大家一个参考，也希望大家多多支持软件开发网。

pytorch 训练模型解决方案预训练模型训练模型

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Linux 安装

Tricia 2020-10-13

661

Go语言中结构体方法副本传参与指针传参的区别介绍

Rebecca 2021-05-19

817

laravel unique验证、确认密码confirmed验证以及密码修改验证的方法

Manda 2020-08-09

879

利用kernel提供的接口打印进程号(pid)

Cynthia 2020-09-01

568

ASP生成静态htm页面基本代码

Mathea 2020-10-15

981

asp下用ADODB.Stream代替FSO读取文本文件

Madeleine 2020-08-15

975

DenseNet121模型实现26个英文字母识别任务

Pandora 2023-07-01

1833

SQLServer通过端口1433连接到主机localhost的TCP/IP连接失败常见问题的解决方案

Damara 2023-07-20

544

windows上的mysql服务突然消失提示10061Unkonwnerror问题及解决方案

Kirima 2023-07-20

1650

Redis集群Lettuce主从切换问题解决方案

Abbie 2023-07-20

1406

Python ModuleNotFoundError: No module named ‘xxx‘可能的解决方案大全

Gabriela 2023-07-20

641

Pytorch基础教程之torchserve模型部署解析

Xylona 2023-07-20

1007

PyTorch模型创建与nn.Module构建

Radinka 2023-07-20

293

PyTorch模型容器与AlexNet构建示例详解

Dorothy 2023-07-20

1029

linux环境部署清华大学大模型最新版chatglm2-6b图文教程

Carly 2023-07-20

547

大语言模型的开发利器langchainan安装使用快速入门学习

Irma 2023-07-20

829

langchainPrompt大语言模型使用技巧详解

Posy 2023-07-20

618

vue3 Error:Unknown variable dynamic import: ../views/的解决方案

Xenia 2023-07-20

1653

uni-app的iPhonex底部安全区域解决方案

Jacuqeline 2023-07-20

101

VSCode安装go相关插件失败的简单解决方案

Oria 2023-07-21

1588

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座