2019 CVPR之ReID:Hi-CMD: Hierarchical Cross-Modality Disentanglement for Visible-Infrared Person Re-Id

Jelena ·
更新时间:2024-09-20
· 727 次阅读

Hi-CMD: Hierarchical Cross-Modality Disentanglement for Visible-Infrared Person Re-Identification
当前的问题及概述
为了减少模内和模间的差异,我们提出了一种分层模间解调(Hi-CMD)方法,本文提出的方法有效的将ID-discriminative特征和ID- excluded特征分离出来,进而进行分别学习。
在这里插入图片描述
ID-discriminative(包含ID特征):性别、穿着(编码器EP),浅层信息,输出张量
ID- excluded(不含ID特征):姿态、光照(编码器Ea),深层信息,输出向量
模型及loss
在这里插入图片描述
本文提出的Hi-CMD框架由两部分组成:身份保持人物图像生成(ID-PIG)网络和层次特征学习(HFL)模块,我们的目标是从交叉模态图像中分离出ID-discriminative和ID- excluded。
2.1Identity Preserving Person Image Generation
2.1.1Hierarchical representation(层级表示)
首先将RGB和红外图像分别输入,EP1和EP2分别提取RGB和红外图像的ID-discriminative信息P1、P2,Ea1和Ea2分别提取RGB和红外图像的ID-discriminative和ID- excluded信息,其中as1表示包含ID-discriminative的全局信息,ac1表示光照信息,ac2表示姿态信息,其中ac和ap统称为ID- excluded信息,即aex。
2.1.2Disentangling ID-excluded factors
在这里插入图片描述
以RGB输入图为例,首先通过same-reconstruction loss将rgb图通过前面提取好的p1、as1、aex1信息生成原图,该部分是对生成器G的一种训练,然后通过cross-reconstruction loss,将rgb图通过自身的姿态和光照信息aex1及红外图像的性别、穿着信息p2及as2生成转换姿态性别的rgb图像,同时通过code reconstruction loss,讲逆生成器中学习的aex1^信息尽可能和aex1距离越短越好,最后通过cycle loss将生成的图片经过一个逆生成器可以生成原输入图,具体loss如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
同时将RGB和红外图像的ID- excluded经过一个KL散度,使两个信息其更接近高斯分布:
在这里插入图片描述
之后,对生成的图像及原图,输入到判别器D,D中loss为GAN loss:
在这里插入图片描述
2.2Hierarchical Feature Learning
这一模块是将asi和pdi级联后进行相似学习和分类任务,其中loss选用triplet loss和CE loss:
在这里插入图片描述
在这里插入图片描述
2.3overall:
端对端学习总loss:
在这里插入图片描述
实验
数据集:SYSU-MM01和RegDB

消融实验:
在这里插入图片描述
在这里插入图片描述
与其他方法比较:
在这里插入图片描述


作者:matlabLKL



visible cvpr CROSS for

需要 登录 后方可回复, 如果你还没有账号请 注册新账号
相关文章