行人再识别的特征表达研究

题名	行人再识别的特征表达研究
作者	杨文杰
答辩日期	2021-05-27
文献子类	博士
授予单位	中国科学院自动化研究所
授予地点	中国科学院自动化研究所
导师	黄凯奇
关键词	行人再识别表达学习行人遮挡行人检测
学位名称	工学博士
学位专业	模式识别与智能系统
英文摘要	行人再识别旨在关联不同监控摄像头下具有相同身份的行人。伴随着监控网络的不断扩大而产生的海量视频数据迫切需要智能视频监控来高效地处理与分析。作为智能视频监控的关键技术之一，行人再识别在目标跟踪、行人检索、身份验证中发挥着重要的作用。经过十几年的发展，行人再识别方法在速度、精度和泛化性上都取得了很大的提升。然而，大类内差小类间差依然是行人再识别特征表达学习面临的主要挑战之一。首先，由于人体姿态和摄像头视角的变化，同一行人在不同摄像头下呈现的表观差异很大，并且大规模数据中不同行人的表观可以很相似；其次，运动的行人对应复杂多变的背景，我们通过实验分析观察到，背景信息干扰了行人的特征表达，体现在以深度学习为代表的方法容易检索到与感兴趣目标位于相似背景中的假阳性行人；最后，不精确的检测框和背景的遮挡导致行人仅部分可见，这是实际应用中常见的导致类内差变大、类间差变小的挑战。针对以上问题，本文分别从行人局部特征学习、抑制背景、人体或部件可见度等方面出发，提出了一系列方法。本文所展开的研究工作可归纳如下：（1）基于类别激活图的多样化局部特征学习。一方面，行人的表观在不同的人体姿态和摄像头视角下差异很大，而局部特征对人体姿态、光照条件等的变化具有较好的鲁棒性；另一方面，全局特征的表达能力不足。为了区分具有较小差异的行人，本文提出多样化的局部特征学习。已有的局部特征学习研究可以分为基于注意力机制的隐式局部特征和基于部件定位模型的部件特征，区别于已有的局部特征学习研究，本方法不需要基于注意力机制引入的参数也不需要引入额外的部件定位模型，而利用类别激活图来定位人体局部，并提出重叠激活惩罚引导多分支的模型学习多样化的局部特征。该方法为学习行人局部特征提供了一个简洁高性能的模型。（2）前景觉知的多尺度特征学习。运动的行人对应多变的背景，本文的分析发现，背景对行人再识别的特征表达学习造成了干扰，体现在相似的背景会在特征空间拉近不同身份的行人而不同的背景增大了行人类内差异。此外，融合不同语义层级的特征有助于增强特征判别性，如低层语义的颜色、纹理，高层语义的性别、服装类型。为此，本方法一方面提出了显式地学习前景概率图用于抑制背 I行人再识别的特征表达研究景信息，也即非行人的图像区域。另一方面提出了自底向上的网络结构用于融合多尺度的不同语义特征，从而提升特征的判别性。定性和定量的实验均证明了模型在抑制背景干扰方面的有效性。 (3) 基于人体可见度的自适应标签平滑。实际应用中，因检测器非精确检测或行人部分身体走出摄像机视野，导致行人部件缺失。而部件缺失的行人和完整可见的行人往往具有相同的 one-hot 类别标签，也就引导模型对部件缺失行人做出过度自信的类别预测，这使得模型容易拟合于身体局部。我们利用端到端行人再识别数据集中的行人边界框标注，得到标注框和检测框之间的交并比作为行人人体可见度的度量，用该度量对类别标签进行平滑。大量实验表明该方法显著提升了行人再识别模型的性能。 (4) 部件可见度觉知的特征学习。未考虑行人部件可见度的行人再识别模型无法精确地提取可见部件进行特征学习和匹配，从而难以泛化到人体部件缺失的场景，如遮挡。已有方法引入额外人体语义模型直接预测可见度，或者生成人体语义部件伪标签作为行人再识别模型中部件定位器的监督。我们提出不依赖于额外人体语义模型的方法学习觉知人体部件的可见度。定性的实验表明该方法可以觉知人体头部、上半身和下半身等部件。定量的实验证明了该方法在全身可见和遮挡场景下的有效性。
语种	中文
页码	138
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/44904]
专题	智能系统与工程
推荐引用方式 GB/T 7714	杨文杰. 行人再识别的特征表达研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2021.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们