题名行人再识别的特征表达研究
作者杨文杰
答辩日期2021-05-27
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师黄凯奇
关键词行人再识别 表达学习 行人遮挡 行人检测
学位名称工学博士
学位专业模式识别与智能系统
英文摘要

行人再识别旨在关联不同监控摄像头下具有相同身份的行人。伴随着监控 网络的不断扩大而产生的海量视频数据迫切需要智能视频监控来高效地处理与 分析。作为智能视频监控的关键技术之一,行人再识别在目标跟踪、行人检索、 身份验证中发挥着重要的作用。经过十几年的发展,行人再识别方法在速度、精 度和泛化性上都取得了很大的提升。然而,大类内差小类间差依然是行人再识别 特征表达学习面临的主要挑战之一。首先,由于人体姿态和摄像头视角的变化, 同一行人在不同摄像头下呈现的表观差异很大,并且大规模数据中不同行人的 表观可以很相似;其次,运动的行人对应复杂多变的背景,我们通过实验分析观 察到,背景信息干扰了行人的特征表达,体现在以深度学习为代表的方法容易检 索到与感兴趣目标位于相似背景中的假阳性行人;最后,不精确的检测框和背景 的遮挡导致行人仅部分可见,这是实际应用中常见的导致类内差变大、类间差变 小的挑战。针对以上问题,本文分别从行人局部特征学习、抑制背景、人体或部 件可见度等方面出发,提出了一系列方法。本文所展开的研究工作可归纳如下: (1) 基于类别激活图的多样化局部特征学习。 一方面,行人的表观在不同的 人体姿态和摄像头视角下差异很大,而局部特征对人体姿态、光照条件等的变化 具有较好的鲁棒性;另一方面,全局特征的表达能力不足。为了区分具有较小差 异的行人,本文提出多样化的局部特征学习。已有的局部特征学习研究可以分为 基于注意力机制的隐式局部特征和基于部件定位模型的部件特征,区别于已有 的局部特征学习研究,本方法不需要基于注意力机制引入的参数也不需要引入 额外的部件定位模型,而利用类别激活图来定位人体局部,并提出重叠激活惩罚 引导多分支的模型学习多样化的局部特征。该方法为学习行人局部特征提供了 一个简洁高性能的模型。 (2) 前景觉知的多尺度特征学习。 运动的行人对应多变的背景,本文的分析 发现,背景对行人再识别的特征表达学习造成了干扰,体现在相似的背景会在特 征空间拉近不同身份的行人而不同的背景增大了行人类内差异。此外,融合不同 语义层级的特征有助于增强特征判别性,如低层语义的颜色、纹理,高层语义的 性别、服装类型。为此,本方法一方面提出了显式地学习前景概率图用于抑制背 I行人再识别的特征表达研究 景信息,也即非行人的图像区域。另一方面提出了自底向上的网络结构用于融合 多尺度的不同语义特征,从而提升特征的判别性。定性和定量的实验均证明了模 型在抑制背景干扰方面的有效性。 (3) 基于人体可见度的自适应标签平滑。 实际应用中,因检测器非精确检测 或行人部分身体走出摄像机视野,导致行人部件缺失。而部件缺失的行人和完整 可见的行人往往具有相同的 one-hot 类别标签,也就引导模型对部件缺失行人做 出过度自信的类别预测,这使得模型容易拟合于身体局部。我们利用端到端行人 再识别数据集中的行人边界框标注,得到标注框和检测框之间的交并比作为行 人人体可见度的度量,用该度量对类别标签进行平滑。大量实验表明该方法显著 提升了行人再识别模型的性能。 (4) 部件可见度觉知的特征学习。 未考虑行人部件可见度的行人再识别模型 无法精确地提取可见部件进行特征学习和匹配,从而难以泛化到人体部件缺失 的场景,如遮挡。已有方法引入额外人体语义模型直接预测可见度,或者生成人 体语义部件伪标签作为行人再识别模型中部件定位器的监督。我们提出不依赖 于额外人体语义模型的方法学习觉知人体部件的可见度。定性的实验表明该方 法可以觉知人体头部、上半身和下半身等部件。定量的实验证明了该方法在全身 可见和遮挡场景下的有效性。

语种中文
页码138
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/44904]  
专题智能系统与工程
推荐引用方式
GB/T 7714
杨文杰. 行人再识别的特征表达研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace