题名基于骨骼点序列的人体行为识别研究
作者史磊
答辩日期2021-05-30
文献子类博士
授予单位中国科学院自动化研究所
授予地点中国科学院自动化研究所
导师卢汉清
关键词行为识别 关系建模 多模态融合 图卷积神经网络 自注意力机制
学位专业模式识别与智能系统
英文摘要

人体行为识别是计算机视觉的一个重要分支,在无人驾驶、人机交互和智能监控等领域都得到了广泛的应用。行为识别的研究内容是利用机器学习等方法使得计算机可以自动分析和理解图像或者视频中人体的行为和动作,从而辅助做出进一步的决策。

    传统的行为识别方法主要以RGB图像序列作为输入。然而,RGB图像无差别地记录了整个时空场景的信息,使得模型容易受到行为无关的背景信息的干扰。最近,随着姿态估计算法以及深度传感器的逐渐成熟,基于骨骼点序列的行为识别方法逐渐兴起。相比于RGB图像序列,骨骼点序列仅包含人体各个关节点在一段时间内的运动轨迹,可以有效地过滤样本中行为无关的背景信息,从而提高模型的精度和鲁棒性。

    目前,基于骨骼点序列的行为识别方法仍面临许多挑战,包括如何进行关节点间的时空关系建模,如何利用不同模态的信息对人体行为进行分析,以及如何提高模型速度使其更好地部署于实际应用场景。本文针对以上挑战进行了深入研究,研究内容和创新点可以归纳为以下三个方面:

  1. 关系建模方法的优化。骨骼点序列分析的核心在于建模人体关节点间的时空关系,从而得到人体各部位的运动模式,并进一步识别人体的行为类别。近年来,使用图卷积神经网络进行关系建模的方法展现出良好的性能。但是,已有的基于图卷积网络的方法仅根据人体的物理结构来设计图的结构,而这种图结构对于行为识别任务并不是最优的。并且,单一的图结构无法适应样本的多样性,极大限制了模型的关系建模能力。针对这个问题,本文提出一种自适应的图卷积神经网络。该网络的图结构可以根据分类任务以及样本特征进行自适应更新,从而收敛到一个最优的图结构。此外,本文引入自注意力机制来进行关节点间的关系建模,并提出了一种仅包含自注意力模块的神经网络,有效提升了行为识别的精度。针对骨骼点序列的特殊性,本文在该网络的基础上进一步提出了全局关系正则模块、时空解耦的跨帧自注意力模块和多尺度时间窗模块,使得网络更适合于骨骼点序列的建模。

  2. 多模态特征的提取和融合。骨骼点序列仅记录了人体关节点在一段时间内的位置信息,虽然语义性高,但数据量较少。如何从少量的高语义性数据中提取丰富的特征并加以利用,是提升识别精度的关键。基于此,本文从以下三个多模态融合的角度进行了深入探究。首先,人体的肢体信息相比于关节点信息更加直观,但在之前的工作中没有被有效的利用。本文提出从原始数据中提取人体的肢体特征,并设计了一种有向图神经网络将肢体特征与关节点特征进行融合。该网络可以自底向上地在两种特征间进行信息传递,从而更好地捕捉两种特征间的相关关系。其次,已有的工作大多基于语义视角对骨骼点序列进行建模,即基于关节点的语义类别来组织网络计算流。本文提出一种新颖的空间视角,基于关节点间的空间位置关系来挖掘局部区域的特征。由于骨骼点在空间视角下存在分布稀疏的问题,本文设计了一种四维稀疏卷积神经网络来提高模型的计算效率。基于两种视角的方法具有较强的互补性,通过融合可以进一步提升模型的识别精度。此外,由于骨骼点序列缺乏表观信息,许多行为仅使用骨骼点序列难以区分。针对这个问题,本文提出使用RGB数据来为骨骼点序列提供表观信息,并设计了一种关节点指导的图卷积神经网络和一种中继稠密的监督方法,将骨骼点数据和RGB数据统一到一个端到端的框架中进行学习和推断。

  3. 模型加速。实际应用场景中,速度是模型部署的关键因素之一。为了提高骨骼点序列建模的效率,已有方法大多通过减少模型的参数量来提高模型的运行速度。然而,模型的输入数据量也是影响模型运行速度的重要因素。本文从减少模型输入数据量的角度出发,设计了一种自适应的关节点选择模块,使得模型可以根据样本特征进行决策,在保证精度的前提下使用更少的骨骼点数据作为输入,从而提高模型的运行速度。由于决策过程离散不可微,本文使用直通式的Gumbel估计器来反传决策模块的梯度,使得整个模型可以端到端地进行训练和参数更新。

语种中文
页码132
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/44898]  
专题自动化研究所_模式识别国家重点实验室_图像与视频分析团队
推荐引用方式
GB/T 7714
史磊. 基于骨骼点序列的人体行为识别研究[D]. 中国科学院自动化研究所. 中国科学院自动化研究所. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace