CORC  > 自动化研究所  > 中国科学院自动化研究所
题名广域多目标实时探测技术研究
作者龙宪磊
答辩日期2022-11-30
文献子类博士
关键词高速视觉 目标检测 机械粒子滤波 视觉反馈 广域监控
英文摘要

        近年来,随着计算机视觉技术的进步,基于图像的广域多目标探测技术在智能交通、公共安全、体育转播以及军事态势感知等方面取得了巨大成功。然而,传统的探测技术在应对复杂场景、大面积观测视野和动态目标分布等实际工作环境时,在观测视野、搜索效率与检测速度等方面均存在明显不足。在未知广域环境中,如何提升目标搜索与感知能力,并快速准确地获得感兴趣目标的高清图像,值得深入研究。因此,本文针对广域场景多目标探测中的关键问题,从视野快速扩展、广域场景建模和目标快速搜索与感知三个方面逐层递进地展开深入研究。论文的主要研究内容如下:

        (1)针对广域目标难以探测的问题,提出了一种基于机械粒子滤波的广域多目标主动视觉探测方法,实现了广域场景中300 帧/秒的探测速度。在大视野场景下,感兴趣目标的图像分辨率较低且目标分布无规律,使得现有探测方法难以精确探测。为了同时实现大视野覆盖和目标快速探测,本文提出了一种大视野多目标快速探测方法。首先,控制光学扫描振镜配合高速视觉平台实现高速视场切换,获得大视野实时扩展能力。其次,为了提高目标探测效率,提出了基于机械粒子滤波的目标探测框架来构建广域场景中目标的概率分布模型,并迭代定位出感兴趣目标在大视野场景中的位置。此外,为了减少粒子扫描开销,引入了基于中心粒子的扫描路径规划算法,通过将所有粒子按概率和距离划分成多个粒子群来减少路径求解与扫描耗时。最后,多目标探测实验结果表明,该方法能够快速准确地探测广域场景中的感兴趣目标。

        (2)针对广域目标搜索效率低的问题,提出了区域概率图指导的快速广域多目标探测方法,显著提升了高概率区域目标的探测性能。现有的广域探测方法多采用全局建模方式,使得探测初期大量采样子图像包含无效信息,导致探测收敛速度变慢。首先,为提升探测效率,本文提出了区域概率图生成方法。该方法利用语义分割模型对全景图像进行分割,通过联立目标-区域语义关系和分割出的场景结构信息,构建出区域概率测量函数,进而生成区域概率图。随后,提出了区域概率图指导的粒子滤波方法,该方法通过按概率值分配不同比例的粒子到不同区域,使采样初期的粒子能够集中分布在高概率区域。评估与泛化性实验结果表明,所提方法既能够对场景进行有效的概率建模,还具有优异的探测精度和很好的实时性。该方法最大可以提升38.38% 的目标检测效率。

        (3)针对广域目标探测任务中,高速目标检测算法定位精度差的问题,设计了一种多帧信息融合的硬件高速目标检测方法,实现了10,000 帧/秒的高速目标定位。为解决已有的基于HOG 特征的高速硬件目标检测算法因检测窗口步长过大导致定位误差大的问题,提出多帧图像目标信息融合技术。首先,制定了检测区域自适应调整策略,有效减少原始检测窗特征提取的硬件资源消耗。其次,提出基于多帧信息同步的数据融合生成方法,显著降低了多帧信息融合的目标位置误差。最终,基于FPGA 硬件平台实现了本文提出的高速目标检测算法,该系统能够同时获得目标的位置与图像数据。实验结果表明,所设计的方法能够在保持高速目标检测性能的同时有效降低定位误差。

        (4)针对广域目标感知速度慢的问题,构建了一套广域多目标实时探测系统,实现了复杂广域环境下的动态目标高速探测。与仿真和室内场景相比,室外环境存在着复杂的目标运动和场景干扰,为了实现复杂动态场景下多目标的快速探测,首先,控制两轴振镜进行高速二维视野扩展,然后基于大视野广角相机的区域概率指导,引导高速长焦相机进行高效目标探测,实现了广域高速探测系统。为进一步提升系统的实时性,设计了一种基于视觉反馈的高并行度控制策略,通过将所提广域探测算法集成到高并行度、低延迟的控制范式中,实现了探测流程加速。最后,一系列复杂场景实验验证了所构建的广域多目标探测系统的有效性和鲁棒性。

语种中文
页码158
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/50594]  
专题中国科学院自动化研究所
推荐引用方式
GB/T 7714
龙宪磊. 广域多目标实时探测技术研究[D]. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace