医学影像数据的弱监督机器学习算法研究

题名	医学影像数据的弱监督机器学习算法研究
作者	杨萌林
答辩日期	2019-05-24
文献子类	硕士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	张文生
关键词	医学影像弱监督学习胸部疾病诊断分类激活图分类算法
学位名称	工学硕士
学位专业	模式识别与智能系统
英文摘要	弱监督学习是一种高成本效益的机器学习算法，如采用粗粒度的图像类别标签实现目标识别和定位的细粒度任务。尽管在深度神经网络的助力之下，（全）监督学习在计算机视觉的各项任务上得到了突破性的进展，如在图像的识别和理解、目标的检测和定位等深度学习已经达到了或者接近了人的识别水平，但是对于医学影像的处理（如CT，X-ray，MRI等）仍然处于初级阶段。在临床中要实现计算机辅助诊断，与一般的计算机视觉任务不同，我们希望计算机不仅能够对影像中的疾病进行准确的判断，更重要的是给出相应的诊断依据，对诊断过程进行解释。而如果采用全监督学习，就需要对病理区域进行大量的标注。详细的标注信息耗时耗力，更重要的是需要一定水平的专家知识，这是非常难实现的。因此，为了实现诊断的可解释性采用大量细粒度的标注显得很不现实。而医学影像的类别标签却可以很容易获得，甚至可以通过自然语言处理（Natural Language Processing，NLP）的技术处理诊断报告就可以自动获取疾病的标签。基于此，本文从医学影像诊断的现状和需求出发，研究了医学影像上的弱监督学习，旨在（1）从大量的影像数据中自动识别疾病的类别；（2）通过挖掘病变区域潜在的监督信息来对病变区域进行定位，从而给临床医生提供一些意见和参考。本文对疾病的识别通过图像分类算法实现，对病变区域的定位通过分类激活图来实现。图像分类是通过提取和学习图像中与类别相关的判别信息，对每一种类别输出一定概率的一种算法；分类激活图是在该分类过程中得到的一种具有高层语义信息的特征图。但是在只有类别标签的情况下，分类算法学习到的特征一般具有整体的语义，而得到的分类激活图通常是稀疏的、不连续的、不完整的。因此，本文在医学影像的背景下，主要研究了如何通过弱监督的方式实现疾病的分类，同时挖掘潜在的局部位置信息从而得到较为完整的分类激活图以及如何利用分类激活图对弱监督算法进一步的提升。本论文的主要工作和贡献如下： (1) 提出了一种多尺度扩张卷积的深度神经网络(Multiple Dilated Convolution Neural Network，MDCNN)。针对胸部光片中疾病的并发，形状不一，位置不定等问题，MDCNN通过引入多尺度扩张卷积模块（Multi-scale Dilated Convolution，MDC）从不同的尺度去发现更多与疾病相关的区域，防止模型陷入到某一局部极值点，从而获取更多有用的信息实现疾病的定位；该多尺度特征的学习是在分类激活图层面上进行的，在以往的研究中，分类激活图一般是采用全局平均池化（Global Average Pooling， GAP）的池化方式来获得并且需要从网络中提取或者计算出相应的权重间接得到分类激活图，本文跳过该步骤提出了一种能够直接并且可以嵌入到网络的获取方法，进一步实验说明了在其他池化方法的有效性以及理论证明了与原来方法的等价性。本文结合MDC和全局最大池化的方法（GlobalMax Pooling, GMP）设计了端到端的MDCNN，在11万张大型的胸部光片数据集（ChestX-ray14）上进行了大量的实验，通过与多种相关的模型对比，发现提出的模型在胸部疾病诊断上的分类和定位相对于之前的模型有较大的提升。相对于同一类型的基准模型ResNet提升了7.53%到达了0.8204的AUC值，在定位的准确率上也有较大的提升。 (2)提出了一种非局部空间注意机制的残差网络(ResNet-SNA)。针对病变区域和非病变区域的差异性，即两者内部相似度较大，两者之间相似度较小，该网络从非局部特征学习入手，通过构建图模型结构，来计算特征图上像素点之间的相似度，从而挖掘潜在的病理判别区域。ResNet-SNA进一步提升了分类的AUC值，并且在定位上有较大的提升。提出的模型在同样在ChestX-ray14上进行了验证，分类的AUC值达到了0.8247。 (3) 提出了一种结构化分类激活图（CAM based on Structure，Struct-CAM）增强的弱监督学习模型ResNet-CE。在以上两个工作研究的基础上，进一步从利用分类激活图增强分类的角度考虑进行弱监督学习。在只有图像疾病的标签下，通过增强模型的分类性能并利用多尺度的卷积核强制挖掘较多的判别区域，以及通过设计的空间池化方式（Spatial wise pooling, SWP）进行一定的约束，在获得较好的分类效果条件下来得到较好的定位效果。ResNet-CE在胸部光片诊断和自然图片Cifar10、Cifar100以及STL10上进行了实验和验证。相对于之前提出两种方法，在分类和定位上有了进一步去的提升，分类的AUC值达到0.8251。在自然图片中，ResNet-CE和目前主流的模型如VGG、ResNet等进行了比较，有了较为明显的提升。
语种	中文
学科主题	计算机科学技术 ; 人工智能 ; 模式识别
页码	97
资助项目	National Natural Science Foundation of China[U1636220]
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/23933]
专题	中国科学院自动化研究所精密感知与控制研究中心_人工智能与机器学习
推荐引用方式 GB/T 7714	杨萌林. 医学影像数据的弱监督机器学习算法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2019.