题名基于深度属性网络嵌入的miRNA-疾病关联关系预测研究
作者姬博亚
答辩日期2021-05-25
授予单位中国科学院大学
授予地点中国科学院新疆理化技术研究所
导师尤著宏
关键词miRNA-疾病关联关系 生物分子关联网络 深度堆叠自动编码机 网络表示 机器学习
学位名称硕士
学位专业计算机技术
英文摘要

MicroRNA(miRNA)是一类单链的,小型的,进化保守的内源性非编码RNA,它通常通过与目标信使RNA(mRNA)进行序列特异性碱基配对来调控基因表达。作为细胞中最重要的成分之一,miRNA在各种生物学过程中起着至关重要的作用,例如细胞发育,细胞增殖分化,细胞凋亡,信号传导,病毒感染等。此外,越来越多的研究已经表明miRNA与多种复杂人类疾病密切相关并且已经成为了一种新兴的癌症生物标志物。因此,预测潜在的miRNA和疾病关联已成为目前许多生物信息学研究项目的关键目标,这将有助于增加预测和分析癌症的辅助手段,有助于人类疾病的预防和治疗,有助于生物分子工具设计和疾病的个性化诊断。传统的生物实验预测方法通常具有较高的预测精度,但其过程复杂、昂贵、耗时高。因此,开发有效的计算模型从而大规模的预测潜在的miRNA和疾病关联关系越来越受到研究人员的关注。本文主要基于深度属性网络嵌入思想提出了3种应用于miRNA-疾病关联关系预测的计算模型:1. 基于三方miRNA-蛋白基因-疾病关联网络及全局结构信息图结点表示学习方法的miRNA-疾病关联关系预测算法:NEMPD。首先,NEMPD利用k-mer方法计算miRNA序列的数值统计概率特征作为miRNA节点本身的属性特征,接着计算疾病之间的语义相似性特征作为疾病节点本身的属性特征;第二,NEMPD利用miRNA,蛋白质和疾病三者之间的已知关联关系构建三方关联网络,并利用基于全局结构信息的图结点表示学习方法(GraRep)分别提取miRNA和疾病节点的网络结构特征。最后,NEMPD将miRNA和疾病节点的属性特征与网络结构特征相结合用来表示已知的miRNA-疾病关联关系对,并导入随机森林分类算法建立预测模型。2. 基于多生物分子关联网络及大规模信息网络嵌入方法的miRNA-疾病关联关系预测算法:MMN-MDA。 首先,MMN-MDA进一步扩展网络,结合lncRNA、药物、蛋白质、疾病和miRNA之间的已知关联关系,构建多生物分子关联网络;第二,MMN-MDA利用大规模信息网络嵌入方法(LINE)分别提取miRNA和疾病节点的多生物分子网络结构特征;第三,MMN-MDA融合多种miRNA和疾病节点本身的属性特征并与多分子网络结构特征相结合,接着利用深度堆叠自动编码机提取节点的高阶复杂特征,降低模型复杂度;最后,MMN-MDA利用随机森林分类器建立训练模型并预测潜在的miRNA-疾病关联。MMN-MDA相比于算法NEMPD,扩展了miRNA和疾病的网络结构信息以及属性信息,改进了网络结构特征的提取方法,增加了基于深度学习的特征降维,降低了模型复杂度,提高了潜在miRNA-疾病关联关系的预测表现。3. 基于深度属性网络嵌入的miRNA-疾病关联关系预测算法:SAE-MDA。首先,SAE-MDA计算miRNA与疾病节点的本身属性特征矩阵(miRNA序列相似性特征和疾病语义相似性特征)以及结构转移概率特征矩阵(miRNA与疾病节点一阶转移概率矩阵);第二,SAE-MDA利用个性化随机游走的方法从不同的邻近度捕获miRNA与疾病节点的属性特征和网络结构特征之间的相互关系;第三,SAE-MDA通过融合捕获的不同邻近度特征矩阵构造miRNA和疾病节点的增强特征矩阵表示,之后构造适合本算法的深度堆叠自动编码神经网络提取增强特征矩阵的高阶非线性复杂特征用于表示miRNA和疾病节点;最后,SAE-MDA利用随机森林分类器构建预测模型。 SAE-MDA算法同时考虑了生物属性网络的多阶网络结构特征,并且进一步改进了前两种算法的属性特征和网络结构特征的结合方式,不仅仅是简单的将两者组合,而是从不同的邻近度捕获两者的相互关系,进一步提高了潜在miRNA-疾病关联关系的预测表现。三种算法在多项参数衡量下均取得了优异的表现。在五折交叉验证下,基于人类miRNA-疾病关联数据库v3.0数据集,NEMPD,MMN-MDA和SAE-MDA算法的平均预测准确率均达到了85%以上,平均ROC曲线下面积(AUC)均达到了0.91以上,均高于大多数最新的先进算法。另外,三种算法的案例研究结果也证明了它们在实际应用中预测潜在miRNA-疾病关联关系的优异表现。

页码84
内容类型学位论文
源URL[http://ir.xjipc.cas.cn/handle/365002/7897]  
专题新疆理化技术研究所_多语种信息技术研究室
推荐引用方式
GB/T 7714
姬博亚. 基于深度属性网络嵌入的miRNA-疾病关联关系预测研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace