题名微生物生态功能基因数据库构建与高通量测序分析方法优化
作者吴悦妮
答辩日期2019-06
文献子类博士
授予单位中国科学院生态环境研究中心
授予地点北京
导师邓晔
关键词微生物功能类群、功能基因数据库、分析平台搭建、引物评价与设计 microbial Functional Groups, Functional Gene Database, Analysis Platform Construction, Primer Assessment And Design
学位名称理学博士
其他题名Database Construction of Environmental Microbiome Functional Group and Sequence Analysis Methods Optimization
学位专业环境科学
英文摘要

     微生物群落的组成及多样性变化与生态系统功能间的相互影响,一直是微生物生态领域的一个核心问题之一。近来随着高通量测序技术的迅速发展,越来越多的环境中微生物群落的组成、结构和功能被逐步揭示,同时也为功能基因的调查分析和传播机制的研究提供了新的技术手段。新的方法产生了大量数据,而对这些数据的解读和分析则需要依据完整、注释准确的数据库来进行。由于很多现有功能基因数据库的完整性与可信度不够,使我们从检测、测序到分析都无法像核糖体RNA(如细菌的16S rRNA 基因)这种微生物标记基因一样得到比较准确的扩增结果和数据分析。也就是说,只有通过对已知功能基因序列构建完整、可信的数据库,才能完成对未知测序基因序列正确的后续分析,包括为宏基因组数据提供注释、关联环境因子、OTU/cluster 划分、进化树构建、引物评价与设计等。
     因此,本论文基于galaxy 框架搭建了分析平台以将功能基因数据库的构建流程化。分析平台提供了一套用于功能基因序列收集的生物信息学系统,可以通种子序列蛋白保守域的比对方法,收集同源蛋白和核酸序列,补充物种信息,构建功能基因数据库。数据库构建完成后,分析平台还可以对序列进行筛选、统计、管理、注释等。同时,由于目前针对功能基因的研究大多基于PCR 的方法进行,而引物设计与评价是关乎实验结果准确性的关键步骤,因此分析平台还可以对引物进行评价,包括自身性质、覆盖度、特异性、扩增产物长度等,还可对引物覆盖类群进行统计。
     基于该分析平台,我们构建完成了抗生素抗性基因数据库SDARG (Sequence Database of Antibiotic Resistance Genes)。SDARG 覆盖448 种抗生素抗性基因,按照抗性类型划分为18 类,对应1,260,069 条蛋白序列和1,164,479 条核酸序列,且序列均具有完整的注释信息、物种信息和可信程度分级。基于该数据库中磺胺类抗生素抗性基因sul1 序列,我们设计了新的简并引物用于环境中sul1 基因的扩增。另外,我们还构建完成了氮循环过程功能基因数据库NcycFunGen。新完成的氮循环功能基因数据库覆盖了固氮、硝化作用、反硝化作用、厌氧氨氧化等氮循环过程的21 个功能基因,共包含序列50 万余条(持续更新中)。
在引物设计的过程中我们发现,现有的引物设计方法都需要基于相似性比对后的核酸序列。然而,序列比对是一项时间复杂度很高且对计算环境要求较高的计算,随着序列越来越多,数据量越来越大,序列比对的计算要求也越来越高。为了节约时间成本,使针对大数据量的序列数据库设计引物成为可能,我们基于k-mer 算法开发了新的引物设计方法。这一方法可以避开序列比对这一耗时过程,
在准确度保证的前提下大大提升了计算速度。为了验证这一方法的可行性,我们利用NcycFunGen 中napA 和narG 高度可信且物种信息完整的序列设计了新的引物。为了验证这一算法对数据量较大的数据库的适用性,我们还收集了17 多万条序列的amoA 数据库进行了引物设计。
     在环境微生物组的研究中,利用核糖体操纵子作为DNA 标记可以揭示不同生态系统中微生物多样性和组成,且这些标记基因的数据库相对较为完整。本文收集了微生物群落中针对细菌、古菌、真菌及真核微生物所常用的标记基因扩增引物,包括16S(细菌和古菌),ITS(真菌)和18S(真核微生物),并用上述分析平台的引物评价工具,基于不同现用数据库对它们进行了生物信息学的评
价,我们的结果也对引物的选择进行了更细致的验证。
     选取16S rRNA V4 区引物515F/806R 和ITS2 引物gITS7/ ITS4R,我们对野生候鸟鸿雁在迁徙越冬前后的肠道菌群组成和多样性变化进行了研究。我们的结果初步揭示了野生鸿雁肠道微生物的群落组成。此外我们的结果还表明,鸿雁肠道微生物群落在长距离迁徙后虽有所变化,但核心物种仍保持不变。此外,栖息地的环境压力可能影响野生动物的肠道微生物群落,也就是说,栖息地的污染可以通过影响肠道菌群进而间接威胁野生动物的生存与健康。

页码108
内容类型学位论文
源URL[http://ir.rcees.ac.cn/handle/311016/43673]  
专题生态环境研究中心_中国科学院环境生物技术重点实验室
通讯作者吴悦妮
推荐引用方式
GB/T 7714
吴悦妮. 微生物生态功能基因数据库构建与高通量测序分析方法优化[D]. 北京. 中国科学院生态环境研究中心. 2019.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace