病毒自动化分析与鉴定流程
本帖最后由 Jianbo 于 2017-3-4 10:53 编辑世界上分布着种类繁多的病毒,然而其中仅仅约有300种病毒被人们定义为病原体。技术的发展让更多的病毒被发现和鉴定。病毒的鉴定不仅对病毒学有着重要的意义,同时也与公共卫生、传染病等国计民生息息相关。21世纪以来,接连爆发的公共卫生危机都是由病毒引起的,如2003年爆发的非典型肺炎(SARS),2009年流感大流行(H1N1),近期的禽流感(H7N9)与西非埃博拉病毒。传统应用于病毒检测的方法,包括培养、血清学实验以及核酸检测等,存在着检测范围上限问题与需要病毒的先验知识等问题。因此快速全面地对新兴病毒的鉴定不仅减少病毒传播的风险,同时可以为患者提供快速有效的治疗方式。
随着高通量测序的成本不断下降,通过宏基因组的方式完成病毒鉴定已经在越来越多的实验室与医院进行采用。然而要在海量的测序数据快速准确完成痕量的病毒序列的检测仍然是当前的瓶颈。已有的研究开发出不同的分析流程,首先通过去除与宿主相关的读长(reads),然后与参考数据库进行比对。虽然部分软件利用更快的软件,如bowtie1与bowtie2完成去除宿主序列,然而分析流程主要还是依赖BLAST(Basic Local Alignment Search Tool)进行比对分析。然而即便在高性能计算机上运行这些软件,分析的时间需要几天甚至几周。
在本研究中,研究人员研发出快速灵敏的高通量测序宏基因组完成病毒鉴定与发现的自动化软件VIP (Virus Identification Pipeline)。首先快速去除与宿主相关的读长,不仅在核酸层面完成数据库检索,同时在蛋白层面上进行分析,这样保证了高变的病毒毒株也能完成鉴定。值得一提的是,本研究开发出一种宏基因组的组装方法,不仅大大提高了组装结果(N50)。
研究人员成功使用高通量测序与VIP应对了2014年广州登革热疫情,并于2015年在36小时内解析出中国首例中东呼吸道冠状病毒(MERS)全基因组,第一时间内保证了公共卫生的安全。VIP也被影响因子8.314的杂志《Current Opinion in Biotechnology》引用评论为“病毒学领域高分辨率的分析工具首次被开发完成”。
李洋为该论文的第一作者,马学军研究员为通讯作者。该工作得到了国家传染病重大专项与北京科学技术委员项目支持。
原文链接:http://www.nature.com/articles/srep23774VIP: an integrated pipeline for metagenomics of virus identification and discovery
AbstractIdentification and discovery of viruses using next-generation sequencing technology is a fast-developing area with potential wide application in clinical diagnostics, public health monitoring and novel virus discovery. However, tremendous sequence data from NGS study has posed great challenge both in accuracy and velocity for application of NGS study. Here we describe VIP (“Virus Identification Pipeline”), a one-touch computational pipeline for virus identification and discovery from metagenomic NGS data. VIP performs the following steps to achieve its goal: (i) map and filter out background-related reads, (ii) extensive classification of reads on the basis of nucleotide and remote amino acid homology, (iii) multiple k-mer based de novo assembly and phylogenetic analysis to provide evolutionary insight. We validated the feasibility and veracity of this pipeline with sequencing results of various types of clinical samples and public datasets. VIP has also contributed to timely virus diagnosis (~10 min) in acutely ill patients, demonstrating its potential in the performance of unbiased NGS-based clinical studies with demand of short turnaround time. VIP is released under GPLv3 and is available for free download at: https://github.com/keylabivdc/VIP.
(作者:Young)
页:
[1]