|
中科院学者开辟高质量基因组组装软件
原创BioArt2019-12-01 11:41:04
责编 | 酶美
高质量基因组序列对于研讨一个物种基因组的结构、功用、进化、基因定位和克隆等都相当重要。今朝单份子测序技术的成长,已使得构建高质量基因组草图越来越轻易。但是,这些草图序列仍然存在着由于组装序列碎片化而致使的多种毛病,比如不完整的基因序列、排列到染色体上以后的片断遗漏、排列顺序毛病和偏向毛病等。这些毛病对于操纵这些基因组所做的很多研讨会形成未便或误导。
11月25日,中国科学院遗传与发育生物学研讨所梁承志研讨组开辟的高质量基因组组装软件HERA在Nature Communications在线颁发。论文题目为Assembly of chromosome-scale contigs by efficiently resolving repetitive sequences with long reads。
梁承志组多年来经过连系单份子测序和光学图谱及HiC等技术构建高质量基因组,已完成多个动物基因组的组装。比来在前期工作的根本上开辟了一个操纵单份子测序长片断停止基因组复杂地区组装的新方式HERA。在现有软件组装的根本上,HERA可以大大改良基因组序列的持续性并削减了组装毛病。经过对水稻基因组停止测试发现,HERA将水稻中的绝大部分反复序列包括复杂的长串联反复序列都正确地组装了出来。
在玉米、苦荞和人基因组中与已颁发版本停止对照,玉米的Contig N50从1.3 Mb提升至61.2Mb,人的Contig N50从8.3 MB提升至54.4 MB,苦荞基因组Contig N50到达了27.85 Mb。在玉米B73参考基因组中填补了大量之前没有组装出的序列,校正了多处染色体上序列位置或偏向毛病,并增加了一些之前丧失的多个重要基因。
苦荞中全基因组8条染色体共只由20个Contig组成,其中一条染色体是一个Contig,展现了操纵现有常规技术条件构建几近完整的基因组的潜力。HERA跟已有基因组组装软件CANU等很是互补,预期两者的整合将会发生新的软件,大猛进步基因组组装的效力。HERA的一个重要的利用将是用来在已有基因组中填补缺失序列和改正组装毛病。
今朝,由于单份子测序价格的下降,组装一个与日本晴质量相当或更好的水稻参考基因组的本钱已降到了3万元以下。连系单份子测序、BioNano和Hi-C数据,今朝可以很低的本钱获得绝大大都物种的高质量参考基因组。对于功用基因组研讨来说,高质量基因组序列的获得已不再是一个瓶颈,这预示着后基因组时代在大都物种中的周全到来。
论文第一作者为梁承志研讨组博士生杜会龙,通讯作者为梁承志研讨员。软件开辟获得了基因组分析平台的大力支持和帮助。
图a HERA组装基因组跟玉米参考基因组B73 RefGen_v4的比力。全基因组中序列缺口由2523个削减到了76个。
图b 玉米参考基因组中缺失或过剩的序列(上图)经HERA改良后(下图)被正确地填补或移除。
原文链接:
https://www.nature.com/articles/s41467-019-13355-3
制版人:珂
收藏
告发 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|