人类基因组在个体与个体之间存在很大差异。这些差异包括单核苷酸变化或DNA序列中的“拼写错误”,但更多的变异来自结构变异,包括DNA片段的添加,缺失和重排。最近的一项研究使用了多种先进技术,比以往更深入地深入研究三个家族中存在的结构变异,以及它们的功能后果。
在过去的十年中,基因组测序变得更快,更准确,更便宜。结果,越来越多的人类基因组被测序,我们对这些序列实际上对功能和疾病意味着什么的了解正在迅速增长。
我们越了解,我们越了解我们对人类基因组学知之甚少。虽然ATGC的线性序列看起来很整洁,但我们的基因组实际上是动态实体,在个体之间存在相当大的差异 - 这些差异可以改变导致正常功能和疾病的特征。
个体之间的遗传差异有助于我们的个性。这些差异包括数百万个单核苷酸变体 - 例如,其中一个人可能具有A,另一个人可能在给定位置具有C.还有数十万个结构变体(SV)。SV包括插入基因组或从基因组中删除的DNA片段,重复的片段和倒置的片段。SV比单核苷酸变体更难以鉴定,因此尚不清楚在给定的人类基因组中确实存在多少个SV。
现在,在Nature Communications上发表的一篇题为“人类基因组中单元型解析结构变异的多平台发现”的论文,深入研究了个体基因组差异。
这项工作涉及由人类基因组结构变异联盟(HGSVC)组成的大型国际研究团队,由共同第一作者Mark Chaisson博士,Ashley Sanders博士和赵雪芳博士领导。 ;共同资深作者Paul Flicek,博士,Ken Chen,博士,Mark Gerstein,博士,Phi-Yan Kwok,医学博士,博士,Peter Lansdorp,医学博士,博士, Gabor Marth,DSc。,Jonathan Sebat,Ph.D.,Xinghua Shi,Ph.D.,Ali Bashir,Ph.D.,Kai Ye,Ph.D.,Scott Devine,Ph.D.,Michael Talkowski,Ph .D。,Ryan Mills博士和Tobias Marschall,博士;和相应的高级作者Jan Korbel,博士,Evan Eichler,博士和Charles Lee,博士,FACMG,杰克逊实验室的科学主任和教授。他们使用全套基因组技术广泛分析三个家庭三人组(父母和孩子)的基因组。所使用的技术包括长读取,短读取和链特异性测序技术,光学映射和用于SV检测的多种计算机算法。该结果提供了迄今为止儿童基因组中最全面的SV目录,包括每个SV存在于哪组父母染色体上的信息。
总之,研究人员确定每个基因组平均有818,054个小插入和缺失(每个影响少于50个DNA碱基的基因组改变)和27,622个SV(影响50个碱基或更多DNA的基因组改变)。值得注意的是,他们还发现每个基因组平均有156个倒位,其中许多与遗传病综合征相关的基因组区域相交。研究人员发现,常规测序技术和常用的计算机算法实际上错过了每个人超过100,000个变种。例如,标识的短读取调用算法错过了83%的识别插入。实际上,给定人类基因组中SV的真实数量似乎比大多数研究通常鉴定的多三到七倍。
因此,SV构成了当前基因组测序技术和分析方法通常不能捕获的大量遗传变异。这意味着SVs对人类疾病的贡献尚未得到很好的量化,扩展的SV库可以帮助确定新的疾病遗传关联,并在未来的遗传测试中提高诊断产量。
标签:人类基因组
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。