blog

分子和统计工具分析基因组之间的复杂差异

<p>Steven McCarroll为了更好地理解人类基因组及其在人与人之间的差异,哈佛医学院的科学家开发了一套分子和统计工具,用于仔细检查与女性生育能力和神经系统疾病相关的特别有趣的基因组区域,发现17q2131存在九种不同的结构形式,每种结构形式的差异在于超过100,000个碱基对的遗传密码的增益,丢失或重排</p><p>在寻求理解人类基因组的过程中,一个主要障碍(和机会)是人与人之间的差异个体基因组可以有很大不同,从单字母变化到复杂的结构差异,最多可达1,000,000个碱基对的遗传密码为了分析这些复杂的变异,哈佛医学院的研究人员开发了一套新的分子和统计工具来仔细检查一个特别有趣的区域与女性生育能力和神经系统疾病相关的基因组他们的工作于7月1日在线发表在“自然遗传学”杂志上,为科学家提供了前所未有的人类基因组变异性观点,其中潜在的应用范围从预测疾病风险到阐明我们的进化历史传统上,基因组变异的研究依赖于单个基因组之间的单碱基对差异最近,科学家发现了更大的差异,称为拷贝数变异(CNVs),其中多达1,000,000个碱基对的区域可能缺失或存在于额外拷贝中这些区域可能编码多个基因,并且重复或缺失已被证明是自闭症,精神分裂症和发育迟缓等疾病的强风险因素然而,科学家缺乏分析人类基因组区域的工具,其中大规模变异比简单的获得或丧失更复杂</p><p>例如,一个人的基因组可能有七个基因拷贝,其中a另外有五个,每个都被重复或缺失基因的其他组合夹在一个整体上不同的大区域这些变化很大的排列使得研究基因组的这些区域非常困难 - 就像试图比较洗牌的巨型甲板“这些复杂的区域哈佛医学院遗传学助理教授So McCarroll和他的团队,包括第一作者Linda Boettger,毕业生Steven McCarroll说,我们的基因组是混乱的部分,直到现在我们都无法理解它们</p><p>生物学和生物医学科学的学生,开发了一套技术,利用分子生物学,群体遗传学和统计学来揭示个体基因组之间大规模变异的物理结构</p><p>为了测量大群体中基因组片段的拷贝数,团队精炼这是一种通过用纳升大小的液滴克隆或放大DNA来计算短块DNA的方法nique称为基于液滴的数字聚合酶链反应,或ddPCR它们利用荧光“报告”分子靶向特定基因进行扩增,并使每个基因组中感兴趣的区域经历20,000个同时ddPCR反应通过分析荧光标记液滴的数量,可以确定每个基因组中存在的基因拷贝数,仔细校准这些对照基因的测量结果同时,研究人员开发了一种比较数百个基因组的算法,利用每个基因组的全基因组序列数据来分析其他使用这种算法,他们能够识别出基于液滴的数字PCR技术独立验证的准确拷贝数变异为了证明其工具的功效,研究小组检查了17号染色​​体的结构复杂区域,运行了946个不相关的基因组从1000 Genomes Project通过他们的算法和分析120父母来自HapMap的ddPCR的后代三重奏这个被称为基因座17q2131的区域包含与女性生育能力和帕金森氏症风险相关的基因尽管17q2131长期以来被认为在一般人群中以两种结构形式存在,但McCarroll和他的团队发现它实际存在以九种不同的结构形式,每种结构形式的增益,丢失或重排超过100,000个碱基对遗传密码 他们观察的所有种群,包括非洲,欧洲和中国血统的个体,至少携带9种形式中的4种</p><p>有趣的是,其中5种主要来自西欧亚大陆的基因组,其中包括欧洲,印度和地中海地区</p><p>特别是超过40%的欧洲基因组进行了分析,发现它们含有一部分被称为KANSL1 McCarroll的基因的相似功能重复,他的合着者假设这个基因以前被证明可以调节女性生育的时间</p><p>在果蝇中,可能在人类中具有相似的生物学功能“遗传变异可以通过随机机会升高到高频率,但观察这两次,在非常相似的KANSL1重复中,支持它们在进化上有益的想法,”Boettger说“它将需要更多的研究,但KANSL1立即成为科学家想要研究的基因列表的首位</p><p>人类生育的时机,“McCarroll说”这不一定是要弄清楚任何一种疾病,而是要了解关于基因组如何随时间演变的一般性问题,以及基因组如何在人群中发生变化现在的工作使得将这种复杂的基因组结构与临床表型联系起来,为此提供了第一套分子和统计工具“他的实验室已经开始研究人类基因组其他复杂区域的变异这项工作得到了史密斯家族卓越奖的支持</p><p>国家人类基因组研究所(U01HG005208)对SAM的生物医学研究和哈佛医学院遗传学系的启动资源来源:哈佛医学院的Kevin Jiang图片:

查看所有