Skip to main content
Global

17.3: 全基因组测序

  • Page ID
    202934
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    培养技能

    • 描述三种测序类型
    • 定义全基因组测序

    尽管近年来医学取得了重大进展,但医生仍然对某些疾病感到困惑,他们正在使用全基因组测序来深入了解问题。 全基因组测序是确定整个基因组的DNA序列的过程。 当疾病的核心是遗传基础时,全基因组测序是一种暴力解决问题的方法。 现在有几个实验室提供对整个基因组进行测序、分析和解释的服务。

    例如,全外显子组测序是全基因组测序的低成本替代方案。 在外显子组测序中,仅对 DNA 的编码、外显子产生区域进行测序。 2010 年,全外显子组测序被用来拯救一个肠道有多处神秘脓肿的小男孩。 孩子做了几次结肠手术,都没有缓解。 最后,进行了全外显子组测序,结果显示控制细胞凋亡(程序性细胞死亡)的途径存在缺陷。 骨髓移植被用来克服这种遗传疾病,从而治愈了这个男孩。 根据全外显子组测序的诊断,他是第一个成功接受治疗的人。 如今,人类基因组测序更容易获得,可以在一两天内完成,花费约1000美元。

    排序项目中使用的策略

    所有现代测序项目中使用的基本测序技术是链终止方法(也称为二脱氧法),该方法由弗雷德·桑格在1970年代开发。 链终止方法涉及使用引物和常规脱氧核苷酸(dNTP)对单链模板进行DNA复制,后者是DNA的单体或单个单元。 引物和 dnTP 与少量荧光标记的双脱氧核苷酸 (ddNTP) 混合。 DDNTP 是单体,在另一个核苷酸通常附着形成链的部位缺少羟基(—OH)(图\(\PageIndex{1}\))。

    脱氧核苷酸由脱氧核糖糖、碱基和三个磷酸基团组成。 二脱氧核糖与脱氧核糖相同,唯一的不同是位于 3' 位置的羟基 (—OH) 基团被 H 取代。A 3' 羟基是延长 DNA 链所必需的,因此,如果将二脱氧核糖而不是脱氧核糖掺入生长链,则链停止生长。
    \(\PageIndex{1}\):二脱氧核苷酸在结构上与脱氧核苷酸相似,但缺少 3' 羟基(如方框所示)。 当双脱氧核苷酸被掺入 DNA 链中时,DNA 合成就会停止。

    每个 ddnTP 都标有不同颜色的荧光团。 每次将 ddNTP 掺入不断增长的互补链中时,它就会终止 DNA 的复制过程,从而产生多条短链的复制 DNA,每条短链在复制过程中的不同点终止。 当反应混合物在分离成单链后通过凝胶电泳处理时,由于大小不同,多条新复制的DNA链形成梯子。 由于 ddNTP 有荧光标记,因此凝胶上的每个条带都反映了 DNA 链和终止反应的 ddnTP 的大小。 荧光团标记的 ddNTP 的不同颜色有助于识别在该位置加入的 ddNTP。 根据梯子上每条带的颜色读取凝胶会产生模板链的顺序(图\(\PageIndex{2}\))。

    此插图的左侧部分显示了一条带有 GATTCAGC 序列的 DNA 母链和四条子链,每条子链都是在存在不同的双脱氧核苷酸的情况下产生的:ddatP、ddCTP、ddGTP 或 ddtTP。 当加入ddNTP时,生长链终止,从而产生不同长度的子链。 该图像的右侧部分显示了根据大小分离DNA片段的情况。 每个 ddNTP 都用不同的颜色用荧光标记,因此可以通过每个片段的大小及其颜色来读取序列。
    \(\PageIndex{2}\):说明了弗雷德里克·桑格的二脱氧链终止方法。 使用二脱氧核苷酸,可以在不同的点终止DNA片段。 DNA是根据大小分离出来的,可以根据片段的大小读取这些条带。

    早期策略:霰弹枪排序和成对末端排序

    霰弹枪测序方法中,DNA片段的多个拷贝被随机切成许多较小的碎片(有点像用霰弹枪发射子弹时会发生的情况)。 然后使用链式测序方法对所有区段进行测序。 然后,在计算机的帮助下,对碎片进行分析,看看它们的序列在哪里重叠。 通过匹配每个片段末尾的重叠序列,可以对整个 DNA 序列进行重组。 由重叠的较短序列组合而成的较大序列被称为 c ontig。 比方说,假设某人有四张你从未见过的风景照片副本,但对它应该如何呈现一无所知。 然后,该人用手撕开每张照片,这样每张副本中就会有不同大小的碎片。 然后,该人将所有片段混合在一起,并要求您重建照片。 在其中一个较小的碎片中,你会看到一座山。 在较大的文章中,你可以看到同一座山在湖后。 第三个片段仅显示了湖泊,但它显示了湖岸上有一间小屋。 因此,通过查看这三个片段中的重叠信息,你就会知道照片中有一座位于湖后面的山,其岸边有一间小屋。 这是使用霰弹枪测序重建整个 DNA 序列的原理。

    最初,霰弹枪测序只分析每个片段的一端是否有重叠之处。 这足以对小基因组进行测序。 但是,对更大的基因组(例如人类的基因组)进行测序的愿望促成了双管霰弹枪测序的开发,更正式地称为成对端测序。 在成对端测序中,对每个片段的两端进行重叠分析。 因此,成对端排序比霰弹枪测序更麻烦,但由于有更多可用信息,因此重建序列更容易。

    下一代测序

    自2005年以来,实验室使用的自动测序技术处于下一代测序的保护之下,下一代测序是一组用于快速DNA测序的自动化技术。 这些自动低成本测序器可以在一天之内生成数十万或数百万个短片段(25 到 500 个碱基对)的序列。 这些测序器使用复杂的软件来完成整理所有片段的繁琐过程。

    进化连接:比较序列

    序列对齐是蛋白质、DNA 或 RNA 的排列;它用于识别细胞类型或物种之间的相似区域,这可能表明功能或结构的保持。 序列对齐可用于构建系统发育树。 以下网站使用名为 BLAST(基本局部对齐搜索工具)的软件程序。

    在 “基本爆炸” 下,点击 “核苷酸爆炸”。 在大型 “查询序列” 框中输入以下序列:ATTGCTCGATTGCA。 在框下方,找到 “物种” 字段并输入 “人类” 或 “智人”。 然后单击 “BLAST”,将输入的序列与人类基因组的已知序列进行比较。 结果是该序列出现在人类基因组的一百多个地方。 使用水平条向下滚动图形下方,您将看到每个匹配命中项的简短描述。 选择列表顶部附近的热门歌曲之一,然后单击 “图形”。 这将带你进入一个页面,显示该序列在整个人类基因组中的位置。 您可以来回移动看起来像绿色旗帜的滑块,立即查看所选基因周围的序列。 然后,您可以通过单击 “ATG” 按钮返回到所选序列。

    模型生物全基因组序列的使用

    第一个被完全测序的基因组是细菌病毒,即噬菌体 fx174(5368 个碱基对);这是弗雷德·桑格使用霰弹枪测序完成的。 后来对其他几个细胞器和病毒基因组进行了测序。 第一个进行基因组测序的生物是流感嗜血杆菌细菌;这是克雷格·文特尔在20世纪80年代完成的。 大约74个不同的实验室合作对酵母酿酒酵母的基因组进行了测序,该测序始于1989年,并于1996年完成,因为它比任何其他已测序的基因组都要大60倍。 到1997年,两种重要的模型生物的基因组序列已经可用:大肠杆菌K12细菌和酵母酿酒酵母菌。 其他模型生物的基因组,例如老鼠 Mus musculus、果蝇果蝇 melanogaster、线虫 Caenorhabditis Elegan s 和人类智人。 许多基础研究都是在模型生物体中进行的,因为这些信息可以应用于遗传相似的生物。 模型生物是一种作为模型进行研究的物种,以了解模型生物所代表的其他物种的生物过程。 对整个基因组进行测序有助于这些模型生物的研究工作。 将生物信息附加到基因序列的过程称为基因组注释。 基因序列的注释有助于分子生物学的基本实验,例如设计 PCR 引物和 RNA 靶标。

    链接到学习

    DNA_sequence.png

    点击查看 HHMI 基因组测序位点的每个步骤。

    基因组序列的用途

    DNA微阵列是通过分析固定在玻璃载玻片或硅芯片上的DNA片段阵列来检测基因表达的方法,以识别活性基因和鉴定序列。 使用微阵列可以发现近一百万个基因型异常,而全基因组测序可以提供有关人类基因组中所有60亿个碱基对的信息。 尽管对基因组测序的医学应用的研究很有趣,但该学科倾向于关注异常的基因功能。 对整个基因组的了解将有助于及早发现未来发病的疾病和其他遗传疾病,从而能够在生活方式、药物治疗和生孩子方面做出更明智的决定。 基因组学仍处于起步阶段,尽管有朝一日使用全基因组测序筛查每个新生儿以检测遗传异常可能会成为例行公事。

    除疾病和药物外,基因组学还可以促进开发将生物质转化为生物燃料的新型酶,从而提高作物和燃料产量,降低消费者的成本。 这些知识应该可以更好地控制用于生产生物燃料的微生物。 基因组学还可以改进用于监测污染物对生态系统的影响的方法,并帮助清理环境污染物。 基因组学允许开发可能有益于医学和农业的农用化学品和药品。

    从全基因组测序中获得的所有知识听起来不错;但是,人类有责任明智地使用这些知识。 否则,很容易滥用这些知识的力量,导致基于个人遗传学、人类基因工程和其他伦理问题的歧视。 这些信息还可能导致有关健康和隐私的法律问题。

    摘要

    全基因组测序是治疗遗传疾病的最新可用资源。 一些医生正在使用全基因组测序来挽救生命。 基因组学有许多工业应用,包括生物燃料开发、农业、制药和污染控制。 所有现代测序策略的基本原理都涉及测序的链终止方法。

    尽管人类基因组序列为医学专业人员提供了关键见解,但研究人员使用模型生物的全基因组序列来更好地了解该物种的基因组。 自动化和全基因组测序成本的降低可能会在未来带来个性化医疗。

    词汇表

    链条终止方法
    使用标记的双脱氧核苷酸来终止 DNA 复制的 DNA 测序方法;它也被称为二脱氧法或 Sanger 方法
    contig
    由重叠的较短序列组装而成的较大 DNA 序列
    脱氧核苷酸
    DNA 的单个单体(单个单位)
    二脱氧核苷酸
    缺少羟基的 DNA 单体 (—OH)
    DNA 微阵列
    用于通过分析固定在玻璃载玻片或硅芯片上的一系列 DNA 片段来检测基因表达的方法,以鉴定活性基因和识别序列
    基因组注解
    将生物信息附加到基因序列的过程
    模型生物
    被研究并用作模型以了解模型生物所代表的其他物种的生物过程的物种
    下一代测序
    一组用于快速 DNA 测序的自动化技术
    霰弹枪排序
    用于对多个 DNA 片段进行测序以生成大块 DNA 序列的方法
    全基因组测序
    确定整个基因组 DNA 序列的过程