测序的原理

Sanger
测序原理 https://v.qq.com/x/page/d0124c0k44t.html
illumina
测序原理: https://v.qq.com/x/page/i0770fd7r9i.html
PacBio
第三代 SMRT 单分子测序 https://v.qq.com/x/page/r03534cry7u.html
Ion torrent
测序原理 https://v.qq.com/x/page/v01754s6r82.html
Oxford Nanopore
https://v.qq.com/x/page/v0746ixokzz.html

好的,以下是根据这份讲义内容,对第一、二、三代测序技术相关知识的详细讲解:

一、第一代测序技术(Sanger 测序)

(一)背景与历史

  • 时间:1977 年,Frederick Sanger 和 Coulson 开创了双脱氧链终止法(Sanger 测序法),并完成了第一个噬菌体全基因组的测序。
  • 意义:开启了现代基因测序的时代,为后续的基因组学研究奠定了基础。

(二)测序原理

  • 核心方法:基于 DNA 聚合酶的链终止反应。通过在 DNA 合成过程中随机引入标记了不同荧光染料的双脱氧核苷酸(ddNTP),使 DNA 链在不同位置终止。
  • 具体步骤
    1. 模板制备:将待测 DNA 片段克隆到合适的载体中,获得单链 DNA 模板。
    2. 引物退火:加入短的引物,使其与模板 DNA 的互补序列结合。
    3. 链合成与终止:在反应体系中加入 DNA 聚合酶、dNTP(正常脱氧核苷酸)和少量标记了荧光的 ddNTP。DNA 聚合酶从引物开始延伸 DNA 链,当随机遇到一个 ddNTP 时,链合成终止。
    4. 电泳分离与检测:将反应产物在聚丙烯酰胺凝胶中进行电泳分离,根据荧光标记的 ddNTP 不同,产生不同颜色的荧光信号,通过检测荧光信号的位置和颜色,确定 DNA 序列。

(三)特点

  • 优点
    • 准确性高:单次测序的准确性可达 99.9% 以上,适合对准确性要求极高的应用,如基因组参考序列的构建。
    • 读长较长:单次测序读长可达 500-1000 个碱基,能够覆盖较长的 DNA 片段,减少拼接错误。
  • 缺点
    • 速度慢:每次测序只能处理一个 DNA 片段,通量低,难以满足大规模基因组测序的需求。
    • 成本高:设备和试剂成本较高,不适合大规模应用。

二、第二代测序技术(Next-Generation Sequencing, NGS)

(一)背景与历史

  • 时间:2005 年左右,随着 Roche 454 测序仪和 Illumina Solexa 测序仪的推出,第二代测序技术逐渐成熟并广泛应用。
  • 意义:极大地提高了测序通量,降低了测序成本,推动了基因组学研究的快速发展,使大规模基因组测序成为可能。

(二)测序原理(以 Illumina 测序为例)

  • 核心方法:基于可逆终止化学和边合成边测序(Sequencing by Synthesis, SBS)技术。

  • 具体步骤

  • 在这里插入图片描述

    1. 建库
      • DNA 片段化:将待测 DNA 随机打断成一定长度的小片段(如 300bp-800bp)。
      • 末端修复与接头连接:对 DNA 片段的末端进行修复,并连接上特定的接头序列,使片段能够固定在测序芯片上。
      • 加 index 标签:为不同样本的 DNA 添加独特的 index 标签,便于后续数据拆分。
    2. Flowcell 芯片准备
      在这里插入图片描述
Flowcell 的结构
  • 通道(Lanes):Flowcell 包含多个通道,每个通道称为一个 lane。图中显示的 flowcell 有八条 lane,意味着可以同时进行八个独立的测序运行。
  • 表面修饰:每个 lane 的表面都经过化学修饰,以便能够固定 DNA 片段。这些修饰包括大量的引物,如 P7 和 P5 引物,它们与 DNA 文库上的接头序列互补,从而能够固定 DNA 片段。
  • Swath 和 Tile:每个 lane 有两个面,每个面上有三个 swath(区域),每个 swath 包含 16 个 tile(小方格)。因此,每个 lane 总共有 98 个 tile(两面各 48 个)。整个 flowcell 有 768 个 tile(96 lanes × 8 tiles/lane)。
Flowcell 的功能
  • DNA 固定:在测序过程中,DNA 片段需要固定在 flowcell 上,以防止在液体流动时被冲走。这是通过 DNA 片段上的接头与 flowcell 表面的引物结合来实现的。

  • 大规模并行测序:由于 flowcell 上有大量的 tile,每个 tile 可以独立进行测序反应,因此可以实现大规模并行测序,大大提高测序效率和通量。

  • 测序反应容器:所有的测序反应都在 flowcell 上进行,包括 DNA 的固定、扩增和测序。

    • 芯片表面修饰:Flowcell 芯片表面含有大量固定化的引物,与 DNA 片段上的接头序列互补。
    • DNA 固定:将建库后的 DNA 片段加入 Flowcell,使其与芯片上的引物结合。
    1. Cluster 扩增
      • 桥式 PCR:通过桥式 PCR 扩增,使每个 DNA 片段在芯片上形成一个簇(Cluster),每个簇包含多个相同的 DNA 拷贝,放大信号。
    2. 测序
      • 边合成边测序:在反应体系中加入带有荧光标记的 dNTP 和 DNA 聚合酶。每次只添加一个 dNTP 到 DNA 链上,通过激发荧光信号并记录,确定碱基类型。
      • 信号处理与碱基识别:将荧光信号转换为碱基序列,生成 fastq 格式的测序数据。

(三)特点

  • 优点
    • 高通量:一次运行可以产生大量的测序数据,适合大规模基因组测序。
    • 成本低:单位碱基的测序成本大幅降低,使基因组学研究更加普及。
    • 应用广泛:可用于基因组组装、变异检测、RNA 测序、单细胞测序等多种应用。
  • 缺点
    • 读长短:单次测序读长较短(通常在 50-300bp),难以处理重复序列和复杂基因组区域。
    • 测序时间长:从建库到测序完成通常需要数天时间。
    • 偏向性:由于 PCR 扩增等步骤,可能导致某些区域的测序偏向性。

三、第三代测序技术

(一)PacBio 测序

1. 背景与历史
  • 时间:2010 年左右,PacBio 公司推出了基于单分子实时测序(SMRT)技术的测序仪。
  • 意义:提供了超长读长的测序能力,解决了第二代测序技术在处理复杂基因组区域时的局限性。
2. 测序原理
  • 核心方法:单分子实时测序(SMRT)。
  • 具体步骤
    1. SMRT Cell 准备:将待测 DNA 样本转移到 SMRT Cell 中,该芯片含有大量零模波导孔(ZMW)。
    2. 文库构建:构建 SMRTbell 文库,将 DNA 片段连接成环状结构,便于多次测序。
    3. 测序过程
      • DNA 聚合酶固定:在 ZMW 孔底部固定 DNA 聚合酶。
      • 单分子测序:DNA 模板与聚合酶结合,四种不同荧光标记的 dNTP 被逐个添加到 DNA 链上。每次添加一个 dNTP 时,荧光信号被激发并记录,通过信号分析确定碱基类型。
      • 滚环测序:对于环状 DNA 模板,聚合酶可以多次绕环测序,提高测序准确性。
    4. 数据生成:生成长读长的测序数据,如 Polymerase Read、Subreads、CLR 和 CCS 等。
3. 特点
  • 优点
    • 超长读长:平均读长可达 10-70kb,甚至更长,适合复杂基因组的组装和结构变异检测。
    • 高准确性:通过多次测序和算法校正,可以获得高准确性的 HiFi Reads(>99.9%)。
    • 无需 PCR 扩增:避免了 PCR 扩增带来的偏向性,适合低丰度基因的检测。
  • 缺点
    • 数据量小:单次测序产生的数据量相对较小,适合小规模基因组测序。
    • 成本高:测序成本较高,不适合大规模应用。
    • 设备昂贵:测序仪价格较高,不适合小规模实验室购买。

(二)纳米孔测序

1. 背景与历史
  • 时间:2014 年左右,Oxford Nanopore 公司推出了基于纳米孔技术的测序仪,如 MinION。
  • 意义:提供了实时、长读长的测序能力,适合现场快速测序和长片段基因组分析。
2. 测序原理
  • 核心方法:基于纳米孔的电信号检测。
  • 具体步骤
    1. 纳米孔准备:选择合适的生物纳米孔或固态纳米孔,将其嵌入到合成膜中。
    2. DNA 样本处理:将待测 DNA 样本连接上测序接头和马达蛋白,使其能够通过纳米孔。
    3. 测序过程
      • DNA 通过纳米孔:在电场作用下,DNA 链在马达蛋白的牵引下逐个碱基通过纳米孔。
      • 电流变化检测:每个碱基通过纳米孔时会引起特定的电流变化,通过检测电流变化信号,识别碱基序列。
      • 碱基识别:利用机器学习算法将电流信号(Squiggle)转换为碱基序列。
    4. 数据生成:生成长读长的测序数据,通常以 fastq 格式输出。
3. 特点
  • 优点
    • 长读长:可以生成长达数十万个碱基的测序数据,适合复杂基因组的组装和结构变异检测。
    • 实时测序:数据可以实时生成和分析,适合快速检测和现场应用。
    • 便携性:测序设备轻便,如 MinION 适合野外和现场使用。
  • 缺点
    • 高错误率:初始测序错误率较高(约 5%-15%),但可以通过算法校正和多次测序提高准确性。
    • 数据处理复杂:需要复杂的碱基识别算法和软件进行数据处理。
    • 成本高:虽然单次运行成本较低,但设备和试剂成本较高。

总结

  • 第一代测序技术(Sanger 测序):准确性高、读长长,但速度慢、成本高,适合小规模、高精度的测序项目。
  • 第二代测序技术(NGS):高通量、成本低、应用广泛,但读长短、有偏向性,适合大规模基因组测序和转录组分析。
  • 第三代测序技术(PacBio 和纳米孔测序):长读长、无需 PCR 扩增、适合复杂基因组分析,但数据量小、成本高、设备昂贵,适合特定应用场景,如基因组组装、结构变异检测和现场快速测序。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/81142.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高项-逻辑数据模型

逻辑数据模型的核心理解 1. 定义与特点 逻辑数据模型(Logical Data Model, LDM): 是一种抽象的数据结构设计,用于描述业务实体(如客户、订单)及其关系(如“客户下单”)&#xff0c…

《数字分身进化论:React Native与Flutter如何打造沉浸式虚拟形象编辑》

React Native,依托JavaScript语言,借助其成熟的React生态系统,开发者能够快速上手,将前端开发的经验巧妙运用到移动应用开发中。它通过JavaScript桥接机制调用原生组件,实现与iOS和Android系统的深度交互,这…

提高绳牵引并联连续体机器人运动学建模精度的基于Transformer的分段学习方法

合肥工业大学王正雨老师团队针对绳牵引并联连续体机器人的运动学建模提出一种基于Transformer网络的分段学习方法,该方法较传统建模性能卓越、精度更高。相关研究论文“Transformer-based segmented learning for kinematics modelling of a cable-driven parallel …

【PX4飞控】在 Matlab Simulink 中使用 Mavlink 协议与 PX4 飞行器进行交互

这里列举一些从官网收集的比较有趣或者实用的功能。 编写 m 脚本与飞行器建立 UDP 连接,并实时可视化 Mavlink 消息内容,或者读取脚本离线分析数据。不光能显示 GPS 位置或者姿态等信息的时间曲线,可以利用 Matlab Plot 功能快速定制化显示一…

Oracle中的select1条、几条、指定范围的语句

在Oracle中,可以使用不同的方法来选择一条记录、多条记录或指定范围内的记录。以下是具体的实现方式: 1. 查询单条记录 使用ROWNUM伪列限制结果为1条: SELECT * FROM your_table WHERE ROWNUM 1;特点:Oracle会在结果集生成时分…

自营交易考试为何出圈?一场模拟交易背后的真实竞争

在交易圈里,有个现象正在悄悄发生:越来越多交易员开始主动报名参与一类“非实盘”的考试,原因却并不复杂。不是为了资格证书,也不是为了炫技,而是为了一个更实在的东西——稳定、透明的利润分成,以及一次向…

一键生成达梦、Oracle、MySQL 数据库 ER 图!解锁高效数据库设计!

从事企业软件项目开发的同学们一定对 ER 图很熟悉,可以帮助用户快速厘清数据库结构,方便后续维护和优化。但是在日常工作中,面对复杂的数据结构,整理表设计文档对于每一位DBA来说都很头大,需要将设计细节转化为条理清晰…

游戏行业DDoS攻击类型及防御分析

游戏行业作为DDoS攻击的高发领域,攻击类型复杂多样,结合多个来源的信息,以下是其主要攻击类型及特征分析: 1. 传统流量型DDoS攻击 UDP洪水攻击:通过大量UDP报文淹没服务器端口,消耗带宽资源,导…

Web 架构之状态码全解

文章目录 一、引言二、状态码分类2.1 1xx 信息性状态码2.2 2xx 成功状态码200 OK201 Created204 No Content 2.3 3xx 重定向状态码301 Moved Permanently302 Found304 Not Modified 2.4 4xx 客户端错误状态码400 Bad Request401 Unauthorized403 Forbidden404 Not Found 2.5 5x…

jedis+redis pipeline诡异的链接损坏、数据读取异常问题解决

文章目录 问题现象栈溢出(不断的重连)读取超时未知响应尝试读取损坏的链接读取到的数据和自己要读的无关,导致空指针、类型转换错误,数据读取错乱 问题写法问题分析修复注意点 问题现象 栈溢出(不断的重连&#xff09…

c++STL-list的模拟实现

cSTL-list的模拟实现 list源码剖析list模拟实现list构造函数拷贝构造函数赋值重载迭代器 iterator访问结点数size和判空尾插 push_back头插 push_front尾删pop_back头删pop_front插入 insert删除 erase清空clear和析构函数访问结点 参考程序 list源码剖析 建议先看cSTL-list的…

WeakAuras Lua Script ICC (BarneyICC)

WeakAuras Lua Script ICC (BarneyICC) https://wago.io/BarneyICC/69 全量英文字符串: !WA:2!S33c4TXX5bQv0kobjnnMowYw2YAnDKmPnjnb4ljzl7sqcscl(YaG6HvCbxaSG7AcU76Dxis6uLlHNBIAtBtRCVM00Rnj8Y1M426ZH9XDxstsRDR)UMVCTt0DTzVhTjNASIDAU…

校园网规划与设计方案

一、项目概述 校园网是学校实现信息化教学、科研与管理的重要基础设施,其性能与稳定性直接影响学校的整体发展。随着学校规模不断扩大、教学科研活动日益丰富,对校园网的带宽、可靠性、安全性以及智能化管理等方面提出了更高要求。本规划与设计方案旨在构建一个高速、稳定、…

算法分析:蛮力法

一、实验目的 1 掌握蛮力法的设计思想(利用计算机去穷举所有的可能解,再从中依次找出可行解) 2 掌握蛮力法的具体实现和时间复杂度分析 3 理解蛮力法的常见特性 实验要求:先用伪代码描述利用蛮力法解决的算法解决方案,再用程序实现,计算时间…

信息系统运行管理员:临阵磨枪版

信息系统运行管理员考试 - 全覆盖详细背诵大纲 (根据考情分析和原始材料,力求完整覆盖考点细节) 第一部分:基础知识与运维概览 Chapter 1: 信息系统运维概述 (上午题 5分) 信息: 含义:香农 - 减少随机不确定性的东西&#xff1b…

Linux的进程管理和用户管理

gcc与g的区别 比如有两个文件:main.c mainc.cpp(分别是用C语言和C语言写的)如果要用gcc编译: gcc -o mainc main.c gcc -o mainc mainc.cpp -lstdc表明使用C标准库; 区别一: gcc默认只链接C库&#x…

Python 常用模块(八):logging模块

目录 一、引言:日志模块在项目开发中的重要性二、从 Django 日志配置看 Logging 模块的核心组成三、logging模块核心组件详解3.1 记录器Logger3.2 级别Level3.3 根记录器使用3.4 处理器Handler3.5 格式化器Formatter3.6 日志流3.7 日志示例 四、日志模块总结 一、引…

Servlet原理

Servlet 体系结构的类层次关系 Servlet(接口):定义了 Servlet 的核心生命周期方法(如 init()、service()、destroy()),是所有 Servlet 的顶层规范,任何 Servlet 都需实现该接口。GenericServlet…

数据科学和机器学习的“看家兵器”——pandas模块 之五

目录 4.5 pandas 高级数据处理与分析 一、课程目标 二、对数据表格进行处理 (一)行列转置 (二)将数据表转换为树形结构 三、数据表的拼接 (一)merge () 函数的运用 (二)concat () 函数的运用 (三)append () 函数的运用 四、对数据表格的同级运算 五、计算数据表格中数…

组合问题(去重)

40. 组合总和 II - 力扣&#xff08;LeetCode&#xff09; class Solution { private:vector<vector<int>>result;vector<int>path;void backtracking(vector<int>& candidates, int target,int sum,int startIndex,vector<bool>&used)…