生信分析笔记

V1

2022/09/18阅读:31主题:山吹

DNA测序原理

今天分享DNA测序技术和原理,包括illumina和pacbio测序原理、基本介绍和优缺点对比。

Illumina测序技术

  • 原理:边合成边测序
  • 测序长度:150bp
  • 通量:6TB

测序原理

观看网址:https://www.youtube.com/watch?v=fCd6B5HRaZ8

文库构建

  • DNA片段需要加接头修饰才能进行上机测序,这个过程称为二代测序的文库构建

  • 流程及其原理:末端修饰-添加接头-磁珠纯化-PCR扩增-磁珠纯化

  • 测序是以单链为单位的,建库完成后的每条DNA的单链均一端连有测序引物-Rd1Sp和P5,另一端为Rd2 SP、Index和P7。

  • Index用来区分不同的文库,因为测序仪一个run产生数据量巨大,由于实际情况不同,一次上机常会进行多个文库测序,因此需要加上Index来区分。

上机测序

  • 三个系统:

温度控制系统;酶控制系统;荧光信号收集系统

  • 过程:

首先以寡核苷酸为引物、文库片段为模板进行DNA复制,复制完成后解链,将文库片段洗去,留在流通池表面的为与文库模板互补的DNA链。

因为单链DNA另一端为不同的接头序列,可以与相邻的另一种寡核苷酸互补结合,之后进行“桥”式扩增。

桥式扩增后一个DNA簇都是由最初的一个文库模板复制而来,但是这时候P7上的序列与P5上的序列是分别从两端开始的,测序要保证每个片段一致性,因此再次解链线性化,切割并洗去P5上的DNA链,只留P7上的DNA单链。

加入测序引物Read1 SP和修饰过的DNA聚合酶,则在测序引物3’端开始DNA复制。

双末端测序,进行另一个方向的测序,洗掉前面复制合成的片段,从另一端进行序列读取。

测序数据

优缺点

  • 优点: 一次能够同时得到大量的序列数据,相比于一代测序技术,通量提高了成千上万倍; 单条序列成本非常低廉
  • 缺点: 序列读长较短,Illumina平台最长为250-300bp

Pacbio测序技术

  • 原理:边合成边测序
  • 测序长度:30kb
  • 通量:20GB

测序原理

观看网址:https://www.youtube.com/watch?v=_lD8JyAbwEo

单分子实时测序SMRT

SMRT 中有很多 ZMW 小孔。ZMW(Zero-Mode Waveguides)孔,即零模波导孔。每一个SMRT Cell 中含有大量这种圆形纳米小孔,直径为50~100nm,该小孔利用了一种物理效应零模波导,外径比激发光波长小,当 DNA 分子进入小孔后,因激发光从孔底发出的光不能穿透小孔进入上方的溶液区,仅被限制在底部一个足以覆盖被检测 DNA 部分的区域,进而收集该区域的信号,将背景噪音降到最低。

在纳米孔底部,锚定着测序模板(DNA 单链)和 DNA 聚合酶,同时包含着四种被不同荧光基团修饰的 dNTP。由于每次添加的 dNTP 所携带的荧光颜色是不同的,在激光的激发下可以发出不同的荧光,根据散射出的荧光信号可以判断添加的碱基类型

HIFI reads

在这种测序模式下,酶读长一般大于插入片段长度,因此酶会绕着模板进行滚环测序,插入片段会被多次测序。单次测序中造成的随机测序错误,可以通过算法进行自我纠错校正,最终得到高准确度的 HiFi reads.

Pacbio优缺点

  • pacbio 的优点

1、超长读长

2、准确性高

3、测序速度快

  • pacbio 的缺点

1、数据量小,一张芯片目前最多只有 800 万个孔;

2、单分子测序原始数据的错误率高,需要重复测序降低错误率;

3、测序价格较高,SMRT 的成本是二代测序的 6-7 倍;

4、测序仪成本较高,不适合小规模组织购买;

5、提高准确性需要牺牲测序长度和数据量;

总结补充

1·第二代测序是基于PCR发展的高通量测序技术,第一代测序末端终止法,而二代测序使用可逆终止末端,能够实现边合成边测序。

2·特殊标记碱基的荧光信号是确定序列的关键,在测序过程中,必须将单DNA扩增成DNA簇,目的是增强信号。

3·若读取长度太长,基因簇的协同性降低,准确性下降,因此具有高通量,读长短的特点。

4·基因组DNA需要使用鸟枪法打成小片段,测序完成后拼装,而扩增子等小片段可以直接测序。

公众号:生信分析笔记

分类:

后端

标签:

后端

作者介绍

生信分析笔记
V1

欢迎关注公众号:生信分析笔记