如何选择您的NGS适配器?

NGS Adapter是新一代测序文库的重要组成部分,起到连接待测DNA片段与Flow cell(测序芯片)的作用,接头的效率是决定文库质量和产量的重要因素。那么什么是NGS Adapter?NGS Adapter的常见类型有哪些?如何为自己的测序平台选择合适的NGS Adapter?

1.什么是NGS Adapter?

2. 选择NGS指标需要考虑哪些因素?

3、常见的指数类型有哪些?

4. NGS适配器有哪些常见类型?

  • UMI 适配器
  • 完整适配器
  • 适配器不完整
  • Tn5 适配器

5. 如何为您的测序平台选择合适的NGS适配器?

6. 关于阅读

1.什么是NGS Adapter?

NGS Adapter是测序中的一系列适配器,是一段已知序列的短核苷酸序列,连接在目标核酸片段的两端,测序时通过与Flow cell上已知序列杂交开始测序,将文库结合到芯片上。那么NGS适配器的结构是怎样的呢?

以Illumina平台为例,一个NGS适配器可以分为三个部分:

P5和P7:与Flow cell上的P5和P7端结合的序列,将文库固定在测序芯片上,以便通过Bridge-PCR进行成簇反应。

Rd1 SP 和 Rd2 SP(Read1/Read2 测序引物):测序引物的结合区域,指示序列开始读取的位置。

Index(又称barcode):一段已知的合成序列,用于在混合文库测序中区分不同的样本。

Illumina platform single index library

如图。 1 Illumina平台单索引文库

MGI platform single-end index library

如图。 2 MGI平台单端索引库

随着测序通量的提升,可以同时对多个样本进行测序,如何区分不同的样本就显得尤为重要。前面提到,NGS adapter的index序列是用于区分不同样本的,那么在NGS中,选择index序列需要考虑哪些因素呢?请继续阅读...

2. 选择指数时应考虑哪些因素?

标签长度一般为6nt-18nt,根据标签数目分为单标签和双标签,双标签位于待测片段的两端,选择标签组合时需考虑碱基平衡和荧光平衡。

基数平衡是指多个指数之间的平衡,而非单个指数内的基数平衡,需要从基数类型和基数分布两个方面考虑。 组合原则是:同一组指标中的A/T/C/G四个碱基需要纳入,且这四个碱基的比例接近,分别占25%左右。

荧光信号平衡是指在无法保证碱基平衡的情况下,选择保证荧光信号的平衡。在Illumina平台的4通道测序仪中,dG/dT标记的是绿色荧光,dC/dA标记的是红色荧光。 测序过程中,每个循环必须同时存在绿色和红色荧光信号才能确保测序成功。 因此,在选择指标时应考虑绿色信号和红色信号的平衡。

3.常见的指数类型有哪些?

常见的双重索引通常包括唯一双重索引(UDI)、唯一双重条形码(UDB)和组合双重索引(CDI),可显著减少索引跳跃和错误分配。

UDI&UDB:两端指标一一对应,分组设计,可两端交叉验证;

由 Illumina 提供的 Stubby UDI 引物套件 Yeasen (货号:12404ES/12405ES)>>

CDI:两端的索引可以按照一定的要求进行组合,形成双端索引库;

Illumina 的 384 CDI 引物,Set1-Set2 由 Yeasen (猫#12412ES/12413ES)>>

Illumina为了提高通量和扩增效率,降低测序成本,在Novaseq等高通量测序仪上引入了阵列流动池(PFCT)和独家扩增(ExAmp)聚类技术,但却无意中放大了样本标签错配现象和index hopping。

图3 Illumina不同仪器型号采用非图案化流动池或图案化流动池

为了弥补HiSeq3000/4000、HiSeq X Series、NovaSeq等测序平台凸显的index hooping问题,Illumina提出了将index放在文库两端的策略,可以进行双边验证,剔除不匹配的adapter。当使用两端唯一index时,index错误分配率将降低至0.01%。相比之前常规的index置换组组合方式,index hopping将减少两个数量级。

在PCR-free文库构建中,可以使用单端标签接头,标签错配主要由测序错误引起,整体上标签错配率较低(平均0.0004%,最高0.001%),但在靶向捕获文库构建中,由于多个步骤会导致标签错配,通常使用UDI/UDB/CDI接头,因此crosstalk问题被放大。

4.NGS适配器有哪些常见类型?

随着测序技术的发展,接头的种类越来越多,例如单/双接头(如第3节所述)、UMI接头、转座酶接头、完全/不完全接头等等,适用于多种应用场景。本部分系统地整理了这些接头,为您提供接头选择的基础。

4.1 UMI 适配器

唯一分子识别符(UMI)接头是低频突变检测和绝对定量的利器。UMI是已知序列的随机合成序列,可设计为完全随机的核苷酸链、部分简并的核苷酸链或固定的核苷酸链。长度通常为10nt(单端UMI)或5-8nt(双端UMI)。其作用是在扩增前冻结DNA片段的状态,每个DNA分子对应一个UMI。因此在生物信息学分析过程中,可以区分不同来源的DNA模板,区分哪些是PCR扩增和测序过程中随机误差造成的假阳性突变,哪些是患者真正携带的,从而滤除背景噪音,实现低频、极低频突变的精准检测,对不同的DNA分子进行绝对定量。在低频突变检测中有着广泛的应用,特别是在肿瘤研究领域。

图4 UMI适配器示意图 Illumina平台结构

4.2 完整适配器

完整接头是PCR-free文库的必备产品,它包含了测序所需的全部序列,如Illumina平台中的P5、P7、RdS1、RdS2等,还根据测序要求添加了index序列和UMI序列。有了完整接头,就无需通过PCR引入其他接头,就可以直接测序。因此,可以使用完整接头构建PCR-free文库。PCR-free文库可以降低PCR扩增的偏向性、错误率和序列重复,增加一些高GC或高AT区域的覆盖度,这些区域在群体基因组研究中被广泛使用。

由 Illumina 平台提供的完整适配器产品 Yeasen (货号:13519ES/13520ES)>>

由MGI平台提供的完整适配器产品 Yeasen(货号:13360ES/13361ES)>>

Complete adapter diagram

图5 完整适配器图

4.3 不完整的适配器

不完全接头需要在接头连接后通过PCR引入其他序列才能形成完全接头,其特点是连接效率高,有效文库率高;PCR过程是对完全文库起富集作用,保证有效文库的浓缩,也可以引入双端标签和UMI序列。

4.4 Tn5 适配器

Tn5接头利用Tn5的限制性内切酶活性,将部分接头序列连接到DNA片段的两端,使片段化和接头连接同时进行,节省时间和样品,最后通过PCR引入剩余的接头序列、index、UMI等序列,形成完整的文库,可用于构建Cut&tag文库。

Schematic diagram of Tn5 adapter library construction

图6 Tn5接头文库构建示意图

5. 如何为您的测序平台选择合适的NGS适配器?

目前,主流的测序平台有两大:Illumina和华大智造。 Yeasen作为一家为NGS提供完整解决方案的公司,已经开发出多种适用于Illumina或MGI平台的NGS适配器。

就 Illumina 平台而言,Illumina NGS 适配器由 Yeasen 包括UDI、CDI、单一索引三种类型。在MGI平台方面,MGI NGS适配器由 Yeasen 有两种类型,涉及 Dual UMI-UDB 和单一索引。我们在下表中列出了产品信息,包括适配器的类型、可用的尺寸以及适配器和引物的浓度。

Complete和UDI NGS适配器不用担心耦合问题,适合追求方便使用的客户;CDI NGS适配器管子少,体积小,适合追求方便存放和携带的客户。PCR-free需要使用Complete NGS适配器。

对于 Illumina

管道 希夫NGS®NA 图书馆准备 384 CDI 引物(适用于 Illumina),第 1 组(8*12,96 个索引) 12412ES
希夫NGS®NA 图书馆准备 384 CDI 引物(适用于 Illumina),第 2 组(8*12,96 个索引) 12413ES
Hieff NGS® RNA Lib Prep 384 CDI 引物(适用于 Illumina),第 1 组(96 个索引) 12414ES
Hieff NGS® RNA Lib Prep 384 CDI 引物(适用于 Illumina),第 1 组(96 个索引) 12415ES
在盘子里 Hieff NGS® Stubby UDI 引物试剂盒(适用于 Illumina)(1-384 索引)套装 1-4 12407ES
适用于 Illumina 的 Hieff NGS® Stubby UDI 引物试剂盒
集合1
96 孔板,1-96 索引 集合 1
12327ES
适用于 Illumina 的 Hieff NGS® Stubby UDI 引物试剂盒
集合2
96 孔板,97-192 索引 第 2 组
12328ES
适用于 Illumina 的 Hieff NGS® Stubby UDI 引物试剂盒
集合3
96 孔板,193-288 索引 第 3 组
12329ES
适用于 Illumina 的 Hieff NGS® Stubby UDI 引物试剂盒
套装4
96 孔板,289-384 索引 第四组
12330ES

对于MGI

希夫 新一代测序™ 适用于 MGI、Set1/Set2 的双 UMI UDB 适配器套件

13367ES

13368ES

96 指数种类
希夫NGS™ MGI 完整适配器套件, Set1/Set2/Set3(询问) 13360ES 8 指数种类,41-48
13361ES 16 指数种类,57-72
13362ES 96 索引种类,1-96

关于阅读

NGS文库构建中涉及的关键酶

关于NGS相关技术,你了解多少?

NGS中各类磁珠:DNA\RNA\mRNA磁珠

NGS文库定量:快速准确的Qubit还是精准的qPCR?都需要!

询问