如何選擇您的NGS適配器?
NGS Adapter是二代定序文庫的重要組成部分,扮演連接被偵測的DNA片段與Flow cell(定序晶片)的角色。接頭的效率是決定文庫品質和產量的重要因素。那什麼是NGS適配器呢? NGS 轉接器有哪些常見類型?如何為您的定序平台選擇合適的NGS適配器?
1.什麼是NGS Adapter?
2. 選擇NGS指標需要考慮哪些因素?
3.常見的指數類型有哪些?
4. NGS適配器有哪些常見類型?
- UMI 轉接器
- 完整適配器
- 適配器不完整
- Tn5 轉接器
5. 如何為您的定序平台選擇合適的NGS適配器?
6. 關於閱讀
1.什麼是NGS Adapter?
NGS Adapter是定序中的一系列適配器,是一小段已知序列的核苷酸序列。它與目標核酸片段的兩端連接。定序時,它會透過與Flow cell上已知序列雜交來開始定序,將文庫結合到晶片上。那麼NGS適配器的結構是怎麼樣的呢?
以Illumina平台為例,一個NGS適配器可以分為三個部分:
P5和P7:與Flow cell上的P5和P7端結合的序列,將文庫固定在定序晶片上,以便透過Bridge-PCR進行成簇反應。
Rd1 SP 和 Rd2 SP(Read1/Read2 定序引子):定序引子的結合區域,指示序列開始讀取的位置。
Index(又稱barcode):一段已知的合成序列,用於在混合文庫定序中區分不同的樣本。
圖。 1 Illumina平台單索引文庫
圖。 2 MGI平台單端索引庫
隨著定序通量的提高,可以同時對多個樣本進行定序。因此如何區分不同的樣本就顯得格外重要。如前所述,NGS接頭的索引序列用於在次世代定序(NGS)中區分不同的樣本。選擇指數時該考慮哪些因素?請繼續閱讀...
2. 選擇指數時應考慮哪些因素?
索引長度一般為6nt~18nt,依索引數目分為單索引和雙索引。雙重索引位於待測試片段的兩端。選擇指數組合時應考慮鹼基平衡和螢光平衡。
基數平衡是指多個指數之間的平衡,而不是單一指數內的基數平衡。需要從鹼基類型和鹼基分佈兩方面來考慮。 組合原則是:同一組指標中的A/T/C/G四個鹼基需要納入,且這四個鹼基的比例接近,分別佔25%左右。
螢光訊號平衡是指在無法保證基礎平衡的情況下,選擇保證螢光訊號的平衡。在Illumina平台的4通道定序儀中,dG/dT標記為綠色螢光,dC/dA標記為紅色螢光。 在定序過程中,每個循環必須同時存在綠色和紅色螢光訊號才能確保定序成功。 因此,在選擇指標時應考慮綠色訊號和紅色訊號的平衡。
3.常見的指數類型有哪些?
常見的雙重索引通常包括唯一雙重索引(UDI)、唯一雙重條碼(UDB)和組合雙重索引(CDI),可顯著減少索引跳躍和錯誤分配。
UDI&UDB:兩端指標一一對應,分組設計,可兩端交叉驗證;
由 Illumina 提供的 Stubby UDI 引子套件
CDI:兩端的索引可以依照一定的要求進行組合,形成雙端索引庫;
Illumina 的 384 CDI 引物,Set1-Set2 由
Illumina為了提高通量和擴增效率,降低定序成本,在Novaseq等高通量定序儀上引入了陣列流動池(PFCT)和獨家擴增(ExAmp)聚類技術,但卻無意中放大了樣本標籤錯配現象和index hopping。
圖3 Illumina不同儀器型號採用非圖案化流動池或圖案化流動池
為了彌補HiSeq3000/4000、HiSeq X Series、NovaSeq等定序平台凸顯的index hooping問題,Illumina提出了將index放在文庫兩端的策略,可以進行雙邊驗證,剔除不匹配的adapter。當兩端使用唯一索引時,索引錯誤分配率將降低至0.01%。與先前常規的索引排列組組合方法相比,索引跳躍將減少兩個數量級。
在建構無PCR文庫時,可使用單端標籤接頭。標籤不匹配主要是由於定序錯誤造成的。整體來說,標籤錯配率較低(平均0.0004%,最高0.001%)。然而,在建立標靶擷取文庫時,由於多個步驟會導致標籤不匹配,並且通常使用UDI/UDB/CDI適配器,因此串擾問題被放大。
4.NGS適配器有哪些常見類型?
隨著定序技術的發展,接頭的種類越來越多,例如單索引/雙索引接頭(如第3節所述)、UMI接頭、轉座酶接頭、完全/不完全接頭等等,適用於各種各樣的應用場景。本部分有系統地整理了這些適配器,為您提供適配器選擇的基礎。
4.1 UMI 適配器
唯一分子識別碼(UMI)適配器是低頻突變檢測和絕對定量的利器。 UMI是具有已知序列的隨機合成序列。它可以設計為完全隨機的核苷酸鏈、部分簡併的核苷酸鏈或固定的核苷酸鏈。長度通常為10nt(單端UMI)或5-8nt(雙端UMI)。其作用是凍結擴增前DNA片段的狀態,每個DNA分子對應一個UMI。因此在生物資訊分析過程中,可以區分出不同來源的DNA模板,區分哪些是PCR擴增和定序過程中隨機誤差造成的假陽性突變,哪些是病人真正攜帶的,從而濾除背景噪音,實現低頻、極低頻突變的精準檢測,對不同的DNA分子進行絕對定量。在低頻突變檢測中有著廣泛的應用,特別是在腫瘤研究領域。
圖4 UMI適配器示意圖 Illumina平台結構
4.2 完整適配器
Complete adapters是PCR-free文庫的必備產品,包含了定序所需的所有序列,例如Illumina平台中的P5、P7、RdS1、RdS2等,也根據定序要求包含了index序列和UMI序列。由於接頭齊全,無需透過PCR引入其他接頭,可直接定序。因此,可以使用完整的接頭來建立無 PCR 文庫。 PCR-free文庫可以降低PCR擴增偏差、錯誤率、以及序列重複,增加一些在群體基因組研究中廣泛使用的高GC或高AT區域的覆蓋率。
由 Illumina 平台提供的完整適配器產品
由MGI平台提供的完整適配器產品
圖5 完整適配器圖
4.3 不完整的適配器
不完整的接頭需要在接頭連接後透過PCR引入其他序列才能形成完整的接頭。它們的特點是連接效率高,有效庫率高。 PCR過程對於全庫來說是一個富集作用,保證有效文庫的濃縮,同時也可以引入雙端索引和UMI序列。
4.4 Tn5 適配器
Tn5接頭透過Tn5的限制性內切酶活性將部分接頭序列連接到DNA片段的兩端。它們使碎片化和接頭連接同時進行,以節省時間和樣品。最後透過PCR引入剩餘的linker序列、index、UMI以及其他序列,形成完整的文庫。它可用於建立剪切&標籤庫。
圖6 Tn5接頭文庫建置示意圖
5. 如何為您的定序平台選擇合適的NGS適配器?
目前,主流的定序平台有兩大:Illumina和華大智造。
就 Illumina 平台而言,Illumina NGS 適配器由
齊全且UDI的NGS轉接器,無需擔心耦合問題,適合追求簡單易用的客戶; CDI NGS 轉接器管子較少,體積較小,適合想要方便存放和攜帶的客戶。 PCR-free需要使用完整的NGS適配器。
對於 Illumina
管道 | 希夫NGS® 德NA 圖書館準備 384 CDI 引子(適用於 Illumina),第 1 組(8*12,96 個索引) | 12412ES |
希夫NGS® 德NA 圖書館準備 384 CDI 引子(適用於 Illumina),第 2 組(8*12,96 個索引) | 12413ES | |
Hieff NGS® RNA Lib Prep 384 CDI 引子(適用於 Illumina),第 1 組(96 個索引) | 12414ES | |
Hieff NGS® RNA Lib Prep 384 CDI 引子(適用於 Illumina),第 1 組(96 個索引) | 12415ES | |
在盤子裡 | Hieff NGS® Stubby UDI 引子試劑盒(適用於 Illumina)(1-384 索引)套裝 1-4 | 12407ES |
適用於 Illumina 的 Hieff NGS® Stubby UDI 引子試劑盒 集合1(96 孔板,1-96 索引) 集合 1 | 12327ES | |
適用於 Illumina 的 Hieff NGS® Stubby UDI 引子試劑盒 集合2(96 孔板,97-192 索引) 第 2 組 | 12328ES | |
適用於 Illumina 的 Hieff NGS® Stubby UDI 引子試劑盒 集合3(96 孔板,193-288 索引) 第 3 組 | 12329ES | |
適用於 Illumina 的 Hieff NGS® Stubby UDI 引子試劑盒 套裝4(96 孔板,289-384 索引) 第四組 | 12330ES |
對於MGI
希夫 新一代定序™ 適用於 MGI、Set1/Set2 的雙 UMI UDB 適配器套件 | 96 指數種類 | |
希夫NGS™ MGI 完整轉接套件, Set1/Set2/Set3(詢問) | 13360ES | 8 指數種類,41-48 |
13361ES | 16 指數種類,57-72 | |
13362ES | 96 索引種類,1-96 |
關於閱讀
NGS文庫建構中涉及的關鍵酶
關於NGS相關技術,你了解多少?
NGS中各類磁珠:DNA\RNA\mRNA磁珠
NGS文庫定量:快速且準確的Qubit還是精準的qPCR?