全外顯子測序(Whole Exome Sequencing, WES)僅對人基因組約 2% 的區域測序,便可覆蓋絕大多數基因的編碼序列和 > 99%(臨床基因組資源庫,ClinGen)的疾病相關區域。借助 WES 可檢測基因的點突變、小片段插入缺失、基因重排及拷貝數變異等信息。隨著測序成本的下降,其在基礎研究、遺傳病篩查、腫瘤分子診斷方面得到廣泛的應用。
文庫構建 |
封阻序列 |
靶向捕獲 |
測序平臺 |
NadPrep? NanoBlockers
(for Illumina?) |
Illumina? Systems |
||
MGISEQ / DNBSEQ? |
相關產品僅限研究使用,不用于臨床診斷。
圖 1. Exome Plus Panel v2.0 在MGISEQ-2000 和 Illumina NovaSeq 6000平臺的捕獲表現。利用 NadPrep? 系列建庫試劑盒進行文庫構建,搭配Exome Plus Panel v2.0進行雜交。
圖 2. Exome Plus Panel v2.0 對不同gDNA文庫的捕獲表現。利用 NadPrep? 文庫構建試劑盒(for MGI)建庫,MGISEQ-2000(PE100)測序模式,利用BWA比對到參考基因組 GRCh37/hg19,按照reads數計算。 A. 捕獲數據比對率均>99%,捕獲效率>92%;B. 捕獲數據均可達到 >99% 的區域覆蓋>0.2x平均測序深度;C. 覆蓋均一性和一致性表現無顯著差異; D. 不同GC含量區域覆蓋無偏好性。
注:人類男性基因組DNA(Promega-male, G1471);腫瘤結構變異5% gDNA標準品(菁良,GW-OGTM001);腫瘤SNV 1-25% gDNA標準品(菁良,GW-OGTM004);腫瘤SNV 野生型 gDNA 標準品(菁良,GW-OGTM005)。
WES 分析中,文庫構建和靶向捕獲步驟中有不少潛在“雷區”需要注意,躲過這些“雷區”才可能獲得穩定可靠的 WES 測序數據。以下是較常見的問題和考慮。
樣本起始量與質量是靶向測序分析的基石。尤其是對于低頻突變的準確檢測,足夠的原始拷貝數是先決條件。為保證足夠的樣本文庫分子進入全外顯子捕獲測序分析,我們推薦參考表 1,并根據實際的樣本情況來確定起始量。
表1. 全外顯子靶向測序樣本要求
|
要求 |
解決對策 |
樣本質量 |
DNA 無嚴重降解 |
FFPE 樣本來源的 DNA 常有不同程度的降解,需先對片段完整性進行評估。低質量樣本可采用修復試劑進行處理。 |
樣本純度 |
OD260 / OD280 = 1.8-2.0(無蛋白、RNA 污染)
OD260 / OD230 = 2-2.5(無有機物污染) |
使用蛋白酶 K 去除蛋白;RNA 酶去除 RNA;采用磁珠純化去除多余的鹽離子和有機物。 |
樣本起始量 |
gDNA(無嚴重降解)
FFPE DNA(片段長度 > 500 bp) |
gDNA ≥ 50 ng(取決于樣本質量)
FFPE DNA ≥ 100 ng(取決于樣本質量) |
在接頭連接步驟,我們推薦根據 Input DNA 及片段大小確定接頭用量。針對外顯子捕獲的文庫構建,推薦 DNA 樣本片段化范圍為 150 ~ 350 bp。常見接頭濃度為 15 μM;當 Input DNA ≥ 500 ng 時,適度增加接頭用量可以提高文庫產出量;當 Input DNA ≤ 25 ng 時,接頭應稀釋后使用。
我們建議根據樣本類型、片段化 Input DNA 和文庫預期產量調整 PCR 循環數,切忌文庫過度擴增。用于 WES 的 DNA 文庫,推薦通過循環數控制文庫產出至 600 ~ 1,000 ng,隨后單個文庫取 500 ng 進入雜交體系。外顯子捕獲測序的重要評價指標之一—重復率(Duplication rate),和擴增數有著直接關系:擴增數越多,因擴增產生的完全一致的文庫分子越多,測序數據重復率也相應增加,有效的測序數據量則被削減。
文庫的混雜是指多個樣本文庫混合進入單次捕獲實驗。相較于單個文庫捕獲,混雜后捕獲可有效提高生產速度、顯著節約成本?;祀s比(樣本進入雜交反應的文庫含量 / 該樣本的出庫總量)直接影響進入捕獲步驟的文庫豐度。過低的混雜比引入的測序數據的重復率(Duplication rate)較高,從而降低可用于分析的有效數據量。
此外,進行混合捕獲時,若期望多個文庫對應的測序數據量一致,則建議每個文庫等比混合;若根據不同的檢測目的,期望不同的數據量產出,則建議按比例混合進入雜交體系。
在進行人類全外顯子捕獲時,應根據測序平臺和文庫類型使用對應的封阻序列(表 2)以及封閉基因組重復序列的 Human Cot-1 DNA。以上組分可以降低接頭間和重復序列間的非特異性結合,進而降低脫靶率,提升有效的捕獲數據比例。
表2. 不同測序平臺推薦的封阻序列
測序平臺 |
封阻序列 |
MGISEQ / DNBSEQ? |
NadPrep? NanoBlockers (for MGI) |
Illumina? |
NadPrep? NanoBlockers (for Illumina?) |
在 NGS 雜交洗脫操作中,即使溫度發生了輕微改變,也會對外顯子捕獲的中靶率以及 GC 偏好性產生影響。測序數據中的 GC 偏好將直接影響捕獲數據的整體均一性。洗脫溫度的偏離,會導致極端 GC 含量區域捕獲的偏差或導致非特異性捕獲的增加。
我們建議依據樣本類型、混雜文庫總量和雜交時間調整外顯子 panel 捕獲后的擴增循環數,避免過度擴增。以 Exome Plus Panel 為例,在快速雜交(4h)和過夜雜交(16h)的情況下,推薦常規 gDNA 樣本按表 3 選擇擴增循環數。
表3. NadPrep?建庫體系推薦的WES捕獲后擴增循環數
雜交時間
1-Plex
(500 ng)
4-Plex
(2 μg)
8-Plex
(4 μg)
12-Plex
(6 μg)
MGISEQ / DNBSEQ?
4 h
12
10
9
8
16 h
11
9
8
7-8
Illumina?
4 h
10
8
7
6
16 h
9
7
6
5-6