隨著 NGS 的發展和測序成本的降低,其在病原體診斷中的應用也得到了日益推廣。然而,在 2019 年末開始爆發的新型冠狀病毒疫情中,NGS 測序技術的介入,極大的加速了病毒序列解析、溯源、疫苗和檢測試劑的研發等應用??梢哉f,NGS 技術在此輪戰“疫”中功不可沒。目前,全球新冠疫情依舊呈現緊張態勢,正如 James Hamblin 所述,進一步的病毒基因組分析必不可少,而 NGS 則是其中的關鍵。
將 NGS 常規化應用于病毒分析,其面臨的最大挑戰之一為:樣本中病毒核酸量是否充足。為了提高 NGS 數據中病毒序列的比例,研究人員一方面引入非序列特異性病毒富集技術,包括:超速離心、樣本過濾或病毒培養等,在進行樣本核酸提取前實現病毒顆粒的富集;另一方面通過 DNA 酶處理去除宿主 gDNA 或采用 rRNA 去除,降低樣本中的宿主核酸背景。盡管上述方法在一定程度上提高了病毒序列的比例,但常常需要大量的優化過程,且達不到理想的富集效果。與之相比,靶向富集技術基于病毒序列進行特異性富集,在降低宿主核酸背景的同時增加了對病毒基因組的覆蓋深度,可顯著提高對目標病毒的分析效率(圖1)[1-2]。
圖1. 病毒富集方案概覽。 A. 核酸提取前的病毒富集:樣本經離心或過濾后進行核酸提取,核酸酶處理去除宿主DNA或RNA,最后完成擴增和測序; B. 通過陰性(設計靶向非病毒的探針)或陽性(設計靶向病毒的探針)雜交捕獲方案富集病毒。
納昂達推出的 NanoRV Panel v1.0-Tech Access,以下簡稱 NanoRV Panel,是一款液相雜交靶向捕獲 Panel,可用于包含冠狀病毒在內的多種呼吸道病毒基因組的靶向富集(圖2)。
圖2. NanoRV Panel 探針組成。Panel 靶向人呼吸道病毒,涉及冠狀病毒(包含新型冠狀病毒)和其它呼吸道疾病相關病毒,如:流感病毒、副流感病毒、呼吸道合胞病毒、偏肺病毒、腸道病毒、鼻病毒、腺病毒和博卡病毒。
與擴增子測序相比,雜交捕獲技術具有更好的擴展性和更高的容錯度,這對 RNA 病毒檢測尤為重要。受 RNA 聚合酶保真性的影響,RNA 病毒易在復制過程中引入突變而產生變異株;冠狀病毒擁有長達 30 kb 的非分段基因組,更易發生突變或重組而呈現遺傳多樣性[3]。對 SARS-CoV-2 的進化追蹤提示,該病毒的突變正以 1~2 突變/月的速率累積,部分變異見于介導病毒進入宿主細胞的 Spike 蛋白編碼基因[4-5]。目前全球范圍內已有多個 SARS-CoV-2 變異株在傳播,最引人注目的是首見于英國的 B.1.1.7;另一種變異株 B.1.351 見于南非,其獨立于 B.1.1.7,盡管存在一些共同突變[6]。
面對 SARS-CoV-2 變異,基于擴增子的富集方案將被迫不斷改版升級,而雜交捕獲方案尚無需憂慮。對于單條 120 bp 的探針覆蓋區域而言,以目前觀測到的變異速度,要累積到超過探針容錯度的突變數量,平均需要數十年時間;此外,相鄰探針可以互相補充,即每條探針的靶標區域還有可能被相鄰的探針捕獲到(圖3)。
圖3. B.1.1.7 和 B.1.351 變異株在 Spike 蛋白編碼基因上的突變分布及 NanoRV Panel 對相關區域的覆蓋情況。
納昂達的 RNA 靶向捕獲測序整體解決方案結合 NanoRV Panel,為新冠病毒的追蹤性研究提供了一個有力的工具。下面以新冠病毒全長 RNA 質控品展示這一方案的整體捕獲表現。
圖4. 病毒基因組建庫流程及相關產品信息。
cDNA 合成 |
文庫構建 |
封阻序列 |
靶向捕獲 |
相關產品僅限研究使用,不用于臨床診斷。
樣本采用 COVID-19 RNA 質控品(菁良,GW-CRPM002),包含SARS-CoV-2 病毒全基因組和人源 RNA。取 20 ng input(包含 ~267 copy SARS-CoV-2 病毒全基因組),通過NadPrep?? Total RNA-To-DNA Module 進行逆轉錄,經 NadPrep?? DNA 通用型文庫構建試劑盒(for Illumina??)完成文庫構建。將靶向 7 個人源看家基因(7 housekeeping gene,HK7)的探針 spike-in 至 NanoRV Panel 后進行雜交捕獲。對看家基因的捕獲一方面可用于穩定實驗及測序數據量,另一方面可作為內參指示病毒含量。完成單次或二次靶向捕獲后進行上機測序,測序數據以salmon v1.2.0 分析,統計各部分 reads 占比。僅當 reads 比對到 SARS-CoV-2 或 7 個看家基因時計為中靶;比對到 rRNA 或其它轉錄本的 reads 視為脫靶。
(1) 中靶率
單次捕獲的中靶率為 56.3%;二次捕獲基本清除了 rRNA,中靶率提高至 99.5%。
圖5. 單次捕獲或二次捕獲對中靶率的影響。
(2) RNA 相對豐度
SARS-CoV-2 及 7 個人源看家基因的豐度在單次捕獲或二次捕獲數據中呈一致性趨勢。
圖6. 單次捕獲或二次捕獲后,SARS-CoV-2 及 7 個人源看家基因的豐度。
(3) 覆蓋深度及均一性
> NanoRV Panel 對 SARS-CoV-2 基因組的覆蓋較均一,99% 以上的區域達到 0.2x 平均覆蓋深度。二次捕獲提高了測序數據的利用率,但對病毒基因組的覆蓋均一性受輕微影響。
圖7. 單次捕獲或二次捕獲后,SARS-CoV-2 基因組的覆蓋均一性。
考慮到病毒拷貝數通常較少,實際應用時可依據時效優先或有效數據量優先的原則分別選擇單次雜交捕獲或二次雜交捕獲。納昂達提供全面的 RNA 病毒靶向捕獲測序解決方案可實現對 SARS-CoV-2 和其他多種呼吸道病毒基因組的穩定覆蓋。
[1] O'Flaherty, Brigid M., et al. Comprehensive viral enrichment enables sensitive respiratory virus genomic identification and analysis by next generation sequencing. Genome research 28.6 (2018): 869-877.
[2] Kumar, Arvind, Satyapramod Murthy, and Amit Kapoor. Evolution of selective-sequencing approaches for virus discovery and virome analysis. Virus research 239 (2017): 172-179.
[3] Li, Bei, et al. Discovery of bat coronaviruses through surveillance and probe capture-based next-generation sequencing. Msphere 5.1 (2020).
[4] https://www.sciencemag.org/news
[5] Santos, Jadson C., and Geraldo A. Passos. The high infectivity of SARS-CoV-2 B. 1.1. 7 is associated with increased interaction force between Spike-ACE2 caused by the viral N501Y mutation. bioRxiv (2021): 2020-12.
[6] https://www.nytimes.com