高通量測序技術(也稱為二代測序技術)迅猛發展,已逐步廣泛應用于基因檢測的多個方面的臨床服務,其對于單核苷酸多態性和小于50bp的插入或缺失變異檢測相對比較準確,但是大的結構變異檢測卻非常困難。另一類以不經過擴增的單分子測序和長讀長為標志的DNA測序技術也隨即問世,這類測序技術被稱為第三代測序技術。
一、前言
當前,高通量測序技術(也稱為二代測序技術)迅猛發展,已逐步廣泛應用于基因檢測的多個方面的臨床服務,其對于單核苷酸多態性(single nucleotide polymorphism,SNP)和小于50bp的插入或缺失(Insertion-Deletion,InDel)變異檢測相對比較準確,但是大的結構變異檢測卻非常困難。同時,另一類以不經過擴增的單分子測序和長讀長為標志的DNA測序技術也隨即問世,這類測序技術被稱為第三代測序技術。因其測序時DNA分子無需PCR擴增,實現了對每一條DNA分子的單獨測序,也稱為單分子測序技術。
二、技術平臺
Helicos公司于2008年推出了世界上第一款單分子測序平臺HeliScope,但其讀長較短(35bp),系統整體測序錯誤率較高(5%)。之后出現了單分子的長讀長測序技術,目前長讀長測序是指單分子測序長度不少于 KB 級別測序讀長的技術平臺。目前已經實現商業化的長讀長測序平臺主要有Oxford Nanopore Technologies的納米孔測序平臺(Nanopore)和PacBio的單分子實時(SMRT)測序平臺。
(一)單分子實時測序技術(SMRT)
美國太平洋生物公司(Pacific Biosciences,PacBio)開發的三代測序技術稱為SMRT測序(Single Molecule Real-Time Sequencing),該技術建立在兩項重要的發明基礎之上,從而攻克了測序領域測序讀長短的重大難題。第一,零模波導孔技術(Zero-mode Waveguides,ZMWs)使激發光被限定在單分子納米孔底部一定范圍內,過濾了背景噪音。第二,熒光基團結合在核苷酸的磷酸基團上,幫助DNA聚合酶完成一個全天然的DNA鏈合成過程。
基于該原理的具體產品有PacBio Sequel測序儀、PacBio Sequel II測序儀。PacBio Sequel測序儀是首個商業化應用的第三代測序技術平臺,其打破傳統短讀長測序諸多技術瓶頸。PacBio Sequel II測序儀是PacBio Sequel的升級款,可提供CLR Library和CCS library(HIFI)兩種測序模式。測序芯片上的導孔(ZMW)由100萬個提升至800萬個,理論通量提升8倍。CCS reads單堿基準確性有了極大提升,同一片段測序4次后,單一read的準確性可達99%。
(二)納米孔單分子測序技術(Nanopore)
納米孔單分子測序是基于電信號測序的技術,原理是通過電場力驅動單鏈核酸分子穿過納米尺寸的蛋白孔道,由于不同的堿基通過納米孔道時產生了不同阻斷程度和阻斷時間的電流信號,由此可根據電流信號識別每條核酸分子上的堿基信息,從而實現對單鏈核酸分子的測序。由于其原理與其他平臺有較大差異,亦有被稱為第3.5代或四代測序技術。
Nanopore測序儀的具體產品種類很多,均為基于Nanopore芯片來搭建的平臺,大到由多個芯片陣列組成的PromehION、GridION系列測序儀,小到可以連接手機的Type C、電腦USB的MnION系列便攜式測序儀。其中PromethION是一款高通量、高樣本數的臺式系統,基于模塊化設計(多達 48 個測序芯片,各有多達 3,000 個納米孔通道,總計達 144,000 個),測序芯片既可單獨也可同時運行,尤其適合于大樣本量、具有龐大數據量的項目。
(三)第三代測序平臺特點比較
這兩類第三代測序平臺均具有長讀長、無GC偏好性及可直接檢測甲基化修飾等優點。相較而言,納米孔單分子測序技術讀長更長,可達到Mb級別;MnION測序儀如手機大小,較為便攜;單分子實時測序技術(SMRT)平臺,無錯誤偏好,可通過增加數據糾錯以提高測序準確性。具體的比較如下表所示:
三、應用方向的探索
目前長讀長測序的三代測序平臺,已廣泛應用于復雜動植物基因組、微生物基因組、全長轉錄組、微生物群體研究及人類基因組變異檢測等領域的科研項目中,以解決這些科研領域檢測技術瓶頸的問題。
在疾病檢測方面,三代測序基于其單分子檢測與長讀長測序的特點,在基因組結構變異、短串聯重復/微衛星 、單體型分析 、真假基因區分 、甲基化檢測等相關的檢測中具有獨到的優勢。例如,目前許多基于高通量測序技術的基因診斷產品已基本成熟;但因二代測序技術存在讀長短、對基因組覆蓋不均勻等局限,對SNVs和 InDels檢測尚可,對復雜結構變異的檢測無能為力。第三代測序技術用于遺傳病及腫瘤基因的檢測,憑借長讀長、無PCR、無 GC 偏好性等優勢,進行長片段序列測定,可以檢測缺失、重復、倒位、易位等結構變異(>50bp),可進一步提高疾病的檢出率,彌補二代測序技術對結構變異檢測的不足。
四、小結
長讀長測序的三代測序平臺,較二代測序將讀長提升了萬倍,但由于錯誤率、成本及樣本要求都較高,算法、軟件、數據庫等配套的技術需要研發等問題,目前尚處于科研項目應用階段。針對這些問題,各技術平臺也不斷優化技術以解決問題,例如PacBio測序儀的HIFI技術模式可有效提高數據準確性,納米孔測序平臺也通過對PromethION進行設備上的升級以提高準確度。
隨著三代測序平臺的不斷發展,其未來在醫學領域的轉化應用,可以有效彌補目前基于結構變異、短串聯重復/微衛星 、單體型分析等變異的基因相關疾病的檢測手段的空白。