1. 程式人生 > >微生物組學研究手段概覽2——巨集基因組和巨集轉錄組

微生物組學研究手段概覽2——巨集基因組和巨集轉錄組


原創: 林二狗  宇宙實驗媛  

巨集基因組

巨集基因組測序是將環境總DNA提取出來,隨機打斷成300/500bp的小片段,然後在片段兩端加入通用引物進行PCR擴增測序,然後對測序資料進行質控,再將高質量序列拼接,根據資料庫參考資訊,對基因序列進行預測和功能註釋,最終獲得重要的巨集基因組資訊,如序列組成(GC含量、基因組大小等)、物種組成、功能組成和群落特徵等。

 

相比於16S擴增子測序,巨集基因組測序能夠使物種鑑定深度達到“種”,而前者往往只能達到“屬”的級別。另外,基於16S擴增子測序的基因預測結果(預測方法請參見往期內容“微生物組學研究手段概覽——擴增子測序”)是依據資料庫中的參考序列得到的,巨集基因組測序則提供了菌群實際的基因資訊。所以,如果不考慮經費的限制,巨集基因組測序是能夠更準確地研究微生物組及其功能的方法。

 


 

1. 巨集基因組學研究的生物資訊工作內容(doi: 10.1371/journal.pcbi.1002808)。

 

 

 


 

2. 巨集基因組資料處理的基本流程和需用軟體(有具體操作需求的同學可以通過下面網址下載英文相關教程https://github.com/TGAC/361Division/tree/master/Metagenomics 2015)

 

 


 

1. 測序公司提供的基於巨集基因組測序資料的標準分析內容

 

 

 

 

目前很多研究都聚焦在人體腸道微生物組的巨集基因組學研究,期望從中挖掘出多種疾病的因果關係。已經採集到的樣本來自不同國家、遺傳背景、生活習慣、身體狀況的人群。同時,環境微生物的巨集基因組學研究也在如火如荼地開展中。相比於宿主樣本,環境樣本(如水體、土壤等)中存在大量未知或不可培養的微生物,這些微生物有很多是尚未被鑑定或者深入研究的。巨集基因組測序直接研究環境中的總DNA,為開發新的生物活性物質、發現新的基因和物種、研究特定環境中微生物群落結構與功能的關係(功能網路與互作)、微生物對環境變化的響應與反饋(比如,農耕土壤質量的惡化與恢復)、微生物群落的演替與進化、微生物區域分佈與生物地理學等開闢了一條新的途徑,為解釋和解決一些重大農業和環境問題提供重要依據。

 

 

 

 


3. NCBI Sequence Read Archive鳥槍法巨集基因組測序資料的增長(doi: 10.1016/j.cell.2016.08.007

 

Nature文章例項

Crits-ChristophDiamond等人20186月發表於Nature的文章為例。研究人員用巨集基因組測序的方式,從草地土壤樣本中獲得了376株細菌基因組,的基因組序列,發現了完全新穎的生物合成基因簇,並描述了它們的基因組學、系統發育學和生態學狀況。他們共鑑定出了1599個生物合成基因簇(biosynthetic gene clusters),推測這些基因簇可能合成非核糖體多肽、聚酮化合物等,很多非核糖體多肽合成酶(NPRS)和聚酮合成酶(PKS)都能夠合成抗生素、抗真菌素、嗜鐵素或免疫抑制劑,所以該研究中著重關注這兩類基因簇(圖4),以期發現新的抗生素和藥用化合物。

 

 


4. 樣本中提取到的基因組和其生物合成基因簇的情況差異展示。a,幾個菌門的平均相對丰度。b,生物合成基因簇在幾個菌門之間的分佈,不同顏色代表由antiSMASH(用於生物合成基因簇的分析;http://antismash.secondarymetabolites.org)推測的產物型別c,研究鑑定到了240NRPSPKS(根據酶結構域的組成差異分為型、型和型)和NRPS-PKS混合型基因簇,以及86個可能不完整的基因簇。儘管這些基因含量水平各異,但是由於這些酶具有保守的結構域,因此他們的生物合成途徑是可識辨的。d,生物合成基因簇的網路圖,連線代表兩端具有共有基因,共有基因所佔比例越大連線越粗、顏色越深。由該圖可知,VerrucomicrobiaAcidobacteriaRokubacteria中存在不同且稀疏的NRPSPKS系統,而多數稀有型NRPS基因簇之間的距離較為疏遠。在RokubacteriaAcidobacteria的一支中保守的型PKS基因簇形成了一個密集的網路叢集,高度的保守性可能意味著一類新的代謝物的廣泛分佈。

 

 


 

 

5. Acidobacteria中的生物合成NRPS/PKS基因簇。Acidobacteria中發現了兩個幾乎含有完整NRPPKS基因簇的基因組,它們分別被命名為Candidatus Eelbacter (Eelbacter_gp4_AA13)Candidatus Angelobacter (Angelobacter_gp1_AA117)。通過對Acidobacteria基因組中核糖體蛋白序列進行系統發育學分析,發現兩個基因組均進化出獨特的生物合成操縱子(5a)Candidatus Angelobacter基因組中含有多種抗生素合成蛋白、一種細菌素合成簇、型和型分泌系統的多基因操縱子元件和一些含有RHS重複結構的大蛋白;Candidatus Eelbacter基因組包含6個長度超過45kb的複合型NRPS-PKS混合型基因簇(5b)

 


巨集轉錄組

巨集轉錄組測序是指從整體水平上研究某一特定環境、特定時期群體生命全部基因組轉錄情況以及轉錄調控規律的研究手段。它以生態環境中的全部RNA為研究物件,提取環境微生物群落中的全部轉錄本,進行高通量測序和生物資訊學分析,與巨集基因組研究相輔相成,能夠很好地揭示覆雜微生物群落的變化,有效地擴充套件微生物資源的利用空間。

 

 


6. 巨集轉錄組分析簡化流程(doi: 10.1007/s00253-018-8976-7

 

 

 


2. 測序公司提供的基於巨集轉錄組測序資料的標準分析內容

 

 

Nature文章例項

還是同一篇文章,結合巨集轉錄組測序和Kallisto量化分析發現,在133個差異表達的NRPSPKS基因簇中,共檢測到198NRPS/PKS基因的表達。在4個微生物門類中均檢測到了NRPSPKS的表達,並且酸桿菌門有84個活性基因簇產生了表達。本文還檢測了Candidatus Eelbacter10個生物合成基因簇(含11NRPS/PKS結構域基因)和Candidatus Angelobacter25個生物合成基因簇(含25NRPS/PKS結構域基因),發現7個基因組中有10NRPS/PKS基因簇在24h修正試驗過程中,表現出時間依賴性。

 

Candidatus Angelobacter中有5個生物合成基因簇與多種感知、響應環境的基因具有共表達模型,如ToB(嗜鐵素攝取受體)MacB(大環內酯轉運物)pbp(青黴素結合蛋白)16s rRNA MT(16s rRNA甲基轉移酶)gvp(氣泡蛋白)(7c)Angelobacter多個基因簇的生物合成基因表達是同步的,表明這些基因能夠協同響應生態競爭。此外,Acidobactera_gp22_AA4Gemmatimonadetes_AG49也具有多個重要的共表達基因,如rsb X/R/S(應激響應調節操縱子)vgb(維及黴素同源酶B)ToB(7c)

 


 

7. 生物合成基因的巨集轉錄組。在添加了底物後12-24hCandidatus Angelobacter基因組中幾個基因簇的基因表達水平顯著升高(7a),並且一些生物合成基因的表達與核心核糖體基因的表達不一致(7b)。表明Candidatus Angelobacter能夠對水和基質的新增產生響應,並且在核心代謝基因的表達量上升數小時後單獨調控次級代謝產物合成相關基因的表達。從基因共表達模型來看,7個基因組中有4個發生了顯著的次級代謝基因共表達富集(p0.05)(7c)。

 

簡單來說,巨集基因組能夠說明菌群“能做什麼”,而巨集轉錄組則是“要做什麼”。尤其是在不同取樣時間點之間和實驗條件處理前後,巨集轉錄組往往會發生明顯變化,據此可以建立菌群功能與影響因子之間的關聯性。後面我們還會介紹表徵菌群“做了什麼”和“做出了什麼”的研究方法,敬請關注。

 

(部分定義源自網路)