1. 程式人生 > >巨集基因組分析流程

巨集基因組分析流程

  1. Illumina Hiseq PE150/250 測序

  2. fastx 進行原始序列統計 ==平臺==

  3. Seqprep 和Sickle進行質控後資料統計,基於原始測序資料,使用相應軟體對其進行資料質控,剪下掉資料中的低質量及含N的reads,獲得後續分析需要的高質量序列。
  4. BWA去宿主後資料統計,去除宿主汙染: Plants, Solanum_lycopersicum
  5. Multiple_Megahit 最短contig長度 ≥ 300 bp 拼接組裝與基因預測。通過相應的拼接軟體,選擇拼接效果最佳的序列,對結果進行ORF預測。選擇核酸長度大於等於100bp的基因,並將其翻譯為氨基酸序列。
  6. MetaGene通過相應的拼接軟體,選擇拼接效果最佳的序列,對結果進行ORF預測。選擇核酸長度大於等於100bp的基因,並將其翻譯為氨基酸序列。
  7. CD-HIT 基因序列聚類相似度(Identity)≥ 0.95 基因序列聚類覆蓋度 (Coverage)≥ 0.9。通過CD-HIT軟體對樣本預測出來的基因序列進行聚類,構建非冗餘基因集,得到非冗餘基因集基因的鹼基序列。
  8. SOAPaligner 最大/最小插入片段長度:500/300 bp 基因丰度計算相似度(Identity)≥ 0.95。針對SOAPaligner比對後的資訊,統計基因在各個樣本中的丰度資訊。
  9. Diamond 比對型別: blastp E-value ≤ 1E-5,NR物種註釋基於基因的物種分類學註釋,比對NR資料庫獲得樣本物種的分類學註釋資訊。

  10. COG功能註釋:Diamond 比對型別: blastp E-value ≤ 1E-5,比對EggNOG(evolutionary genealogy of genes: Non-supervised Orthologous Groups )資料庫獲得基因對應的COG註釋概況並進行統計

  11. KEGG功能註釋:Diamond 比對型別: blastp E-value ≤ 1E-5,比對KEGG(Kyoto Encyclopedia of Genes and Genomes)資料庫獲得基因對應的KEGG註釋概況並進行統計。
  12. CAZy碳水化合物活性酶註釋,hmmscan 比對型別: hmmer E-value ≤ 1E-5,比對CAZy資料庫(Carbohydrate-Active enZYmes Database)獲得碳水化合物活性酶基因註釋概況並進行統計。
  13. ARDB抗性基因功能註釋,Diamond 比對型別: blastp E-value ≤ 1E-5,比對ARDB(Antibiotic Resistance Genes Database)資料庫獲得抗性基因基因註釋概況並進行統計。
  14. CARD抗性基因功能註釋,Diamond 比對型別: blastp E-value ≤ 1E-5,比對CARD(Comprehensive Antibiotic Resistance Database)資料庫獲得抗性基因註釋概況並進行統計。
  15. VFDB毒力因子註釋,Diamond 比對型別: blastp E-value ≤ 1E-5,比對VFDB資料庫獲得毒力因子基因註釋概況並進行統計。

相關推薦

巨集基因組分析流程

Illumina Hiseq PE150/250 測序fastx 進行原始序列統計 ==平臺==Seqprep 和Sickle進行質控後資料統計,基於原始測序資料,使用相應軟體對其進行資料質控,剪下掉資料中的低質量及含N的reads,獲得後續分析需要的高質量序列。BWA去宿主後資料統計,去除宿主汙染: Pla

微生物組—巨集基因組分析專題培訓開課啦!10月北京

在廣大粉絲的期待下,《生信寶典》聯合《巨集基因組》在2018年10月19-21日,北京鼓樓推出《巨集基因組分析專題培訓》專題培訓第二期,為大家提供一條走進生信大門的捷徑、為同行提供一個巨集基因組分析學習和交流的機會、助力學員真正理解分析原理和完成實戰分析,獨創四段式教學(3天集中

2019微生物組—巨集基因組分析專題研討會

文章目錄 課程簡介 課程大綱 一、分析平臺搭建 二、生信基礎 三、圖表解讀和繪製專題 四、巨集基因組學概述 五、巨集基因組學有參分析流程 六、巨集基因組無參分析流程

微生物組——巨集基因組分析專題培訓開課啦!!!

在廣大粉絲的期待下,《生信寶典》聯合《巨集基因組》在2018年7月北京鼓樓推出《巨集基因組分析專題培訓》,大家提供一條走進生信大門的捷徑、為同行提供一個擴增子實戰分析學習和交流的機會、助力學員真正理解分析原理和完成實戰分析,獨創線下集中授課2天+自行練習5天+再

巨集基因組-擴增子分析流程:中文首發,史上最詳系,零基礎自學

本網對Markdown排版支援較差,請跳轉“巨集基因組”公眾號閱讀; 寫在前面 之前釋出的《擴增子圖表解讀》系列,相信關注過我的朋友大部分都看過了(連結直達7月文章目錄)。這些內容的最初是寫本實驗室的學生們學習的材料,加速大家對同行文章的解讀能力。

自己的簡單數據分析流程

抓取 八爪魚 取數 分析 select hdfs 抓取數據 navi art 1.八爪魚,抓取數據 2.八爪魚數據導入mysql(navicat連的虛擬機上的),表為an 3.給定mysql的表an自增id 4.開啟hadoop,yarn, 5.利用sqoop導入mysql

一般Web單元系統的分析流程和思路

一。Web 專案的思路 二。驗證流程: 我們來使用打點方式,驗證如上圖流程: 選擇一個專案: 在上圖中的邏輯步驟中打上斷點, 如下圖: 按照一般的web 流程先執行1 呼叫2,2 呼叫3 ,最後返回結果檢視。 spring 注入: 如下為驗證:

巨集基因組理論教程7挖掘微生物組生物標記

之前分享的加拿大生信網出品的《巨集基因組分析教程》,有1萬多位朋友閱讀,有近2000多小夥伴下載了課程PPT。 但不知有多少小夥伴真正仔細學習過。收藏是沒有用的,只有真正多學幾遍才有收穫。 對於英文原版教程,很多新人有看不懂,學不會的問題。巨集基因組團隊針對這套教程進了翻譯,同時

巨集基因組理論教程6巨集轉錄組

之前分享的加拿大生信網出品的《巨集基因組分析教程》,有1萬多位朋友閱讀,有近2000多小夥伴下載了課程PPT。 但不知有多少小夥伴真正仔細學習過。收藏是沒有用的,只有真正多學幾遍才有收穫。 對於英文原版教程,很多新人有看不懂,學不會的問題。巨集基因組團隊針對這套教程進了翻譯,同時

你想要的巨集基因組-微生物組知識全在這(180901)

徵稿、轉載、合作 文章分類導航目錄 精選文章推薦 培訓、會議、招聘廣告 科研經驗 軟體和資料庫 擴增子分析 巨集基因組分

NAR-2018-dbCAN2鑑定巨集基因組CAZYome碳水化合物相關基因

文章目錄 Science哈扎人CAZYome分析例項 例項解讀 分析方法探索(順藤摸瓜) dbCAN2——碳水化合物線上分析伺服器 dbCAN2簡介 線上分析 本地軟體

你想要的巨集基因組-微生物組知識全在這(181001)

文章目錄 徵稿、轉載、合作 文章分類導航目錄 精選文章推薦 培訓、會議、招聘廣告 科研經驗 軟體和資料庫 擴增子分析 巨集基因組分析 R統計繪圖 實驗設計與技

LDA EffectSize線上分析流程

LDA EffectSize 組間群落差異分析 分析網站: http://huttenhower.sph.harvard.edu/galaxy/ 線上分析流程 一、上傳資料 資料格式 二、開始Lefse分析

【ECG理論篇】(1)AI實現心律失常判別:心電基礎知識及利用演算法判別心律失常的分析流程

最近開始做一個新的專案,使用深度學習來優化傳統的心律失常預測演算法 因為自己也是初涉這個方向,所以學習開始的第一步就是了解背景知識。 基礎詞彙 心電圖(Electrocardiogram,ECG):指心臟在每個心動週期中,由起搏點、心房、心室相繼興奮,伴隨著生物電的變化,通過心電

OBS原始碼分析流程梳理

  OBS-Studio是一款非常好用的開源直播推流軟體,目前已經發布了很多個版本。但是目前都沒看到詳細或流程清晰的原始碼分析介紹。所以,本文以執行緒為單位對OBS的採集、編碼、傳輸流程進行梳理,一方面能夠使我自己更清楚OBS架構和執行流程,另一方面也能方便新手同學。整體的粒度不會太細,但已經能夠闡

RRBS甲基化分析流程

RRBS甲基化流程 分析流程 和普通的測序分析一致,首先fastqc質量檢測,接著對序列進行修剪,修剪後再質量檢測;如果質量檢測通過,則進行序列回帖,然後去除重複,計算甲基化程度,以及一些後續分析,本次後續分析使用R包methlykit以及edmr,還有其他一些甲基化分析軟體可以

臨床測序(WES, WGS)分析流程(一)基本流程+過濾

從指控->比對->BAM處理->call突變->合併gvcf都可參考我之前的GATK Germline Best Practivce 假設目前得到VCF test1.vcf(包含4個樣本,其中一個為CJ-258) Task1 提取CJ-2

surfaceflinger 導致的SWT 問題分析流程

首先檢查SWT 發生具體時間,檢查SYS_ANDROID_EVENT_LOG 搜尋Watchdog: 01-05 04:54:40.811   785  1160 I watchdog: surfaceflinger  hang. 檢查SYS_ANDROID_LOG 檔案

03 - springMVC架構分析-流程圖解

springMVC架構分析 前言 概述 1.總體-圖解 2. 流程概述 3.各元件概要 前言 上篇基礎入門篇, 只是一個最簡單的例子, 還有很多地方需要改進和學習,在下一步

QIIME 2:可重複、互動和擴充套件的微生物組資料分析流程

文章目錄 QIIME2:可重複、可互動、適用範圍廣和可擴充套件的微生物組資料科學 摘要 正文 圖1. 互動式視覺化工具 圖2. 迭代記錄資料來源確保分析可重複 程式碼可用 線上方法