1. 程式人生 > >16S rDNA分析中的qiime指令碼

16S rDNA分析中的qiime指令碼

16S是指16S rDNA(或16S rRNA),16S rRNA 基因是編碼原核生物核糖體小亞基的基因,長度約1542bp,包括9個可變區和10個保守區,保守區序列反映了物種間的親緣關係,而可變區序列則能反映物種間的差異。

qiime分為三大部分:
1.核心程式:uclust  ,pynast,blast等;
2.指令碼:check_id_map.py ,split_libraries.py(454測序)/split_library_fasta.py(ion torrent,illumina測序)等;
3.流程 :pick_open_reference_otus.py , core_diversity_analyses.py等。
資料處理 1.join_paired_ends.py  將pairend reads 連線起來 2.check_id_map.py 檢查建立的mapping.txt檔案有沒有錯誤 3.identify_chimeric_seqs.py 去除嵌合體 4.split_libraries.py 利用barcode分離樣品與資料過濾 5.count_seqs.py 統計檔案OTU聚類 1.pick_otus.py——從fasta檔案中提取OTUs,提取方法有cd-hit ,blast ,Mothur,usearch。 2.make_otu_table.py——將提取出的OTUs製作成out_table,即.biom檔案。
3.assign_taxonomy.py——使用reference中的reference_seqs和taxonomy檔案對序列分類。 4.biom add-metadata——將taxa資料加入到,biom檔案 biom summarize 統計otu biom convert 格式轉換多樣性分析 1.single_rarefaction.py——隨機抽樣 2.beta_diversity.py——beta分析 3.principal_coordinates.py——pCoA圖形化 4.alpha_diversity.py——alpha多樣性 5.summarize_taxa.py ——物種分類統計
系統發育分析 1.align-seqs.py 2.filter_alignment.py 3.filter_fasta.py 4.make_phylogeny.py繪圖類 make_emperor.py plot_taxa_summary.py beta_diversity_through.py categorized_dist_scatterplot.py make_2d_plots.py make_distance_boxplots.py make_distance_comparison_plots.py make_rarefaction_plots.py plot_rank_abundance_graph.py plot_semivariogram.py plot_taxa-summary.py quality_scores_plot.py summarize_taxa_through_plots.py