1. 程式人生 > >Next generation sequencing (NGS)二代測序資料預處理與分析

Next generation sequencing (NGS)二代測序資料預處理與分析

Next generation sequencing (NGS)二代測序資料預處理與分析

By   | 2014 年 3 月 12 日 0 Comment

常使用的工具列表

  • 質量控制Quality Control:FastQC、Fastx-toolkit
  • 拼接Aligner:BWA,Bowtie, Tophat, SOAP2
  • Mapper:Tophat, Cufflinks
  • 基因定量 Gene Quantification: Cufflinks, Avadis NGS
  • 質量改進 Quality improvement: Genome Analysis Toolkit(GATK)
  • SNP: Unified Genotyper,Glfmultiple, SAMtools, Avadis NGS
  • CNV: CNVnator
  • Indel: Pindel, Dindel, Unified Genotyper, Avadis NGS
  • Mapping to a gene: Cufflinks, Rsamtools, Genomic Features

 相關的資料格式

  • FASTQ:
  • SAM: A generic nucleotide alignment format
  • BAM: binary format
  • VCF

 資料處理的流程

 

RNAseq資料不容易分析的原因:

  • 差異大,0~幾萬
  • 基因多
  • 巨大的變異
  • 樣本量小
  • 鑑定SNP可供借鑑的經驗

如果一個基因中SNP數目超過3個,10個鹼基中SNP數目超過2個,這樣的SNP就需要懷疑;
通過RNAseq、DNAseq鑑定SNP,有什麼區別?

本質沒有區別,但是RNAseq時,需要注意可變剪接造成的SNP。

參考資料:

http://boyun.sh.cn/bio/?p=1862