Next generation sequencing (NGS)二代測序資料預處理與分析
阿新 • • 發佈:2018-11-09
Next generation sequencing (NGS)二代測序資料預處理與分析
By 0 Comment常使用的工具列表
- 質量控制Quality Control:FastQC、Fastx-toolkit
- 拼接Aligner:BWA,Bowtie, Tophat, SOAP2
- Mapper:Tophat, Cufflinks
- 基因定量 Gene Quantification: Cufflinks, Avadis NGS
- 質量改進 Quality improvement: Genome Analysis Toolkit(GATK)
- SNP: Unified Genotyper,Glfmultiple, SAMtools, Avadis NGS
- CNV: CNVnator
- Indel: Pindel, Dindel, Unified Genotyper, Avadis NGS
- Mapping to a gene: Cufflinks, Rsamtools, Genomic Features
相關的資料格式
- FASTQ:
- SAM: A generic nucleotide alignment format
- BAM: binary format
- VCF
資料處理的流程
RNAseq資料不容易分析的原因:
- 差異大,0~幾萬
- 基因多
- 巨大的變異
- 樣本量小
- 鑑定SNP可供借鑑的經驗
如果一個基因中SNP數目超過3個,10個鹼基中SNP數目超過2個,這樣的SNP就需要懷疑;
通過RNAseq、DNAseq鑑定SNP,有什麼區別?
本質沒有區別,但是RNAseq時,需要注意可變剪接造成的SNP。
參考資料:
http://boyun.sh.cn/bio/?p=1862