1. 程式人生 > >根據bed檔案重fasta檔案中獲取基因序列

根據bed檔案重fasta檔案中獲取基因序列

第一次寫部落格,分享一個做的提取基因序列的程式,根據bed檔案裡的位置資訊從基因組裡提取序列

原始碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py

bed檔案通常用來儲存註釋基因資訊BED檔案必須的3列:

  1. chrom - 染色體號
  2. chromStart - feature在染色體上起始位置(其實編號為0)
  3. chromEnd - feature在染色體上末尾位置(不包括此編號)

  第四列是基因的名稱

  還有些列想了解參考:http://genome.ucsc.edu/FAQ/FAQformat.html#format1

程式依賴 pyfasta模組(https://pypi.org/project/pyfasta/)

安裝pyfasta的命令:pip install pyfasta