根據bed檔案重fasta檔案中獲取基因序列
第一次寫部落格,分享一個做的提取基因序列的程式,根據bed檔案裡的位置資訊從基因組裡提取序列
原始碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py
bed檔案通常用來儲存註釋基因資訊,BED檔案必須的3列:
- chrom - 染色體號
- chromStart - feature在染色體上起始位置(其實編號為0)
- chromEnd - feature在染色體上末尾位置(不包括此編號)
第四列是基因的名稱
還有些列想了解參考:http://genome.ucsc.edu/FAQ/FAQformat.html#format1
程式依賴 pyfasta模組(https://pypi.org/project/pyfasta/)
安裝pyfasta的命令:pip install pyfasta
相關推薦
根據bed檔案重fasta檔案中獲取基因序列
第一次寫部落格,分享一個做的提取基因序列的程式,根據bed檔案裡的位置資訊從基因組裡提取序列 原始碼地址:https://github.com/Liuyuan2018/fastaTools/blob/master/pyGetFasta.py bed檔案通常用來儲存註釋基因資訊,BED檔案必須的3列:
VS中獲取CPU序列號
//獲取CPU序列號char szCPUID[100];char szTmp[100];unsigned long s1 = 0, s2=0;int i=0;FILE* wF = NULL;__asm{mov eax, 01hxor edx, edxcpuidmov s1,
[原始碼和文件分享]根據PE檔案格式從匯入表中獲取載入的DLL並遍歷匯入函式名稱和地址
背景 瞭解 PE 檔案格式,對於做一些資料分析都是比較重要的基礎。在 PE 檔案格式中,理解匯入表以及匯出表的工作原理,又是重中之重。理解了 PE 格式的匯入表,就可以修改 PE 格式進行 DLL 注入,也可以修改匯入表實現 API HOOK 等。理解了 PE 格式的匯出表,可以不需要 WIN3
[原始碼和文件分享]根據PE檔案格式從匯出表中獲取指定匯出函式的地址
背景 瞭解 PE 檔案格式,對於做一些資料分析都是比較重要的基礎。在 PE 檔案格式中,理解匯入表以及匯出表的工作原理,又是重中之重。理解了 PE 格式的匯入表,就可以修改 PE 格式進行 DLL 注入,也可以修改匯入表實現 API HOOK 等。理解了 PE 格式的匯出表,可以不需要 WIN3
python獲取一個目錄下的檔案以及子檔案中的檔案
Python獲取資料夾下的檔案和子資料夾 這裡使用os.walk函式 關於函式該函式的介紹如下 os.walk(top, topdown=Ture, onerror=None, followlinks=False) 引數: top – 根目錄下的每一個資料夾(包含它自
從資料夾中獲取指定檔案的檔名
從資料夾中獲取指定檔案的檔名 有時候我們需要從資料夾中判斷一個指定的檔案是否存在,如果存在就返回檔名+字尾名,不存在返回空。前臺可以根據此判斷選擇性的進行圖片的展示情況。 前臺請求獲取響應的檔名 1.配置檔案內:配置路徑資訊 #圖片儲存路徑 本地磁碟C 下面的"XX資料夾"
C# 選擇檔案、選擇資料夾、開啟檔案(或者資料夾) 路徑中獲取檔案全路徑、目錄、副檔名、檔名稱 追加、拷貝、刪除、移動檔案、建立目錄 修改檔名、資料夾名!!
https://www.cnblogs.com/zhlziliaoku/p/5241097.html 1、選擇檔案用OpenDialog OpenFileDialog dialog = new OpenFileDialog(); dialog.Multiselect = true;/
python實現根據序列ID從提取fasta檔案序列
當序列少的時候,我習慣用 grep -A 1 -f seq.lst seq.fas | sed ‘/^–$/d’ > out.fas提取,但是這次遇到了一個大檔案,用grep就太費時了,然後又試了一下TBtools的提取序列功能,發現時間也很長,所以就寫了個python。提取將
Linux命令根據某一列對檔案內容去重
大家可能經常遇到檔案內容排序去重處理的事情,使用 linux 命令可以很方便的處理,sort 命令在處理檔案排序和去重中起著非常重要的左右,是檔案處理的利器。 比如有以下檔案內容: pythontab.com 1 2 3 4 5 6 7 8 9 10 11 12
Servlet(ServletContext配置全域性引數、ServletContext方法、屬性檔案中獲取資料庫連線引數)
通過ServletContext物件獲取資料庫全域性配置在web.xml中的連線引數的值 配置檔案web.xml中的程式碼 <!-- 這是全域性的資料庫連線引數配置 --> <context-param> <param-name>
Umbraco 中獲取一個media item的檔案路徑 file path
我們要使用UmbracoHelper, 這裡就需要用到我們在之前的blog裡面寫的UmbracoContext 參看這個blog https://www.cnblogs.com/wphl-27/p/9927044.html public clas
獲取指定目錄下,指定副檔名的檔案(包含子目錄中的),把這些檔案的絕對路徑寫入到一個文字檔案中。
題目: 獲取指定目錄下,指定副檔名的檔案(包含子目錄中的),把這些檔案的絕對路徑寫入到一個文字檔案中。 思路: 1.必須深度遍歷 2.要在遍歷的過程中進行過濾,將符合條件的內容儲存到容器中 3.對容器中的內容進行遍歷並將絕對路徑寫入到檔案中 程式碼: import java.io
JAVA中建立HTTP通訊,從伺服器上獲取HTML程式碼,通過HTTP請求來下載圖片或其他二進位制檔案的程式,下載結果要按下載到的檔案型別進行存檔中。
通過HTTP請求來下載圖片或其他二進位制檔案的程式,下載結果要按下載到的檔案型別進行存檔 將程式碼從伺服器的中獲取下來的程式碼,在我之前已經講過了這裡寫連結內容 這裡我們就直接將原始碼稍加改動,加入一個檔案並請將builder 寫入即可。 import
MapReducer中獲取輸入檔案路徑
正常情況: 在社群版的hadoop版本0.19/0.20中,當使用普通的輸入的時候,比如: job.setInputFormatClass(TextInputFormat.class); 在mappe
mapper.xml檔案中獲取最新插入資料的主鍵
在開發過程中,我們常常用到在插入資料時,需要得到剛插入的資料的主鍵,MySQL中有以下做法: 1、推薦使用 <insert id="addVehicleParam" parameterType="com.corp.dto.VehicleParamAddDt
根據URL網路地址伺服器檔案獲取檔案的MD5,簡單
由於公司需要校驗上傳的檔案是否有修改,本來是用檔案的最後一次修改時間確定的,不過怎麼獲取url內檔案的方式沒有用心去找,客戶端那邊也不使用這種了,改為使用讀取檔案的MD5,網上搜羅了一下,最後總結為以下程式碼,正常使用,不足的地方請指點。 path是url,http之類的。 匯入的包都
XML檔案遍歷實現中的下一節點獲取函式--近似深度優先
void CAupClass::AstNextNode(TiXmlNode *Cat) { if(NULL!=Cat->FirstChildElement()&&(beHindNode==Cat->PreviousSiblin
Java從檔案路徑中獲取檔名的幾種方法
Java從檔案路徑中獲取檔名的幾種方法 舉例:String fName =” G:\Java_Source\navigation_tigra_menu\demo1\img\lev1_arrow.gif ” 方法一: ? View Code
註冊登陸(從檔案中獲取使用者名稱密碼)
註冊(regedit.py) # -*- coding: utf-8 -*- #__author__:Selid #__date__:2018/12/21 name=input('請輸入使用者名稱').strip() pwd=input('請輸入密碼').strip() with open('acc
Shell中的檔案重定向
重定向指的是改變程式執行的輸入來源和輸出地點。 重定向標準輸出 cat file | sort 1 > sort.out cat file | sort >sort.out #這兩個命令等同 pwd >> path.o