1. 程式人生 > >bed文件格式解讀

bed文件格式解讀

pan wikipedia ans dia art nbsp core for 文件格式

1)BED文件

BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一個格式 ,提供了一種靈活的方式來定義的數據行,以用來描述註釋信息。BED行有3個必須的列和9個額外可選的列。每行的數據格式要求一致(見下圖)。 每條線的字段數目必須是任意單條數據的在註釋上一致。

技術分享圖片

BED文件結構:
-------------------------------------------------------------必須有以下3列------------------------------------------------------------------------


chrom :即染色體號
chromStart :即feature在染色體上起始位置 。在染色體上最左端坐標是0
chromEnd :即feature在染色體上的終止位置。例如一個染色體前100個堿基定義為chromStart=0, chromEnd=100, 跨度為 0-99.
----------------------------------------------------------------可選9列-------------------------------------------------------------------------------
name :feature的名字 ,在基因組瀏覽器左邊顯示;

score :在基因組瀏覽器中顯示的灰度設定,值介於0-1000;

技術分享圖片
strand :定義鏈的方向,‘‘+” 或者”-”
thickStart :起始位置(例如,基因起始編碼位置)
thickEnd :終止位置(例如:基因終止編碼位置) 
itemRGB :是一個RGB值的形式, R, G, B (eg. 255, 0,0), 如果itemRgb設置為‘On”, 這個RBG值將決定數據的顯示的顏色。
blockCount :BED行中的block數目,也就是外顯子數目
blockSize:用逗號分割的外顯子的大小, 這個item的數目對應於BlockCount的數目


blockStarts :用逗號分割的列表, 所有外顯子的起始位置,數目也與blockCount數目對應

2)和gff之間的關系


4) 參考資源

https://en.wikipedia.org/wiki/BED_file_format

bed文件格式解讀