1. 程式人生 > >為什麽UCSC上的基因坐標和ncbi上下載的基因坐標不一樣?

為什麽UCSC上的基因坐標和ncbi上下載的基因坐標不一樣?

發現 原因 後臺 都在 對比 bsp 下載 fse 平移

剛剛從發ncbi的後臺下載了一套hg19的註釋文件gff格式的,和ucsc上下載的refseqgene註釋進行了對比,發現一個奇怪的問題: 同一個轉錄本的起始坐標相差10000.

花了一上午的時間對比了下才發現,原來ucsc上的基因組序列都在序列上前後各添加了10000個N.

然後又檢查了genecode的基因組,也是前後各添加了10000個N. ncbi提供的hg38也是如此。

原因找到了,不過用的時候確實需要註意。也就是說在整理註釋信息的時候,如果需要添加N則需要對坐標進行平移。

為什麽UCSC上的基因坐標和ncbi上下載的基因坐標不一樣?