1. 程式人生 > >bam(sam)格式檔案轉化為fasta格式

bam(sam)格式檔案轉化為fasta格式

bam2fasta的轉變方式:
samtools view input.bam | awk '{OFS="\t"; print ">"$1"\n"$10}' - > output.fasta

sam2fasta的轉變方式
cat *.sam | awk '{print ">"$1"\n"$10}' > *.fasta

檢視bam檔案 samtools view input.bam

bam檔案和sam檔案的轉換 samtools view 

bam檔案轉換為fastq檔案

bam2fastq --aligned input.bam -o output.fq

相關推薦

bamsam格式檔案化為fasta格式

bam2fasta的轉變方式: samtools view input.bam | awk '{OFS="\t"; print ">"$1"\n"$10}' - > output.fasta sam2fasta的轉變方式 cat *.sam | awk '{pri

reads count檔案化為fasta格式檔案(redundant reads)

從NCBI下載的測序資料很多是去過接頭的,並且整理成readscount格式,即每行第一列為reads,第二列為reads數,而我們需要把它整理成fasta格式,並且每個read都整理為一條序列 原始檔案: cat GSM3124755_WTB_PARE.csv | h

reads count檔案化為fasta格式檔案(uniq reads)

在NCBI下載測序資料時有很多是以reads序列 + count數的格式,這種是作者去完接頭並過濾掉低質量reads後的結果。下面實現將reads count格式轉化為fasta格式 cat reads_count.txt AAACCCGGGTTT 3 ACAAGATTAG

python 將yaml標籤檔案化為xml格式的標籤檔案

最近在跑SSD和Faster R-CNN深度學習程式碼,下載了一些資料集,但是這些資料集標籤檔案不是xml格式檔案,而是yaml檔案,雖然網上有線上轉化的工具,但是這種做法對我來說顯然是很低效率的。為了提高效率,自己寫了相關的程式碼。現在分享給大家。感謝Bosch Small

mp4格式檔案碼後處理qt-faststart工具介紹

當前很多工具能提供mp4格式的轉換輸出,但有時輸出的格式拿到網路上後發現需要完整下載後才能開始播放,而不能像網上的很多視訊那樣一開始就能播放(邊下邊放),造成這個問題的原因是一些描述mp4檔案資訊的moov atom元資料預設放置在了視訊檔案的最後,而所有的播放器(包括獨立的、網路化的——如瀏覽器)

pyinstaller使用.py檔案化為.exe檔案win8.1系統,Python3.6

pyinstaller使用(win8.1系統,Python3.6) 在使用pyinstaller前先要安裝該庫,具體安裝有pip方式、通過PyCharm 安裝等,可以在CSDN上搜索相關文章,這裡不做多餘贅述。 說明一下我的情況: Python安裝在E盤,.py

C#下實現RSA公鑰私鑰由pcks8格式java化為pcks1格式非java

對於Pcks不瞭解的可以先看下PKCS標準,然後這裡暫時只有pcks8格式轉化為pcks1格式,暫時還沒能找到直接通過BouncyCastle來轉化pcks1格式到pcks8格式的方法或程式碼(當然可以藉由RSACryptoServiceProvider來進行讀取,然後再進

:2018年教育部《關於面向中小學生的全國性競賽活動管理辦法試行檔案通知

----全文如下---- 關於面向中小學生的全國性競賽活動管理辦法(試行)   為規範管理面向中小學生(包含在園幼兒,下同)的全國性競賽活動,防止活動專案過多過濫,切實減輕中小學校(包含幼兒園,下同)、中小學生和家長負擔,維護正常教育教學秩序,根據中共中央辦公

PDF技術-Html/URLPDF檔案

由於Itext對html的轉化中,對css不是很支援,在對html進行轉化時,會發生樣式走樣的問題,這個問題任需要解決。 1)使用IText轉換 原理: 使用IText將HTML檔案轉化為PDF檔案 缺點: 對CSS樣式支援不是很好。 失真情況可能比較大 具體實

CAFFE之將圖片化為lmdb格式指令碼【直接執行版】內含生成train.txt和test.txt)

標籤: caffe 深度學習 作者:賈金讓 一.指令碼實現的功能 1.將訓練資料集轉化為lmdb格式; 2.將測試資料集轉化為lmdb格式; 3.生成mean.binaryproto檔案。 二.原理簡述 對於使用caffe的人來說,預處

利用python實現 CAD STEP格式化為STL格式--update 對整個資料夾下的所有檔案進行轉換格式

update # 匯入FreeCAD 路徑為FreeCAD安裝路徑,bin檔案裡有個檔案叫 FreeCad.pyd 這是關鍵 import sys sys.path.append('C:\\Software\\FreeCAD 0.17\\bin') import FreeC

caffe中將jpg資料化為lmdb格式檔案

Linux下caffe中如何將自己的jpg格式的圖片轉化為lmdb格式的檔案 本文利用caffe自帶的create_imagenet.sh檔案進行轉化,具體步驟如下。 1 資料準備 將圖片資料和標註分別放好 訓練資料放在train資料夾裡,測試資料放在v

[leetcode] Excel Sheet Column Title excel表格的數字字母表示格式 C語言實現

Given a positive integer, return its corresponding column title as appear in an Excel sheet. for example: 1 -> A 2 -

PE檔案格式和ELF檔案格式----PE檔案

Windows NT 3.1引入了一種名為PE檔案格式的新可執行檔案格式。PE檔案格式的規範包含在了MSDN的CD中(Specs and Strategy, Specifications, Windows NT File Format Specifications),但是

轉載bin檔案格式分析

xip 的 bin 檔案分析     一個bin 檔案在儲存上是按下面的結構儲存的      組成:標記(7)+Image開始地址(1)+Image長度(1)            記錄0地址+記錄0長+記錄0校驗和+記錄0內容(檔案內容)         記錄1地址+記錄1長+記錄1校驗和

Flume-ng生產環境實踐實現檔案sink,按照固定格式目錄輸出

package org.apache.flume.sink; import java.io.BufferedOutputStream; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; impor

鳥哥的Linux私房菜學習筆記Linux 檔案、目錄與磁碟格式 —— Linux檔案與目錄管理

4.檔案與目錄的預設許可權與隱藏許可權1) 檔案預設許可權:umaskumask 就是檢視或指定 『目前使用者在建立檔案或目錄時候的許可權預設值』[[email protected] ~]# umask[[email protected] ~]# umask -S查閱的方式有兩種,一種可以

Matlab Tricks—— 將 pgm 格式檔案轉換為 png 格式

clc; clear; close all; list = dir('./*.pgm'); % list 為結構體陣列 for i = 1:len

Linux 學習筆記 檔案系統中跳

1. 檔案系統樹結構 windows 分割槽 Windows 情況開始分析,硬碟會被分為多個分割槽(C 盤、D 盤 … ),每個分割槽之上會看到很多資料夾: Linux 分割槽 Linux 中分割槽不叫 C 盤、D 盤了,叫 sda1、sda2 … 但是檔案系

QT固定檔名格式化為TreeView在介面上展示檔案樹形目錄

獲得的檔案串格式: file1/1 - sss.txt|file1/bin.zip|file2/linpanhu.docx|qmake_vc.bat|send.zip| 思路:====>>> file1/1 - sss.txt file