GO註釋檔案中多行變兩列和兩列變多行
test_Gene2GO.txt
ChrSy.fgenesh.gene.10GO:0003676 ChrSy.fgenesh.gene.12GO:0003676, GO:0004523, GO:0015074 ChrSy.fgenesh.gene.14GO:0004674, GO:0005509, GO:0005515, GO:0005524, GO:0006468, GO:0016021, GO:0030247 ChrSy.fgenesh.gene.17GO:0003676, GO:0004190, GO:0006508, GO:0008270, GO:0015074 ChrSy.fgenesh.gene.21GO:0004672, GO:0006468 ChrSy.fgenesh.gene.22GO:0003676, GO:0004523, GO:0015074 ChrSy.fgenesh.gene.26GO:0006508, GO:0008234 ChrSy.fgenesh.gene.27GO:001602
轉換一列變多行
- 方法①
test <- read.table("test_Gene2GO.txt", sep = "\t", header = F) library(tidyverse) test %>% separate_rows(V2, sep = ",")
- 方法②
## install.packages("splitstackshape") ## install_github("mrdwab/splitstackshape", ref = "devel") ## 不知道為什麼我都不能安裝好, 最後下載到本地安裝好的 library(splitstackshape) test %>% cSplit(., "V2", ",", 'long')

多行變兩列
- 方法①
aggregate(test1, by = list(test1$V1), c) %>% transmute(Gene = .$Group.1, GOid = .$V2)

-
方法②
還有許多簡單的命令。。。只是能解決就好了。
附帶小驚喜
- https://smach.github.io/R4JournalismBook/HowDoI.html
-
這個網站收集很多常用功能的函式
image.png
-
- 然而這圖中又有小驚喜 Practical R for Mass Communication and Journalism , 沒錯,這是剛出版的書籍, 這本書可讀性高。
image.png