朋友發來一個word檔案,裡面的資料沒有分割,想分割後放到excel統計
通常遇到這種資料,首先想到每一列資料有沒有什麼特徵
類似這種資料,一種辦法是按位數擷取,mid函式,或者按第一次出現數字的方式來擷取MID(A2,1,MIN(SEARCH({0,1,2,3,4,5,6,7,8,9},A2&"0123456789"))-1)
RNA transport 33 ko03013
Ribosome 43 ko03010
mRNA surveillance pathway 16 ko03015
Ribosome biogenesis in eukaryotes 22 ko03008
Epstein-Barr virus infection 26 ko05169
Proteasome 9 ko03050
Ubiquitin mediated proteolysis 18 ko04120
Spliceosome 26 ko03040
然後,excel裡有個分類彙總的功能,但是不太好用,我還是習慣扔到mysql裡拿sql語句來groupby
但這次以csv格式匯入mysql,沒有按照逗號導進去,只好再按照逗號分隔,再groupby了。。
SELECT A.id ,SUM(A.num) FROM (
SELECT SUBSTRING_INDEX(id, ',', 1) AS id ,SUBSTRING_INDEX(id, ',', -1) AS num FROM groupby
) A
GROUP BY A.id