《誰說菜鳥不會數據分析》數據加工
數據加工
一、數據抽取:保留原數據表中某些字段的部分信息,組成一個新字段
- 字段分列:截取某一字段部分信息
- 字段合並:幾個字段合並為一個新字段
- 字段匹配:原數據表沒有但其他數據表有的字段,有效匹配過了
字段分列
(1)菜單法
選區域--數據--分列
根據格式特點,選擇合適的分隔符號
這與前面自文本導入數據的文本設置很相似。
(2)函數法
left(文本,左邊幾個)
right(文本,右邊幾個)
字段合並
方法一:&連接
方法二:函數concatenate(文本1,文本2,...)
字段匹配
VLOOKUP(要在區域的第一列中找到的值,包含搜索數據的單元區域,第一列的值是由第一項搜索的值,num,range_lookup)
num: 1,返回第一列的值。2.第二列的值
range_lookup: 1 近似匹配 2.精確匹配
VLOOKUP(查找目標,查找範圍,返回值的列數,精確0OR模糊查找1)
二、數據計算
1.簡單計算:加減乘除
2.函數計算
求平均值與總和sum(),average()
日期加減法
首先,了解如何輸入日期。
當前日期:年月日 today()
當前日期:年月日時分 now()
可以用day()函數對日期做計算
3.用函數DATEDIF計算
函數:DATEDIF(start_date,end_date,unit):返回兩個日期之間的年/月/日 間隔數
其中unit的格式有:
“Y" 時間段中的整年數,"M"整月數,”D“天數
”MD“返回天數差,忽略年和月
”YM“返回月數,忽略日和年
”YD“返回天數,忽略日期中的年
三、數據分組
vlookup函數
=VLOOKUP(A2,$D$2:$E$12,2,1)
為A2、A3……所在列在D2至E12範圍內查找。
模糊匹配,所以D列與A列的匹配上,但不能大於A列的數。
第三個參數是2,所以返回的 是D2至E12範圍內第二列裏的元素。
四、數據轉換
1.行列轉換(選擇性粘貼或Ctrl+Alt+V,選擇轉置)
2.多選題錄入數據方式之間的轉換
先介紹二分法和多重分類法
多重分類法轉換成二分法--公式法
三個選項在不同單元格:用hlookup、isnumber、if函數
假設這裏面要選3個,以第5行為例,客戶選了2 3 4,對應選項為BCD,因為多選題,所以無關順序,轉換成二分法,則要尋找是否有A,是否有B,...以此類推。所以,二分法表格,應該在每個選項下面設置公式,判斷客戶是否做了這個選項。
F5=IF(ISNUMBER(HLOOKUP(1,B5:D5,1,0)),1,0) :
HLOOKUP(1,B5:D5,1,0)在B5:D5找1,找到1所在列A列,再找1對應列的第一行數值,如果找到1,則返回1對應列的第一行數值,否則返回#N/A。
ISNUMBER(HLOOKUP(1,B5:D5,1,0))判斷HLOOKUP(1,B5:D5,1,0)是否返回數值,TRUE,則返回FALSE。把這個結果給if函數,最後判斷是否有1。
G5=IF(ISNUMBER(HLOOKUP(2,B5:D5,1,0)),1,0)
當多重分類法裏的選項全部都輸入在同一個單元格,則換一種方式做用search函數取代原來的hlookup函數
search函數的第一個參數是要找的數,如果找到,則返回那個數,否則就返回#value,因此也可以用於isnumber函數的判斷。上圖是這個方法的邏輯路線。從上到下對應函數嵌套的調用順序。
《誰說菜鳥不會數據分析》數據加工