1. 程式人生 > >《誰說菜鳥不會數據分析》數據加工

《誰說菜鳥不會數據分析》數據加工

字段 技術分享 三個參數 選擇性粘貼 單元 有效 返回 tro pan

數據加工

一、數據抽取:保留原數據表中某些字段的部分信息,組成一個新字段

  • 字段分列:截取某一字段部分信息
  • 字段合並:幾個字段合並為一個新字段
  • 字段匹配:原數據表沒有但其他數據表有的字段,有效匹配過了

字段分列

(1)菜單法

選區域--數據--分列

技術分享

根據格式特點,選擇合適的分隔符號

技術分享

技術分享

技術分享

這與前面自文本導入數據的文本設置很相似。

(2)函數法

left(文本,左邊幾個)

right(文本,右邊幾個)

技術分享技術分享

字段合並

方法一:&連接

技術分享技術分享

方法二:函數concatenate(文本1,文本2,...)

技術分享

字段匹配

VLOOKUP(要在區域的第一列中找到的值,包含搜索數據的單元區域,第一列的值是由第一項搜索的值,num,range_lookup)

num: 1,返回第一列的值。2.第二列的值

range_lookup: 1 近似匹配 2.精確匹配

VLOOKUP(查找目標查找範圍返回值的列數精確0OR模糊查找1)


二、數據計算

1.簡單計算:加減乘除

2.函數計算

求平均值與總和sum(),average()

日期加減法

首先,了解如何輸入日期。

當前日期:年月日 today()

當前日期:年月日時分 now()

技術分享技術分享

可以用day()函數對日期做計算

技術分享

3.用函數DATEDIF計算

函數:DATEDIF(start_date,end_date,unit):返回兩個日期之間的年/月/日 間隔數

其中unit的格式有:

“Y" 時間段中的整年數,"M"整月數,”D“天數

”MD“返回天數差,忽略年和月

”YM“返回月數,忽略日和年

”YD“返回天數,忽略日期中的年


三、數據分組

vlookup函數

技術分享

=VLOOKUP(A2,$D$2:$E$12,2,1)
為A2、A3……所在列在D2至E12範圍內查找。
模糊匹配,所以D列與A列的匹配上,但不能大於A列的數。
第三個參數是2,所以返回的 是D2至E12範圍內第二列裏的元素。

四、數據轉換

1.行列轉換(選擇性粘貼或Ctrl+Alt+V,選擇轉置)

2.多選題錄入數據方式之間的轉換

先介紹二分法和多重分類法

技術分享

技術分享

多重分類法轉換成二分法--公式法

三個選項在不同單元格:用hlookup、isnumber、if函數

技術分享

假設這裏面要選3個,以第5行為例,客戶選了2 3 4,對應選項為BCD,因為多選題,所以無關順序,轉換成二分法,則要尋找是否有A,是否有B,...以此類推。所以,二分法表格,應該在每個選項下面設置公式,判斷客戶是否做了這個選項。

F5=IF(ISNUMBER(HLOOKUP(1,B5:D5,1,0)),1,0)

HLOOKUP(1,B5:D5,1,0)在B5:D5找1,找到1所在列A列,再找1對應列的第一行數值,如果找到1,則返回1對應列的第一行數值,否則返回#N/A。

ISNUMBER(HLOOKUP(1,B5:D5,1,0))判斷HLOOKUP(1,B5:D5,1,0)是否返回數值,TRUE,則返回FALSE。把這個結果給if函數,最後判斷是否有1。

G5=IF(ISNUMBER(HLOOKUP(2,B5:D5,1,0)),1,0)

技術分享

當多重分類法裏的選項全部都輸入在同一個單元格,則換一種方式做用search函數取代原來的hlookup函數

技術分享

search函數的第一個參數是要找的數,如果找到,則返回那個數,否則就返回#value,因此也可以用於isnumber函數的判斷。上圖是這個方法的邏輯路線。從上到下對應函數嵌套的調用順序。

《誰說菜鳥不會數據分析》數據加工