資料分析之用Power Query實現資料轉換和清洗(功能操作篇)
一個案例快速瞭解Power Query
憑藉 Power Query,可以搜尋資料來源,建立連線,然後按照可滿足你需求的方式調整資料(例如刪除列、更改資料型別或合併表格)以建立報表。 例:將門店一&門店二兩個工作簿的資料整合到一張工作表,並統計出各銷售代表每個月的業績
資料的行列管理及刪除重複項
如下例所示:
資料格式的轉換及刪除錯誤
如下例所示,更改表格中標註黃色的異常單元格
*注意事項 1.大小寫:Power Query對英文字母的大小寫十分敏感,不能用大寫字母去找小寫字母,反之一樣 2.修整:在所選列的每個單元格中刪除前導空格和尾隨空格 使用“修整”功能時需注意,儘量不要對整張表格進行一次性修整,由於資料格式不同,容易出現報錯(文字格式下要) 3.清除:清除所選列中的非輸入字元(例如:回車) 4.新增字首/字尾:在所選列單元格的前/後增加指定的字元,類似於合併
資料格式的拆分、合併和提取操作演示
轉置和反轉
轉置:行列資料互轉
反轉行:第一行資料和最後一行資料的互換
透視和逆透視(二維和一維的轉換)
一維指僅有列標題的資料,二維指既有行標題又有列標題的資料 透視:一維轉二維 選中的列透視後會以行資料的形式出現
逆透視:二維轉一維
分組依據和新增列
如下例所示: 求出每個班組的人數,平均年齡,居住外地人數,大學生人數,平均滿意度
“新增列”功能下“自定義列”說明:
日期和時間的整理功能說明
如下圖所示:
持續時間:通過年限來提取
數學運算功能說明
如下圖所示:
追加查詢
用途:追加多份資料到一份資料中查詢,對錶格的縱向追加 要求多份資料的列標題名稱一致(匯出的資料以第一份資料的格式為準)
1.追加同一工作表的兩份資料到一份資料 如下例所示:
若列標題不一致,追加查詢後匯出的資料會新增一列不同名稱的列資料 如下例所示:
或者修改資料後重新匯入兩份資料
2.追加一個工作簿中多工作表的資料到一個工作表 如下例所示:
3.追加一個資料夾內多工作簿的資料到一個工作表 如下例所示:
*需要運用Power Query的M函式之一 =Excel.Workbook(目標) 作用:將Binary列內容轉換為Table列
4.追加一個資料夾內多CSV檔案到一個工作表
*也可用以下簡便方法追加多工作簿/多CSV檔案 如下例所示:
合併查詢
通過多張資料共有的欄位,將其他源資料的內容新增到一張工作表 是對錶格的橫向合併,類似於Excel的Vlookup函式 如下例所示: 將sheet1中三組資料合併,計算出各客戶不同產品的折扣金額