1. 程式人生 > >資料分析之用Power Query實現資料轉換和清洗(功能操作篇)

資料分析之用Power Query實現資料轉換和清洗(功能操作篇)

一個案例快速瞭解Power Query

憑藉 Power Query,可以搜尋資料來源,建立連線,然後按照可滿足你需求的方式調整資料(例如刪除列、更改資料型別或合併表格)以建立報表。 例:將門店一&門店二兩個工作簿的資料整合到一張工作表,並統計出各銷售代表每個月的業績

瞭解案例.gif-2849.3kB

資料的行列管理及刪除重複項

如下例所示:PQ行列管理.gif-2942.2kB

資料格式的轉換及刪除錯誤

如下例所示,更改表格中標註黃色的異常單元格

PQ格式轉換及刪除錯誤.gif-3482.4kB

*注意事項 1.大小寫:Power Query對英文字母的大小寫十分敏感,不能用大寫字母去找小寫字母,反之一樣 2.修整:在所選列的每個單元格中刪除前導空格和尾隨空格 使用“修整”功能時需注意,儘量不要對整張表格進行一次性修整,由於資料格式不同,容易出現報錯(文字格式下要) 3.清除:清除所選列中的非輸入字元(例如:回車) 4.新增字首/字尾:在所選列單元格的前/後增加指定的字元,類似於合併

資料格式的拆分、合併和提取操作演示

PQ資料合併拆分和提取.gif-3431.3kB

轉置和反轉

轉置:行列資料互轉PQ轉置.gif-883.2kB

反轉行:第一行資料和最後一行資料的互換PQ反轉行.gif-539.7kB

透視和逆透視(二維和一維的轉換)

一維指僅有列標題的資料,二維指既有行標題又有列標題的資料 透視:一維轉二維 選中的列透視後會以行資料的形式出現

PQ透視.gif-204.7kB

逆透視:二維轉一維

PQ逆透視.gif-188.5kB

分組依據和新增列

如下例所示: 求出每個班組的人數,平均年齡,居住外地人數,大學生人數,平均滿意度

PQ分組依據和新增列.gif-4127.7kB

“新增列”功能下“自定義列”說明:image_1cqnatmr5b6d134f12u44qh16a2q.png-42.7kB

日期和時間的整理功能說明

如下圖所示:日期.png-122.5kB

時間.png-100.6kB

持續時間:通過年限來提取

持續時間.png-99.8kB

數學運算功能說明

如下圖所示:計算.png-137.4kB

追加查詢

用途:追加多份資料到一份資料中查詢,對錶格的縱向追加 要求多份資料的列標題名稱一致(匯出的資料以第一份資料的格式為準)

1.追加同一工作表的兩份資料到一份資料 如下例所示:PQ追加.gif-4571.1kB

若列標題不一致,追加查詢後匯出的資料會新增一列不同名稱的列資料 如下例所示:

PQ追加-列名稱不同.gif-1239.4kB 或者修改資料後重新匯入兩份資料

2.追加一個工作簿中多工作表的資料到一個工作表 如下例所示:

PQ追加-多工作表.gif-12800kB

3.追加一個資料夾內多工作簿的資料到一個工作表 如下例所示:

PQ追加-多工作簿.gif-7464.1kB

*需要運用Power Query的M函式之一 =Excel.Workbook(目標) 作用:將Binary列內容轉換為Table列

4.追加一個資料夾內多CSV檔案到一個工作表

PQ追加-多CSV.gif-4446.5kB

*也可用以下簡便方法追加多工作簿/多CSV檔案 如下例所示:

PQ追加-簡便方法.gif-3624.6kB

合併查詢

通過多張資料共有的欄位,將其他源資料的內容新增到一張工作表 是對錶格的橫向合併,類似於Excel的Vlookup函式 如下例所示: 將sheet1中三組資料合併,計算出各客戶不同產品的折扣金額

PQ合併.gif-4267.7kB

合併查詢裡的聯接種類

聯接種類-1.png-65.8kB

案例之中國式排名

中國式排名.gif-2883.4kB

案例之分組中國式排名

分組中國式排名.gif-4126kB

案例之生成笛卡爾積表

笛卡爾積表.gif-3245.6kB

案例之多行屬性合併

多行屬性合併.gif-3491.7kB