1. 程式人生 > >用power bi進行資料建模

用power bi進行資料建模

2018年07月04日 09:07:26 黃小技術包 閱讀數:1397 標籤: Power BI視覺化效果資料建模 更多

l  建模

通常情況下,你將會連線到多個數據源以建立報表,且需所有資料協同工作。 建模就是實現這一點的辦法。

若要建立不同資料來源之間的邏輯連線,需建立一種關係。 資料來源之間的關係使 Power BI 能夠了解表與表之間的關係,以便能建立有趣的視覺物件和報表。 本部分對關係作出瞭解釋,甚至還說明了如何在不存在任何關係的情況下建立關係。

l  如何管理資料關係

Power BI 允許你以可視方式設定表或元素之間的關係。 若要檢視資料的圖表檢視,請使用關係檢視

(位於報表畫布旁螢幕的最左側)。

關係檢視中,你可以看到表示各個表的資料塊,它們之間的表列和錶行就是表示的關係。

新增和刪除關係非常簡單。 若要刪除關係,右鍵單擊它並選擇刪除。 若要建立關係,拖放想要在表格之間建立連結的欄位。

若要隱藏報表中的表格或單列,在關係檢視中右鍵單擊它,然後選擇在報表檢視中隱藏

有關你的資料關係的更詳細檢視,請選擇開始選項卡中的管理關係。 這將開啟管理關係對話方塊,該對話方塊將你的關係顯示為列表而不是直觀的關係圖。在此處,你可以選擇自動檢測以查詢新的或更新資料中的關係。 選擇管理關係對話方塊中的編輯,以手動編輯你的關係。 你也可以在該位置找到高階選項以設定關係的基數

交叉篩選方向。

基數的選項有*多對一*和*一對一*。 *多對一*是維度型別關係事實,例如一張銷售表,每種產品都具有多行資料,與之匹配的是一個表格,在唯一行中列出了所有產品。 *一對一*通常用於連結引用表格中的單個條目。

預設情況下,關係將設定為在兩個方向上交叉篩選。 只在一個方向交叉篩選限制了關係中的某些建模功能。

設定資料之間的準確關係讓你能夠在多個數據元素間建立複雜的計算。

l  建立計算列

建立計算列是一種用於豐富並增強資料的簡單方法。 計算列是通過對以下計算進行定義而建立的新列:轉換或合併現有資料的兩個或多個元素。例如,可以通過將兩列合併為一列來建立新列。

建立計算列的一個有效原因

是,當沒有可用於建立關係的唯一欄位時,在表格之間建立關係。當在 Power BI Desktop 中建立簡單的表格視覺物件時,缺少關係會變得明顯,並且所有條目都將獲得同樣的值,而你知道基礎資料是不同的。

若要使用具有唯一欄位的資料建立關係,例如,當資料中存在“區號”和“本地電話”列時,你可以通過將兩者的值合併建立新的“完整電話號碼”計算列。 計算列是用於快速建立模型和視覺化效果的有用工具。

若要建立計算列,請在報表畫布的左側選擇 Power BIDesktop 中的資料檢視

在“建模”選項卡中,選擇新建列。這將在你可以使用 DAX(資料分析表示式)語言輸入計算的地方啟用公式欄。 DAX 是一種功能強大的公式語言(Excel 中也有),它可以生成可靠的計算。 在鍵入公式期間,Power BI Desktop 會顯示匹配的公式或資料元素來幫助並加速公式的建立。

在輸入表示式期間,Power BI 公式欄將提供特定的 DAX 函式和相關資料列建議。

一旦在每個表中都建立了計算列,它們便可以用作關係鍵來建立它們之間的關係。 轉到關係檢視,你便可以將欄位從一個表拖動到另一個表來建立關係了。

返回報表檢視,你現在將看到各區的值都不同。

還有可以通過建立計算列執行的各種其他操作。

l  優化資料模型,獲得更好的視覺物件

匯入的資料通常包含報表和視覺化任務中實際不需要的欄位,原因是它為額外資訊,或者此資料已在其他列中可用。 Power BI Desktop 提供一些工具,可用於優化資料、使其更利於建立報表和視覺物件,以及檢視共享報表。

Ø  隱藏欄位

若要隱藏 Power BI Desktop 的欄位窗格中的某列,請右鍵單擊它,然後選擇隱藏。如果此欄位已在現有視覺化物件中使用,則資料仍位於該視覺物件中,且你仍可在其他視覺化物件中使用此資料,隱藏的欄位僅不在欄位窗格中顯示。

若在關係檢視中查看錶格,則隱藏的欄位將通過灰顯進行表示。 同樣,其資料仍然可用且仍是模型的一部分,只是隱藏不可見而已。通過右鍵單擊該欄位並選擇取消隱藏,可隨時取消隱藏已隱藏的任何欄位。

Ø 按其他欄位對視覺化資料進行排序

建模選項卡中提供的按列排序工具對於確保資料按預期順序顯示非常有用。

舉一個常見的例子,包括該月名稱的資料預設按字母順序排序,因此比如“八月”顯示在“二月”之前。

此情況下,解決此問題的方法是在欄位列表中選擇欄位、再從建模選項卡中選擇按列排序,然後選擇要排序的欄位。本例中,“MonthNo”類別排序選項按預期對月份進行排序。

另一種優化資訊以使其正確處理的方式是設定欄位的資料型別。 若要從報表畫布中更改資料型別,請在欄位窗格中選擇該列,然後使用格式下拉選單選擇其中一種格式設定選項。任何已建立且顯示此欄位的視覺物件均將自動更新。

l  建立度量值並使用基於時間的函式

度量值 是存在於你的 Power BI 資料模型中的一種計算。 要建立度量值,在報表檢視中從建模選項卡選擇新度量值

DAX最大優勢之一是它有很多有用函式,特別是關於基於時間的計算,如*本年截止到現在*或*同比*。 你只需使用 DAX 定義一次時間度量值,然後從資料模型中按照你所需數量的不同欄位來劃分它。

在 Power BI中,定義的計算稱為*度量值*。 若要建立*度量值*,從主頁選項卡中選擇新建度量值。 此操作將開啟公示欄,你可以在其中輸入定義度量值的 DAX 表示式。 鍵入時,在輸入計算過程中,Power BI 會建議相關的 DAX 函式和資料欄位,並且你還將得到解釋語法和函式引數的工具提示。

如果你的計算很長,則通過鍵入 ALT-Enter,你可以在表示式編輯器中新增額外的換行符。

建立新的度量值後,它將出現在螢幕右側的欄位窗格中一個表格中。 Power BI 會將新的度量值插入到當前你選中的表格中,不管度量值處在資料的什麼位置,你都可以通過選中此度量值,並使用主頁表下拉選單,輕鬆地移動它。

你可以像使用其它任何表格列一樣使用度量值:只需將它拖放到報表畫布或視覺化效果欄位中。 度量值還可與切片器無縫整合,快速分割資料,這意味著你只需定義一次度量值,然後就可將其用於不同的視覺化效果。

計算 DAX 函式是一個功能強大的函式,它可實現各種型別的有用的計算,對於財務報表和視覺物件尤為有用。

l  建立計算表

計算表是 DAX 的一個功能,可用於表達一眾新增建模功能。例如,如果你希望進行不同型別的合併聯接或以函式公式的結果為基礎建立隨即變化的新表,使用計算表可以達到此目的。

要建立計算表,請轉到 Power BI Desktop 中的資料檢視

從“建模”選項卡選擇新建表,以開啟公式欄。

在等號的左側鍵入新表的名稱,在右側鍵入要用於形成該表的計算。 完成計算後,新表將顯示在模型的“欄位”窗格中。

建立後,即可像使用任何其他表的關係、公式、報表那樣使用計算表。

l  瀏覽基於時間的資料

使用 Power BI 分析基於時間的資料非常容易。 Power BI Desktop 中的建模工具自動包括一些生成欄位,在這些欄位中,你可通過一次單擊深化到年份、季度、月份和日期。

當你在報表中使用日期欄位建立表格視覺化效果時,PowerBI Desktop 將自動包括按時間段分解的資訊。 例如,Power BI 會自動將日期表中的單個日期欄位分為年、季度、月和日,如下圖中所示。

視覺化效果預設在*年*級別顯示資料,但是你可以通過開啟視覺物件右上角的向下鑽取來更改它。

現在,當你單擊圖表中的條幅或線段時,它將深化到時間層次結構的下一級別,例如從*年*到*季度*。

你可以繼續深化,直到到達層次結構的最精細級別,在本例中即為*天*。 若要在時間層次結構中逆向移動,請單擊視覺物件左上角的向上鑽取

你還可以深化視覺物件上顯示的所有資料,而非只是所選欄位,方法是使用鑽取全部雙箭頭圖示,它也位於視覺物件的左上角。

只要你的模型具有日期欄位,Power BI 就會為不同的時間層次結構自動生成不同的檢視。

若要返回單個日期(而不是使用日期層次結構),只需右鍵單擊“欄位”列中的列名稱(在下圖中,列名稱為“*InvoiceDate*”,然後從顯示的選單中選擇列名稱,而不是選擇“日期層次結構”。

然後,你的視覺物件會顯示基於該列資料的資料,而無需使用日期層次結構。 需要返回以使用日期層次結構?沒問題!只需再次右鍵單擊並從選單中選擇“日期層次結構”。