1. 程式人生 > >視覺化圖表入門教程講解

視覺化圖表入門教程講解

資料視覺化,即通過圖表形式展現資料,幫助我們快速、準確理解資訊。好的視覺化會“講故事”,能向我們揭示資料背後的規律。

本文主要介紹常見圖表的資訊表達特徵和適用場景,幫助大家瞭解如何在不同的場景下選擇合適的圖表,從而幫助我們更清晰的傳遞資訊。(注:正文中所有圖表的製作所使用的工具為Yonghong Z-Suite)

圖表基礎元素

一張圖表至少包含:標題、橫縱座標軸、資料系列、資料標籤、圖例等部分,每一部分都在圖表中扮演特定的角色、表達特定的資訊。

視覺化圖表的兩個概念

1. 維度(Dimension)

如地區、性別、職業等,常常是觀察資料的角度,往往是橫座標。特徵為類別型欄位、一般是離散的、不可進行四則運算。

2. 度量/指標(Measure)

如UV、PV、客單價、活躍使用者數,資料的統計值衡量,往往是縱座標。特徵為數值型欄位、一般是連續的、可進行四則運算

視覺化圖表型別詳解 1. 折線圖“家族”

折線圖作為資訊最明瞭的圖表,是各種圖表中最容易解讀的圖表,以下是它的幾種變種:

  • 基礎折線圖

例如圖3所表示的是:某公司4.01-5.20日期間新增使用者數的變化趨勢,其中標記了兩個運營的重要事件,分別是“應用市場投放開始”和“應用市場投放停止”。從折線圖中我們可以發現,新增使用者在應用市場投放後增長明顯提升,並且帶動了停止投放後的自然新增。

圖3:基礎折線圖

面積大小對應該類別數值大小,反映不同類別佔比關係及其時間趨勢變化。

以圖4為例,顏色代表不同渠道,面積的大小來表示新增使用者,以時間來展示趨勢變化。從圖4中可看出AppStore和360手機助手為該產品下載量Top1、2的渠道。然而它的缺點是:由色塊面積來表示數值大小不夠直觀。

2. 柱形圖“家族  

圖5:累加柱形圖

與堆積面積圖相比,堆積面積圖比累加柱形圖多一時間維度,它可表達時間維度上的趨勢變化。主要運用於多個指標進行對比分析的場景,但類別物件不宜過多,當超過5個,不適合使用此圖表。

圖6是某醫院的科室患者和醫生人數對比圖。從圖中可以發現在所有科室中,內科醫生為醫生數最多的一個科室,而兒科中的患者數是最多的,說明每個醫生需要服務到更多的患者。

圖6:多指標柱形圖

單一指標柱形圖,必須按照數值大小降序排列,從而提升條形圖的閱讀體驗。當對比物件類別>5時,將多指標柱形圖更改為單指標的條形圖,能有效提高資料對比清晰度。

圖7:單一指標柱形圖

瀑布圖的核心是按維度/指標下鑽分解,如公司收入各用途分解、公司年利潤按分公司分解、業績按銷售團隊分解等。

例如圖8為某公司去年收入成本的分解,從圖中可以看到花費最多的為倉儲費用,以此來判斷是否有需要降低的費用,從而來提升淨利潤。

圖8:瀑布圖

背離式條形圖比單一指標條形圖的優勢在於:多增加了一個對比維度以及雙尾關注(正數第一、倒數第一)。當資料指標有正負對比、前後對比、左右對比概念時候,可以選擇背離式柱形圖。如:進出口貿易值對比、某業務的前後變化對比、人為構建的均值差異等。

圖9:背離式條形圖

柱形圖結合折線圖,通過對比多個指標,使得一個圖表可以表現兩個層次的資訊。

圖10:柱形圖結合折線圖散點圖適合用於發現變數間的關係與規律。用於觀察兩個指標的關係。

圖11:基礎散點圖,在基礎散點圖上新增一個指標:用氣泡大小來表示。

例如圖12中,氣泡大小表示在職時間。從圖中可以看出,當人均接待數>7的時候,在職時間長的員工2分鐘內的回覆率較高。

圖12:氣泡圖

環狀圖是由兩個及兩個以上大小不一的餅圖疊在一起,挖去中間的部分所構成的圖形,與餅圖本質上沒有任何差別。

圖13:環狀圖

餅圖小結: 1)一般來說,數值最大的部分排在最前面,也就是12點鐘方向順時針;

2)餅圖的細分項不宜過多,一般不超過8項;

3)不要製作三維的餅圖,不直觀;

4)切忌將餅圖拉得過開,若要突出某一塊,可單獨將其拉開。

5. 其他圖表

雷達圖可以直觀地呈現幾個觀察物件在多個指標上對比情況,但需要保證雷達圖的指標代表正負傾向一致。需要注意的是:雷達圖的線條不超過5條,衡量指標不要超過8個。