1. 程式人生 > >《tableau資料視覺化實戰》第二章建立單變數圖表 Ashutosh Nandeshwar著學習總結

《tableau資料視覺化實戰》第二章建立單變數圖表 Ashutosh Nandeshwar著學習總結

第二章 建立單變數圖表

主要包括:表格、條形圖、餅圖、直方圖、線圖、堆積條形圖、箱線圖

1、表格可以為使用者提供詳細的資料資訊。其中儀表盤可以將表格和圖表融為一體。

2、條形圖:水平方向稱為“條形圖”,垂直方向稱為“柱狀圖”。條形圖長度代表一個特定度量的量,適用於分類資訊。

3、餅圖:很具有爭議。注意從12點鐘方向向右畫最大的分塊,然後在左邊畫第二大的分塊,最小分塊應接近於底部。這樣幫助使用者看到更大的塊,也更容易比較。不要使用三維餅圖,只會變得更糟糕。

4、直方圖:顯示的是度量的計數或密度,對度量進行離散化(分組)可以使計數變得更有意義。這種圖可以更好的觀察度量的分佈。

5、線圖:對於時間趨勢十分有效。但如果縮放比例、座標單元或者高寬比不合適,趨勢就會被誤解。圖表設計時橫軸時間單位很重要,一個小時為單位可能看起來波動很頻繁,但是以天、月為單位就不會。

6、堆積條形圖:相同欄位的不同分類畫在了彼此的最頂端。最大的問題在於除了堆積條形圖最低端的條形,其他條形的長度很難度量。若必須使用,數量限制在2-3個,以避免堆積失調。

7、箱線圖:即盒須圖。展示的是度量的分佈,這個分佈包括度量值的25%、50%、75%分位點以及最大值最小值。在盒子裡顯示25%、50%、75%四分位點的值,觸鬚上顯示最大值和最小值。

箱線圖

這組資料顯示出:

  • 最小值(minimum)=5

  • 下四分位數(Q1)=7

  • 中位數(Med--也就是Q2)=8.5

  • 上四分位數(Q3)=9

  • 最大值(maximum)=10

  • 平均值=8

  • 四分位間距(interquartile range)={\displaystyle Q3-Q1}=2 (即ΔQ)

在區間 Q3+1.5ΔQ, Q1-1.5ΔQ 之外的值被視為應忽略(farout)。

  • farout: 在圖上不予顯示,僅標註一個符號∇。

  • 最大值區間: Q3+1.5ΔQ

  • 最小值區間: Q1-1.5ΔQ

最大值與最小值產生於這個區間。區間外的值被視為outlier顯示在圖上.

  • mild outlier = 3.5

  • extreme outlier = 0.5

、用“〇”標出溫和的異常值,用“*”標出極端的異常值。相同值的資料點並列標出在同一資料線位置上,不同值的資料點標在不同資料線位置上。至此一批資料的箱形圖便繪出了。

統計軟體繪製的箱形圖一般沒有標出內限和外限。