1. 程式人生 > >視覺化學習筆記5:形狀,大小和其他工具

視覺化學習筆記5:形狀,大小和其他工具

表示資料的其他方式

現在你應該能夠在視覺化圖表中熟練地使用顏色來表示值了。有時候,除了顏色之外,你需要顯示更多的資料。你可以使用不同的表示方式,例如在散點圖中使用不同形狀和大小的標記。下面我將介紹如何使用這些工具在一個圖表中展示更多的資料。

使用不同大小的標記

在製作散點圖時,你是用點(或者其他符號)來表示資料。通常,這些符號稱之為標記。值可以用標記的大小來表示。即,值越大點就越大。例如,請看之前的 GDP 與預期壽命示例,但是這次人口用不同標記大小來表示:

GDP 與預期壽命,用標記大小表示人口。

大的藍點很突出,表示的是中國和印度。美國是右側的大紫點。該圖表現在包含了很多不同的資訊。我們可以看到預期壽命隨著 GDP 增長而延長、各個國家位於世界的哪個地方、這些地點的相對人口。

注意事項

雖然我們可以從標記大小中得出大量資訊,但是並非很準確的表示方法。大小如何解讀模糊不清。我們應該對比標記的直徑還是面積?

無法確定是對比標記的面積還是直徑。

標記形狀

在散點圖中,資料還可以用標記的形狀來表示(折線圖也可以,如果裡面使用了標記的話)。例如,你可以用不同的符號(而不是顏色)來表示不同物種的鳶尾花:

使用標記來表示鳶尾花物種。

但是標記也存在一定的限制。看看當我在 GDP 與預期壽命圖表中嘗試使用標記表示地區時,會發生什麼情況:

GDP 與預期壽命,地區用標記形狀表示。

我在此圖中需要使用大量不同的標記。結果都混合在一起,與使用顏色表示地區相比,不夠清晰。當組數很小時,使用標記形狀來表示組。當標記形狀的數量變多時,就很難在圖中進行區分,整個圖都變得混亂不堪。

冗餘編碼

有時候,你需要強調資料的某個方面。在這種情況下,你可以使用兩種方法(而不是一種)來表示資料,這叫做冗餘編碼。下面是經濟合作與發展組織 (OECD) 國家/地區自 2000 年以來的失業率分佈圖。我使用了標記大小和顏色來表示國家/地區數量及各自的失業率。

經濟合作與發展組織 (OECD) 國家/地區的失業率。