1. 程式人生 > >"資料視覺化”看這篇文章就夠了

"資料視覺化”看這篇文章就夠了

管理者先要了解基本原則:何時需要柱狀圖圖?顏色超過多少種會太花哨?圖例往哪放?Y軸是否從0開始?視覺化的“語法”重要且有用,但掌握語法並不能保證做出好圖表。視覺化的第一課,是學會在沒有戰略的情況下去實踐——準備開啟目的地未知的旅程。

視覺傳達不是一個孤立的行為,而是幾個連續的事件,分別需要不同的計劃、資源和技能。我們需要一種思考方法,來從整體上認識日益重要的視覺傳達科學。

兩個基本問題:資訊性質和傳達目的

開始學習視覺化思維,首先要思考視覺傳達的性質和目的:

我要傳達的資訊是概念還是資料?

我在陳述某事還是探索某事?

如果你能回答這兩個問題,就可以安排所需資源和工具,並分析哪類視覺化能最有效地達成目標。

第一個問題相對簡單,答案一般很明顯。你想呈現的要麼是定性資訊,要麼是定量資訊:理念或資料,兩者必居其一。但要注意,這裡問的是資訊本身,而不是你最終採取的視覺傳達形式。例如,著名的技術成熟度曲線採用了線狀圖這一傳統的資料表達形式,但並不包含實際資料——它傳達的是概念。
如果第一個問題是關於你掌握哪類資訊,第二個問題則確定你要怎麼做:或是傳達資訊,即陳述;或是分析某事,即探索。管理者最常用陳述方法,一般是在正式場合向觀眾傳達資訊。如果你想利用手中的大量資料報告每季度銷售情況,你的目的就是陳述。

但假設老闆想知道為什麼最近銷售表現不佳。你猜測可能是因為季節性波動,但不能肯定。於是,視覺化的目標變為探索:利用同樣的資料,你要用圖表來證實或否定你的假設。如果假設被證實,你可以再做陳述型圖表,告訴老闆,“銷售出現問題的原因在這裡”。

實際上,以探索為目標的視覺化有兩種。其中一種是上面例子中的假設檢驗。但假如你對銷售業績下滑的原因毫無頭緒,提不出任何假設呢?你就要仔細分析資料,尋找其中的規律、趨勢和異常。例如,對比銷售業績和銷售員負責區域面積,你有何發現?不同地區的季節性波動有何異同?天氣對銷售造成哪些影響?這種開放性探索能帶來新發現。開放性視覺探索,將有助於解答巨集觀的戰略問題,如收入為何下降、效率如何提升、客戶與公司應如何互動等。

視覺化的四種類型

根據上述兩個基本問題的答案,我們可以用一個四象限圖來定義視覺傳達的四種類型:

概念描述、創意挖掘、視覺探索、日常資料視覺化。

1概念描述視覺化的4種類型
這一象限可以說是“諮詢顧問專區”。諮詢顧問免不了和各類圖表打交道,而圖表可以利用容易理解的符號(樹、橋)和形狀(圓圈、分層),來傳達複雜的概念。組織結構圖和決策樹就是典型的概念描述型圖表,眼前這個概括性的四象限圖也是。

以描述概念為目標的視覺設計必須簡潔清晰;但由於必須使用符號,常會出現過度美化的問題。因為概念本身並不包含資料的性質和範圍,它們必須單獨表示出來。

這類視覺傳達的重點是結構和邏輯的清晰度,最重要的技巧與編輯文章所需的要領類似,即抽象概括事物本質。設計技巧也會有用,你可以自己動手或請人來做。

假設一家企業請諮詢顧問來幫助研發團隊從其他行業尋找靈感。諮詢顧問使用“金字塔搜尋”方法,即從鄰近領域開始,通過接力層層向外拓展,找到不同領域的頂尖專家。

由於解釋起來比較繁瑣,諮詢顧問可以運用視覺化方法。金字塔搜尋的原理是什麼?如下圖所示:

橫縱軸的設定使圖表非常容易理解:行業從左到右跨度增大,專業程度從下到上逐漸提高;金字塔形狀顯示出頂尖專家相對普通從業者的稀缺性;標題中的“攀登”“金字塔”幫助讀者迅速理解圖表含義;最後,設計者沒有做過多修飾——沒有真的用三維立體、沙石色的圖形。

很多時候,概念描述的視覺化效果沒這麼好,你會得到下面這樣的圖表:

這張圖中的顏色分層、陰影和3D效果反而妨礙我們理解概念;箭頭並沒有展現金字塔搜尋方法;頂尖專家和普通從業者處在同一水平線,未能傳達出重要性的差別。

2創意挖掘視覺化的4種類型

管理者可能不會想到,視覺化也可以用於創意挖掘;但在頭腦風暴中,視覺化方法其實無處不在——白板、牛皮紙,以及傳說中的餐巾紙背面。和概念描述一樣,創意挖掘也使用符號,但更多是在非正式場合,如外出團建、戰略討論和創新專案早期階段等。它的目標是從不同視角觀察企業運作,解答覆雜的管理難題,如架構調整、設計新業務流程、構建決策體系等。

創意挖掘可以一個人進行,但協作的效果更好。可以借鑑設計思維:先儘可能多地徵集不同思路和視覺化方法,再擇其一進行精細打磨。

喬恩·科爾科(Jon Kolko)是奧斯丁設計學院(Austin Center for Design)創始人兼院長,著有《同理心設計原理》(Well-Designed: How to Use Empathy to Create Products People Love)。他在辦公室的白板牆上塗滿觀念化、探索性的圖形。“思考複雜問題時,我們總會回到這個方法,”他說,“通過塗塗畫畫,我們能夠穿越混亂,到達明晰。”擅長領導團隊、發起頭腦風暴、鼓勵創新思考並捕捉創意的管理者,在這個象限中會幹得不錯。設計技巧和提煉能力在這裡不那麼重要,甚至可能適得其反:在尋求突破時,最不需要的就是歸納總結,而應儘可能快速發散;精細的設計同樣會拖慢速度。

假設一個營銷團隊正在討論如何向管理層展示進入高階市場的戰略。一小時後,白板上有了幾個想法。團隊最終認可了其中一個,認為最能傳達他們的理念——顧客數量減少,但人均消費大增。白板是這樣的:

當然,創意挖掘過程中產生的圖表,通常經過更嚴謹的設計,用於在正式場合傳達理念。

3視覺探索視覺化的4種類型

這個象限可能最為複雜,因為它包含兩類視覺化。上文將探索分為兩類,一是假設檢驗,一是從資料中尋找規律、趨勢和異常。前者的目標很明確,後者則相對發散。資料體量越大、複雜度越高、未知因素越多,探索工作的開放性就越高。
視覺探索1:求證。在這類探索活動中,你要回答下面兩個問題中的一個:我設想的情況是否屬實?如何用不同方式傳達這一資訊?

在進行求證時,資料範圍相對可控,所使用圖表型別較為常規;當然,若想以新穎方式呈現資訊,也可嘗試較少見的圖表。求證型圖表一般不用於正式場合;你要先自己找到正式展示所需的圖表。因此,你的時間不應花在設計上,而應快速嘗試不同模板,找到最好的資料視覺化方案;電子表格技巧、程式設計或網站搭建等快速開發原形的知識可能有幫助。

假設一位營銷經理認為,在一天中的某些時段,消費者線上購買移動裝置多於臺式裝置,但現有營銷策略未能利用這一點。為驗證自己的觀點,他將一些資料輸入到線上軟體Datawrapper中。

他還無法證實或推翻假設,也沒有發現其他規律,但他利用工具尋找不同視覺表達。他無需考慮設計問題,速度很快。如下圖所示,他將柱狀圖變為線狀圖。
現在他發現了一些規律,但使用三個變數還難以把握兩類產品銷量的關係,於是他將變數減為兩個(如下圖)。每次嘗試,他都會評估初始假設的有效性——在一天中的某些時段,消費者購買移動裝置多於臺式裝置。
第四次嘗試中,他縮短了時間週期,證實了假設(如下圖)。
新的軟體工具使這類視覺化比以前容易很多,讓我們都變成資料分析師。

視覺探索2:開放性探索。更多時候,針對資料的開放性探索是資料科學家和商業智慧分析師的領地,不過新出現的工具讓一般管理者也可以參與進來。開放性探索很值得嘗試,因為它經常帶來獨一無二的洞見。

由於缺少明確目標,開放探索型圖表包含的資料範圍較廣,個別情況下可能會容納多組資料,或建立自動更新資料的動態系統,也可用於統計建模。

管理者可通過調整引數、引入新資料來源、迭代更新圖表,進行互動性探索。複雜資料有時也可用於專業性、不常見的圖表,如力導向圖(用於表示網路結構)和地形圖等。

此處,圖表的功能重於形式:資料分析、程式設計、資料管理和商業智慧比圖表的觀賞性更重要。在這一象限,管理者自然最需要請外部專家搭建資料處理系統,並根據分析目標製作圖表。

安默爾·加格(Anmol Garg)是特斯拉的一名資料科學家,他利用視覺探索分析特斯拉電動車的海量感測器資料。他設計了一種互動式圖表,用於顯示在特定時間內的輪胎壓力變化情況。加格和團隊嚴格按照探索形式設計出圖表,發現其用處很多:瞭解車輛出廠時輪胎充氣情況、使用者充氣頻率、使用者對氣壓不足警報的反應時間;分析輪胎漏氣率;建立模型預測輪胎漏氣時點。散點圖顯示出四個輪胎的壓力情況,一般人或許不明所以,專家則一目瞭然。

在探索資料的過程中,加格發現一些資訊只能用圖表傳達。“我們時刻都在和海量資料打交道,”他說,“對照電子表格搜尋資料庫肯定一無所獲,必須使用圖表。”向管理層演示時,加格將探索型圖表轉化為較簡單的圖表(下文將介紹)。“他們最喜歡看圖。”他說。

4日常資料視覺化視覺化的4種類型

大部分視覺探索工作由資料科學家承擔,而管理者最常做的是日常資料視覺化。這一象限主要涉及常用圖表,一般可在展示中直接使用。這些簡單圖表包括 線狀圖、柱狀圖、餅狀圖和 散點圖等。

這裡的關鍵詞是“簡潔”。一幅圖表應該用有限幾個變數,清晰傳達一個資訊。目標很明確:為聽眾確認並介紹背景資訊。要做到簡潔,設計十分關鍵。此類圖表常用於正式展示,對清晰度和邏輯性要求很高。正式展示通常時間有限,如果圖表設計不理想,介紹人就必須停下來解釋,而圖表中的資訊本應一目瞭然。如果日常資料圖表還需要額外說明,那它就是失敗的,如同笑點需要解釋的笑話。

這並不是說陳述性圖表不應引發討論,但討論應針對圖表傳達的理念,而非圖表本身。

假設一位人力資源副總裁要向高管層介紹公司的醫療開支情況。她想表達的是,醫療開支增速明顯放緩,因此公司有機會投資多種醫療服務。

她在網上讀到一篇相關報告,其中引用了一些官方資料,於是,把資料下載下來,用Excel做成線狀圖,幾秒鐘就完成了。但由於要做展示,她請公司一位設計師加入一些資料細節,讓圖表更完整。

這幅圖表設計得不錯,資料翔實,但可能並不合適。高管團隊討論公司福利支出,並不需要20年之久的歷史資料。HR副總裁想說的是,近年醫療開支增速放緩,但圖表能清晰傳達出這一點嗎?

一般來說,如果圖表中的資料幾秒鐘內看不完,那麼最好把這些資訊打印出來或發到個人裝置上,供需要獲得資訊但不想聽報告的人員查閱。例如,醫療政策制定者參加聽證會、討論醫療支出長期趨勢前,可以仔細研究這張圖表。

HR副總裁需要一張更乾淨的圖表。一條簡單的折線其實就能清晰傳達資訊:

想達到這種簡潔,需要原則和一些勇氣。你會本能地想把所有已知資訊都放進去。擁擠的圖表似乎能告訴別人,你做了很多工作:“看看這些資料,我費了多大勁!”但這不是那位HR副總裁的目標;她要做的是說服同事投資新專案。使用新圖表,她不用說一個字,高管團隊就能看明白趨勢。這樣,她就為後面提出具體建議做好了鋪墊。

從某些方面看,“資料視覺化”這個詞很不到位,它把好圖表的創造過程簡化為某種機械程式,讓人想到用於創造的工具和方法,而不是創造本身,就好像把《白鯨》叫作“詞語序列”,把《星空》稱為“顏色分佈”。

“資料視覺化”這個詞還反映出,當下人們過度強調技術過程,卻忽視了最終效果。視覺化只是一個過程,而圖表的最終任務是傳達某種真實,讓人們去感知、看到以前看不到的東西——去改變想法,進而採取行動。

通過學習視覺化的基本語法規則,我們能更有效地傳達資訊。但為達到理想效果,我們對視覺化的理解須更全面,在操作時也要更有全域性意識。