1. 程式人生 > >【閱讀】資料之美,一本書學會視覺化設計

【閱讀】資料之美,一本書學會視覺化設計

這裡把《資料之美,一本書學會視覺化設計》的摘抄分享下吧,圖示上有不清晰的地方還請包容。

你真的理解資料了嗎?

這裡寫圖片描述
1.對原始資料瞭解得越多,打造的基礎就越堅實,也就越可能製作成令人信服的資料圖表。

2.好的視覺化設計,需要具備統計學和設計方面的知識。

3.視覺化創作是一個迭代的過程,不同的資料集迭代週期不同。

4.由於資料代表了一定的人物、地點和事物,所以除了真實的數字之外,還有重要的背景資訊。

5.注意,垃圾資訊的相對而言。一個圖表需要剔除的東西,在另一個圖表中也許是有用的。

資料引導視覺化設計

這裡寫圖片描述
1.好的圖表,不只是要能快速理解,還包括它顯示的內容如何,以及它是否幫助你看到了之前沒有看到的東西。

2.要想把資料視覺化,就必須知道它表達的是什麼。資料描繪了現實的世界。與照片捕捉了瞬間的情景一樣,資料是現實世界的一個快照。

3.資料和它所代表事物之間的關聯既是把資料視覺化的關鍵,也是全面分析資料的關鍵,同樣還是深層次理解資料的關鍵。

4.應用:GPS追蹤信心、追蹤個人體重、飲食、就寢時間等相關資訊

掌握視覺化設計的原材料

這裡寫圖片描述
1.資料會因其可變性和不確定性而變得複雜,但放入合適的背景資訊中,就會變得容易理解了。

2.實際上,如果你不知道自己在尋找什麼,那麼再細的圖示也會難以理解。

3.一個獨立的離群值可能是需要修正或特別注意的。也許在你的體系中隨著時間推移發生的變化預示有好事(或壞事)將要發生。週期性或規律性的事件可以幫助你為將來做好準備,但面對那麼多的變化,它往往就失效了,這時應該退回到整體和分佈的粒度來進行觀察。

4.在基於不確定因素的估算下,資料誤差是存在的。如果不考慮資料的真實含義,或者沒有確保描述清楚,很容易產生誤解。

5.當我們對某些資料模糊不清的時候,資料所依存的背景資訊就發揮作用了。背景資訊可以完全改變你對某一個數據集的看法,它能幫助你確定資料代表著什麼以及如何解釋。

6.使用資料而不瞭解除了數值本身之外的任何資訊,就好比拿斷章取義的片段作為文章的主要論點引用一樣。

不瞭解資料,一切皆是空談

這裡寫圖片描述
1.你必須首先了解何人、如何、何事、何時、何地以及何因,即元資料,或者說關於資料的資料,然後才能瞭解資料的本質是什麼。

2.1何人(who):如“誰收集了資料”、“資料是關於誰的”
關鍵在於樣本要在人群中平均分佈,這樣才可以代表整體。

2.2如何(how):你不需要知道每種資料集背後精確的統計模型,但要小心小樣本,樣本小,誤差率就高;你也要小心不合適的假設,比如包含不一致或不相關資訊的指數或排名。

2.3何事(what): 你要自導自己的資料時關於什麼的,你應該知道圍繞在數字周圍的資訊的是什麼。
用相同的方法對待所有的資料集,用千篇一律的方法和工具處理所有資料集,這是一種嚴重的錯誤!

2.4何時(when):你必須清楚資料是什麼時候採集的。不要把舊的資料當成現在的來對付!事在編,人在變,地點也在變,資料自然也會變。

2.5何地(where): 事情會隨著時間變化,也會隨著城市、州、國家的不同而變化。不要將來自少數幾個國家的資料推及整個世界。

2.6為何(why):你必須瞭解採集資料的原因,這樣才能檢查資料是否存在偏頗。

所以,首要的任務是竭盡所能瞭解自己的資料,你的資料分析和視覺化會因此增色!

讓視覺化設計更為清晰

這裡寫圖片描述
1.如何涉及資料隱私的地方,最好限制一下你所展示和觀察到的資訊。

2.富互動式敘事技術,即將視訊、音訊和文字等多種型別的媒體與視覺化相結合,讓使用者參與互動實驗。

3.流程圖就是溝通中和進行決策時可用的一種直接明瞭的方法。你從一個狀態開始,然後回答問題,轉移到另一個相鄰的狀態,最後進入到幫助你做決定的狀態。

4.所謂視覺化資料,其實就是根據數值,用標尺、顏色、位置等各種視覺暗示的組合來表現資料。深色和淺色的含義不同,二維空間中右上方的點和左下方的點含義也不同。

5.視覺化是從原始資料島條形圖、折線圖和散點圖的飛躍。

6.對於視覺化,如果你知道如何解釋資料以及圖形元素是如何協作的,得到的結果通常比軟體做的好。

7.先總覽,在縮放不能幹篩選,然後按需尋找細節。—《The Eyes Have It》

8.資料具有不確定性,因為每個資料點都是對某一瞬間所發生事情的快速捕捉,其它內容都是你推斷的。

9.否定的事情,用下降來表示減少更合理。
這裡寫圖片描述

別忘了,你是為讀者進行視覺化設計

高亮顯示重點內容

這裡寫圖片描述
1.視覺化圖表具有可讀性,能幫助人們理解資料,並總結出資料表達的內容。在報告中嵌入圖表,或給圖表配上文字說明,可以詳細地解釋結論。然而,把視覺化圖形從報告中抽出來,或者斷開它和提供背景資訊的文字間的聯絡,資料可能就會失去它的含義。更糟糕的是,其他人可能會曲解你想表達的內容。

2.高亮顯示能引導讀者在茫茫資料中一下子就能看到重點。它既可以加深人們對已看到東西的印象,也可以讓人們關注到那些應該注意的東西。時時牢記資料、視覺暗示和可讀性。

3.視覺化圖表可以純粹從美學的角度欣賞,但最有趣的還是資料。這就是為什麼視覺化要從資料開始,探索資料,然後展示結果,而不是從視覺化開始,然後盡力把資料集放進去,否則,就像是用錘子砸一大把螺絲釘。

4.視覺化的精髓在於理解資料中的關係和模式。
當你沒有資料時,千萬不要硬編出來。

5.用紙上的草圖把你想做的展示出來,這不受電腦技術的限制。知道有限制是好的,但更好的是現有許多想法,然後縮減將之填入數字和時間的限制中。不要把作品限制在電腦能做的範圍內。要告訴電腦你要做什麼,而不是電腦告訴你能做什麼。

6.因為是向別人展示資料,你要考慮到他們會怎樣審視你的作品。你自己是唯一的觀眾時,你就只為一個人設計,只會有一種距離、一個電腦螢幕或一張紙。有其他人時,情況就不一樣了。每個人都有不同的背景、不同的印表機和不同的電腦螢幕解析度,雖然無法滿足所有人的需求,但至少要在合理的範圍內嘗試著對儘可能多的人負責。

7.知道要展示什麼之後,你可以琢磨該怎麼來展示。在電腦上花費大量時間前可以先從紙筆開始,所以你得在身邊放一本筆記本。想到可能有用的東西就要用草圖、塗鴉和草稿記下,然後再試著用電腦轉換它們。

8.資料視覺化的一般過程:把所有東西整合起來,從理解資料,到探索資料,使之清晰,並適應讀者。

9.你的目標是做到取出任何食材——資料,你都能明白它代表了什麼。對自己的資料理解得越深,就能幫助他人理解的越深。資料視覺化就是這樣變得有價值的。
這裡寫圖片描述

將視覺化進行到底

這裡寫圖片描述

視覺化工具

excel、spreadsheets、tableau、

針對特定資料的工具

gephi、imagePlot、樹圖、TileMill、indiemapper、geocommons、ArcGis

程式設計工具

R語言及其擴充套件包(ggplot2統計學視覺化框架,network可建立帶有結點和邊的網路圖,ggmaps基於谷歌地圖openstreetMap及其它地圖的空間資料視覺化工具,animation可製作一系列的影象並將它們串聯起來做成動畫,portfolio通過樹圖來視覺化層次型資料)

js\html\css\svg(視覺化庫d3.js/raphael/js infovis toolkit)

processing 合適程式設計新手

python(matplotlib)

php

插圖工具

Adobe Illustrator

典型的工作流程:用R語言建立基礎圖形,將圖示儲存為PDF檔案,然後用Illustrator來修改顏色、新增標註,最後再加工一下。
這裡寫圖片描述

資料統計

關於資料說明的問題,以及如何從文字檔案和資料庫的一堆數字中篩選出有用資訊,統計學提供了更寬闊的視角。統計學還有助於處理稀疏和損毀的資料。

這裡寫圖片描述

相關推薦

閱讀資料本書學會視覺設計

這裡把《資料之美,一本書學會視覺化設計》的摘抄分享下吧,圖示上有不清晰的地方還請包容。 你真的理解資料了嗎? 1.對原始資料瞭解得越多,打造的基礎就越堅實,也就越可能製作成令人信服的資料圖表。 2.好的視覺化設計,需要具備統計學和設計方面的知識。

NOI2016迴圈mobius反演+杜教篩

思路: 對於 xy \frac x y,我們肯定讓 gcd(x,y)=1 \gcd(x,y)=1,因為這樣計算不會重複,而且比不互質時更優,且只要餘數出現重複就是有迴圈節了,根據十進位制小數轉k進位制的方法,我們可以得到

活動資料新聞漫談資料看未來

2018年第一期新聞工作坊漫談 11月15日,文學院在西校區c225舉辦新聞工作坊第一期:“資料新聞漫談”, 文學院副院長殷學明、廣播電視學系系主任紀楠參加新聞工作坊開坊儀式並致辭,文學院研究生周媛媛作為主要發言人,與來自各個年級的廣播電視學專業本科生進行了交流。 殷學明副院長首先對新

活動“技術”Meetup 第1期

http watermark alt 51cto water blog sha color mark “技術之美”Meetup 第1期主題:雲計算時代的運維管理歡迎報名共同學習【活動】“技術之美”Meetup 第1期

uoj221. NOI2016迴圈

考完後非常令人傷心的題。。。 打表&&找規律&&數學推導…….. 我們得到了目標式子:Σni=1Σmj=1[(i,j)=1][(j,k)=1] 這裡的(i,j)表示gcd(i,j) 然後: 方向一: Σni=1Σm

第4章 決策樹演算法分類(五 決策樹sklearn總結和視覺總結)

4.7 決策樹sklearn總結 參考文件: 中文連結 英文連結 API: 中文連結 英文連結 scikit-learn決策樹演算法類庫內部實現是使用了調優過的CART樹演算法,既可以做分類,又可以做迴歸。分類決策樹的類對應的是DecisionTreeClass

資料以航空大資料為例窺企業資料架構規劃和治理

作者介紹劉慶會,主要負責普元大資料治理產品的實施,十年大型企業資訊資料治理架構設計與建設經驗,為

專欄資料結構和演算法-為什麼很多程式語言中的陣列都是從 0 開始的

學習筆記 陣列的特徵 1.線性表 資料排成像一條線一樣的結構,資料之間只是簡單的前後關係。除了陣列是一種線性表結構外,連結串列、佇列和棧也是。與之對應的像二叉樹、堆、圖等就是非線性表。 2.使用連續

疾風知勁草智者必懷仁此生我將走過;走過這便再也無法重來。所有力所能及的善行所有充盈於心的善意我將毫不吝惜即刻傾於。我將不再拖延再不淡漠只因此生再也無法重來。醒掌天下事醉臥美人膝

此生之路,我將走過;走過這一次,便再也無法重來。所有力所能及的善行,所有充盈於心的善意,我將毫不吝惜,即刻傾於。我將不再拖延,再不淡漠,只因此生之路,再也無法重來。醒掌天下事,醉臥美人膝...

思六方武學思六方武學 思六方武學體系 思六方指的是:1看2聽3思4動5防6攻規律五行相生相剋陰陽變化原理,一分化六六合化一之奧妙。 思六方融合世界不同武學易經精華技擊理念。以武學、

思六方武學 思六方武學 思六方武學體系 思六方指的是:1看2聽3思4動5防6攻,天,地,人之規律,五行相生相剋,陰陽變化之原理,一分化六,六合化一之奧妙。 思六方融合世界不同武學,易經精華,技擊理念。以武學、...

NLP資料始於足下:談談語料庫知多少

作者:白寧超 2016年7月20日13:47:51 摘要:大資料發展的基石就是資料量的指數增加,無論是資料探勘、文字處理、自然語言處理還是機器模型的構建,大多都是基於一定量的資料,資料規模達到一定程度,採用基於規則方法或者概率統計學的方法進行模型構建,感興趣知識的獲取才更有意義。那麼,是不是資料足

Android資料儲存資料庫SQLite(之前有看到的篇關於SQLite文章簡單明瞭、覆蓋較全面適合學習)

一:前言 之前介紹過Android中儲存資料的兩種方式:SharedPreferences和File,這篇介紹另一種儲存資料的方式——資料庫SQLite——輕量級資料庫系統。 資料庫:簡單來說可視為電子化的檔案櫃——儲存電子檔案的處所,使用者可以對檔案中的資料執行新增、擷取

CNMP系列CNMP系統起步。

ftp 系列 fig samba 建立連接 編輯 為我 作用 let 簡單的來理解,我所說的CNMP,不是CNM+P,而是CentOs+Nginx+MySql+PHP,也可以單純的理解為LNMP,但是系統是我們自己選的,雖說是Linux的一個分支,但我就喜歡CentOs的這

轉載CSS3Clip(裁剪)拓展閱讀

很多 fix 以及 flow script stat browser hid 一定的 Clip屬性是大家經常會誤解的一個屬性,這篇文章幫助大家充分的了解和學習clip屬性,用這個屬性制作出更好的效果。 我可以確定Clip屬性有很多同學並不知道,因為這個屬性使用率非常的底,我

java代碼---Java8 Stream

如果 姓名 有用 補充 ref term 聚合操作 art 觸發 Stream 第一次看到Stream表達式就深深把我吸引,用它可以使你的代碼更加整潔而且對集合的操作效率也會大大提高,如果你還沒有用到java8的Stream特性,那就說明你確實out啦。 一、概述 1

java代碼---guavaImmutable(不可變)集合

實例 bubuko mage string 工具類 clas tle wrapper 系列 Immutable(不可變)集合 一、概述 guava是google的一個庫,彌補了java語言的很多方面的不足,很多在java8中已有實現,暫時不展開。Col

java代碼---Java8 Map中的computeIfAbsent方法

之前 font tro 統計 UNC env gen 記錄 per Map中的computeIfAbsent方法 Map接口的實現類如HashMap,ConcurrentHashMap,HashTable等繼承了此方法,通過此方法可以在特定需求下,讓你的代碼更加簡潔

pythonpython每天抓取篇英語美文發送到郵箱

lib 郵件發送 建立 dirname write path div style 需要 import requests,os,time from bs4 import BeautifulSoup import smtplib from email.mime.tex

ADNI資料預處理(1)SPMCAT12

ADNI Series 1、【ADNI】資料預處理(1)SPM,CAT12 2、【ADNI】資料預處理(2)獲取 subject slices 3、【ADNI】資料預處理(3)CNNs 4、【ADNI】資料預處理(4)Get top k slices according to CNN

讀書筆記數學2-搜尋引擎

8.簡單之美——布林代數和搜尋引擎 建立一個搜尋引擎大致需要做的幾件事情: 自動下載儘可能多的網頁; 建立快速有效的索引; 根據相關性對網頁進行公平準確的排序。 這就是搜尋的“道”。 關鍵詞=布林運算(詞1,詞2,詞3);接著判斷詞i是否在文獻中,以得到一串二進