1. 程式人生 > >超級乾貨 :手把手教資料視覺化工具Tableau

超級乾貨 :手把手教資料視覺化工具Tableau

前言

資料的世界正在發生急劇變化,任何人都應該訪問自己需要的資料,並具備獲取任何資料的洞察力,而tableau正是幫我們洞察資料的好幫手。

Tableau作為BI tool leader ( 2016 Gartner BI chart), 它不僅是一款視覺化軟體,還具備不可忽略的強大的Data connection, collaboration, security management, multi-platform功能性:

  • Data connection:Tableau Desktop可直接連線Salesforce(銷售報表),各類常用資料庫(sql, aws, hadoop, SAP HANA), Google analytics ( 流量分析),最新的版本10支援連線json檔案

  • Data refreshment:實現全部報表定時自動從元資料更新

  • Data preparation and data processing:在2016年的Tableau大會上, Tableau宣佈即將推出一款自動化data preparation的產品,並展示了收購Hyper後可以做到幾秒內ingest百萬級的資料

  • Security management:很輕易地新增user, 設定user group,且可通過tabcmd在terminal中自動完成使用者管理

  • Multi-platform:在網頁,手機,tablet間實現跨平臺的視覺化

我認為學習Tableau最主要的一點是要了解它的用法特點,尤其是和Excel的不同之處。從我在學習和製作Tableau報表的時候得出了一定的經驗,學習者一定要謹記以下四點:

  • 視覺化(誰都知道Tableau是視覺化專家,但你真的知道怎麼用視覺化嗎?)

  • 聚焦/深挖 (上可看整個公司面貌,下可聚焦到單個產品/顧客)

  • 靈活分析

  • 互動化圖表(我認為Tableau最強的地方)

Tableau工作區

Tableau 工作區包含選單、工具欄、“資料”窗格、卡和功能區以及一個或多個工作表,表可以是工作表、儀表板或故事。

工作表包含功能區和卡,您可以向其中拖入資料欄位來構建檢視。

A. 工作簿名稱。

B. 卡和功能區 - 將欄位拖到工作區中的卡和功能區,以將資料新增到您的檢視中。

C. 工具欄 - 使用工具欄訪問命令以及分析和導航工具。

D. 檢視 - 這是您在其中建立資料視覺化的工作區。

E. 轉到開始頁面。

F. 側欄。側欄提供兩個窗格:“資料”窗格和“分析”窗格。

G. 轉到資料來源頁面。

H. 狀態列 - 顯示有關當前檢視的資訊。

I. 工作表標籤 - 標籤表示工作簿中的每個工作表,這可能包括工作表、儀表板和故事。

Tableau概念

為何有一些欄位維度和其他度量?新增篩選器將對我的檢視產生什麼影響?為何一些欄位的背景顏色是藍色,而另外一些欄位的背景顏色是綠色?

本節中的主題將嘗試闡明這些問題,以及有關您在使用 Tableau Desktop 可以看到和體驗到的功能的其他問題。

資料型別

資料來源中的所有欄位都具有一種資料型別。資料型別反映了該欄位中儲存的資訊的種類,例如整數 (410)、日期 (1/23/2015) 和字串(“Wisconsin”)。欄位的資料型別在“資料”窗格中由以下所示的圖示之一來標識。

1. Tableau 中的資料型別圖示

您可以在“資料來源”頁面上或“資料”窗格中更改欄位的資料型別。

2. 在“資料來源”頁面中更改欄位的資料型別

有時,Tableau 會不正確地解釋欄位的資料型別。例如,Tableau 可能會將包含日期的欄位解釋為整數資料型別,而不是日期資料型別。

此時您可以在“資料來源”頁面上更改曾經作為原始資料來源一部分的欄位(而不是在 Tableau 中建立的計算欄位)的資料型別:

STEP 1:單擊欄位的欄位型別圖示(如上表中所示)。

STEP 2: 從下拉列表中選擇一種新資料型別:

提示:確保在建立資料提取之前更改資料型別。否則,資料可能會不正確。舉例來說,如果 Tableau 將原始資料來源中的浮點欄位解釋為整數,並且您在更改欄位的資料型別之前建立資料提取,則 Tableau 中生成的浮點欄位的部分精度將被截斷。

3. 在“資料”窗格中更改欄位的資料型別

若要在“資料”窗格中更改欄位的資料型別,請單擊欄位名稱左側的圖示,然後從下拉列表中選擇一種新資料型別。

4. 在檢視中更改欄位的資料型別

若要在檢視中更改欄位的資料型別,請在“資料”窗格中右鍵單擊(在 Mac 中按住 Control 單擊)欄位,選擇“更改資料型別”,然後從下拉列表中選擇相應資料型別。

注意: 有時,資料庫中資料的精度比 Tableau 可以建模的精度更高。在將這些值新增到檢視中時,狀態列的右側將顯示一個精度警告。

5. 檔案中資料的混合資料型別

Microsoft Excel、Microsoft Access、或 CSV(逗號分隔值)檔案中的大多數列都包含相同資料型別(布林值、日期、數字或文字)的值。 連線到該檔案時,Tableau 會在“資料”窗格的相應區域中為每列建立一個欄位,日期和文字值為維度,數字為度量。

但是,您連線到的檔案所包含的列可能具有混合資料型別,例如數字和文字,或者數字和日期。連線到該檔案時,混合值列將對映到 Tableau 中具有單一資料型別的欄位。因此,包含數字和日期的列可能會對映為數字資料型別(將其設為度量),或者可能會對映為日期資料型別(這種情況下 Tableau 將其視為維度)。

Tableau 根據 Excel 資料來源中前 10,000 行和 CSV 資料來源中前 1,024 行的資料型別來確定如何將混合值列對映為資料型別。舉例來說,如果前 10,000 行中大多數為文字值,那麼整個列都對映為使用文字資料型別。

注意: 空單元格也可以建立混合值列,因為它們的格式不同於文字、日期或數字。

當 Tableau 確定每個欄位的資料型別時,如果某個欄位中的值與該資料型別不匹配, Tableau 就會採用若干不同方式之一來處理欄位,具體情況視資料型別而定。例如,有時 Tableau 會用 Null 值填充那些欄位,如下表中所示:

如果在分析資料時使用基於混合值列的欄位時遇到困難,則可以執行以下操作之一:

  • 對基礎資料來源中的空單元格設定格式,使它們與列的資料型別相匹配。

  • 建立一個不包含混合值的新列。

欄位型別

連線到新資料來源時,Tableau 會將該資料來源中的每個欄位分配給“資料”窗格的“維度”區域或“度量”區域,具體情況視欄位包含的資料型別而定。如果欄位包含分類資料(例如名稱、日期或地理資料),Tableau 會將其分配給“維度”區域;同理如果欄位包含數字,Tableau 則會將其分配給“度量”部分。

那麼,可不可以說維度就是包含分類資料(例如名稱、日期或地理資料)的欄位,度量就是包含數字的欄位?以這些斷言作為出發點是足夠準確的,但當您在 Tableau 中工作時,請記住您可以控制檢視中欄位的定義。根據使用者的要求,大多數字段都可用作維度或用作度量,並且可以為連續或離散。

Tableau 將欄位分配給“維度”區域或“度量”區域進行初始分配時建立了預設值。當您單擊並將欄位從“資料”窗格拖到檢視時,Tableau 將繼續提供該欄位的預設定義。如果從“維度”區域中拖動欄位,檢視中生成的欄位將為離散欄位(帶有藍色背景);如果從“度量”區域中拖動欄位,生成的欄位將為連續欄位(帶有綠色背景)。

注意:如果您希望能夠指示 Tableau 如何將拖到檢視的某個欄位進行分類,以便覆蓋預設值,請在將其拖到檢視之前右鍵單擊(在 Mac 上按住 Control 單擊)該欄位,Tableau 將提示您在指定放下該欄位時如何在檢視中使用它。

預設情況下,維度是離散的,度量是連續的,但事實上所有四種組合都有可能:

注意: 對於多維資料集(多維)資料來源(僅在 Windows 上受支援),它用於更改資料角色的選項受到限制。您可以將某些度量從連續更改為離散,但通常無法更改多維資料集資料來源中欄位的資料角色。

1. 維度和度量

當您連線到資料來源時,Tableau 會將資料來源中的每個欄位分配為扮演兩個可能的資料角色之一:維度或度量。 當您開始在 Tableau 中處理資料時,這些分配有什麼效果?

1.1 維度

當您第一次連線到資料來源時,Tableau 會將包含離散分類資訊的任何欄位(例如,值為字串或布林值的欄位)分配給“資料”窗格中的“維度”區域。

當您單擊並將欄位從“維度”區域拖到“行”“列”時,Tableau 將建立列或行標題。

“維度”區域拖出的任何欄位在新增到檢視時一開始為離散,帶有藍色背景。因此,您可能會順理成章地假定欄位的背景顏色指明瞭它是維度還是度量(但結果證明這樣做是不正確的)。但是日期維度和數值維度可能為離散維度或連續維度,所有度量也都可能為離散度量或連續度量。欄位的背景顏色指明它是離散(藍色)還是連續(綠色)。

將維度拖到“行”“列”時,只需通過單擊欄位並選擇“度量”便可將欄位更改為度量。現在,檢視將包含一個連續軸(而不是列或行標題),並且欄位的背景將變為綠色:

如果要將維度設為連續(在未首先將其轉換為度量的情況下),則您的選項有限。您只能對日期維度(日期維度可能為離散或連續,但始終是維度)和數值維度這樣做,並且您無法轉換包含字串或布林值的維度。

Tableau 不會對維度進行聚合。如果要對欄位的值進行聚合,則該欄位必須為度量。將維度轉換為度量時,Tableau 將始終提示您為其分配聚合(計數、平均值等)。聚合表示將多個值(單獨的數字)聚集為一個數字,通過對單獨值進行計數、對這些值求平均值或顯示資料來源中任何行的最小單獨值來實現。有關 Tableau 可執行的不同型別聚合的論述,請參見聚合(http://onlinehelp.tableau.com/current/pro/desktop/zh-cn/calculations_aggregation.html)

在 Tableau 查詢中,檢視中的維度的 SQL 表示形式為“Group By”子句。

1.2 度量

當您第一次連線到資料來源時,Tableau 會將包含定量數值資訊的任何欄位(即其中的值為數字的欄位)分配給“資料”窗格中的“度量”區域。

當您將欄位從“度量”區域拖到“行”“列”時,Tableau 將建立連續軸。

從“度量”區域拖出的任何欄位在新增到檢視時一開始將為連續,因此其背景將顯示為綠色,但如果您單擊欄位並選擇“離散”,則值將變為列標題。

然而Tableau 會繼續對欄位的值進行聚合。因為即使該欄位現在為離散,但它仍然是度量,而 Tableau 會始終對度量進行聚合。如果有意願您可以再進一步執行過程,將度量轉換為維度。只有這樣,Tableau 才會停止對其值進行聚合。

1.3 檢視中維度和度量的可視標識

如果您在 Tableau Desktop 中檢視檢視,並且不確定某個欄位是度量還是維度,一個快速的視覺提示已聚合度量: 

而維度則不是:

但是存在以下例外:

  • 如果解聚整個檢視,則不會根據定義來聚合檢視中的欄位。如果您使用的是多維資料來源,則會在資料來源中聚合欄位,但檢視中的欄位不顯示該聚合。

1.4 將度量轉換為維度

您可以將檢視中的欄位從度量轉換為維度。

或者,如果您希望變更影響工作簿中所有的將來使用該欄位的情形,您可將“資料”窗格中的欄位從度量轉換為維度。

相關推薦

超級乾貨 手把手資料視覺工具Tableau

前言資料的世界正在發生急劇變化,任何人都應該訪問自己需要的資料,並具備獲取任何資料的洞察力,而t

乾貨 如何看穿資料視覺的謊言!

以前我們看到一個做得很爛的圖表,或者穿幫的資料視覺化作品時,往往是將它們嘲笑一番也就算了。但有些

超級好用的 Java 資料視覺Tablesaw

本文適合剛學習完 Java 語言基礎的人群,跟著本文可瞭解和使用 Tablesaw 專案。示例均在 Windows 作業系統下演示 本文作者:HelloGitHub-秦人 HelloGitHub 推出的《講解開源專案》系列,今天給大家帶來一款基於 Java 語言的資料視覺化庫開源專案——Tablesa

福利來了39個大資料視覺工具

資料視覺化無處不在,而且比以前任何時候都重要。無論是在行政演示中為資料點建立一個視覺化程序,還是用視覺化概念來細分客戶,資料視覺化都顯得尤為重要。以前的工具的基本不能處理大資料。本文將推薦39個可用於處理大資料的視覺化工具(排名不分先後)。其中許多工具是開源的,能夠共同使用或嵌入已經設計好的應用程式

乾貨 手把手你搭建資料化使用者運營體系

程化和精細化為每個運營人員都要具備的基本思維,如果說流程化的思考是運營人員對運營目標的定性思考,那麼資料化就是對就是對這個目標實現路徑和效果的定量描述,它將你的工作思路落實在具體的資料指標上以衡量你的工作效果和目標實現情況。 建立資料化使用者運營的必要性一是在於定量衡量你工

Caffe學習筆記(1)簡單的資料視覺

caffe的底層是c++寫的,如果要進行資料視覺化,需要藉助其它的庫或者是介面,如opencv,python或者是matlab,python的環境需要自行配置,因為我使用的都是網管同志已經配置好的深度學習伺服器,所以不用管底層的一些配置問題,如果需要自行配置自己

乾貨手把手你——某寶直播彈幕爬蟲

前言 公司有通過淘寶直播間短連結來爬取直播彈幕的需求, 奈何即便google上面也僅找到一個相關的話題, 還沒有答案. 所以只能自食其力了. 我們先看一下爬蟲的最終效果: 下面我們來抽絲剝繭, 重現一下調研過程. 不知道該如何做的朋友,我還是推薦下java

工業大資料漫談11工業大資料視覺的難點

        工業大資料採集、處理之後,非常重要的一個環節就是資料視覺化工作。畢竟,無論我們有多少資料,都是需要看到的,否則資料的意義又在哪裡呢?         資料視覺化技術第一代應該是報表軟體,通過報表系統能夠把複雜的資料整理成規則的表格,並配以漂亮的圖形,比如柱圖

效能測試監控平臺InfluxDB+Grafana+Jmeter linux環境執行jmeter並生成報告 時序資料庫InfluxDB簡介及安裝 視覺工具Grafana簡介及安裝

前面的部落格介紹了InfluxDB、Telegraf、Grafana的安裝和使用方法,這篇部落格,介紹下如何利用這些開源工具搭建效能測試監控平臺。。。   前言 效能測試工具jmeter自帶的監視器對效能測試結果的實時展示,在Windows系統下的GUI模式執行,渲染和效果不是太好,在linu

搜尋框架搭建1elasticsearch安裝和視覺工具kibana、分詞外掛jieba安裝

elasticsearch安裝和視覺化工具kibana、分詞外掛jieba安裝 1 Windosw環境 1.1 java環境安裝 1.2 elasticsearch安裝 1.3 視覺化介面kibana安裝 1.

從入門到精通,全球20個最佳大資料視覺工具

資料視覺化之初級篇 零程式設計工具   1. Tableau Tableau 是一款企業級的大資料視覺化工具。Tableau 可以讓你輕鬆建立圖形,表格和地圖。 它不僅提供了PC桌面版,還提供了伺服器解決方案,可以讓您線上生成視覺化報告。伺服器解決方案可以提

14款基於javascript的資料視覺工具

俗話說,一圖勝千言。圖形化的資訊可以讓人們對資料有更加直觀清晰的理解,讓資訊釋出者更加高效地展示自己的核心內容。在前端開發中,如果缺少合適工具,製作資料視覺化圖表會十分複雜。然而隨著資料視覺化概念逐年火熱,有較多優秀的圖表開源庫和製作工具脫穎而出。下面,我們就拿其中比較有名的

推薦14款基於javascript的資料視覺工具

1、AnyChart AnyChart 是基於 Flash/JavaScript(HTML5) 的圖表解決方案,它可以輕鬆地跨瀏覽器、跨平臺工作。除了基礎的圖表功能外,它還有收費的互動式圖表和儀表功能。它可以通過 XML 格式獲取資料,該方式讓開發人員非常靈活地控制圖表上的每一個數據點,而當圖表資料點數

有哪些值得推薦的資料視覺工具

1.plotly 2.R ggplot2 3.無需程式語言的工具(7個) 4.基於JavaScript實現的工具(8個) 5.基於其他語言的工具(5個) 6.地圖資料視覺化工具(7個) 7.金融(股票)資料視覺化工具(2個) 8.時間軸資料視覺化工具(2個) 9.函式與公式資料視覺化工具(2個) 10.其他

Linux 上的資料視覺工具

在本文中,將對很多流行的 Linux 資料視覺化工具進行一下調查,並對其中一些工具進行更深入的探討。例如,某個工具是否為進行數值計算而提供了一種語言?這個工具是互動式的還是提供了一種批處理模式來單獨進行操作?可以使用這個工具進行影象或數字訊號處理嗎?這個工具是否提供了語

最好用的 20 款資料視覺工具

原網址:http://www.iteye.com/news/28093 資料視覺化可以讓資料更加直觀,為開發者做出正確決策奠定基礎。本文將介紹20款不同的資料視覺化工具,從簡單列表到複雜表格,再到地圖和資訊圖表。這些工具中大部分都是免費的,希望能夠為你帶來幫助。  一、入門

4個最受歡迎的大資料視覺工具

授權轉載自大資料文摘 ID:BigDataDigest原文作者Volodymyr Fedak翻譯

資料視覺』基於Python的資料視覺工具

劉宇宙,現在一家創業型公司做技術總負責,做爬蟲和資料處理相關工作,曾從事過卡系統研發、金融雲端計算服務系統研發,物聯網方向大資料研發,著書一本,《Python3.5從零開始學》 如何做Python 的資料視覺化? pyecharts 是一個用於

開源資料視覺工具(For Apache Kylin)使用說明

http://lxw1234.com/archives/2016/06/691.htm Apache Kylin,很好的解決了海量資料OLAP的底層儲存與分析引擎,但還缺一個數據視覺化工具,可以使使用者非常方便的通過圖形化分析探索海量資料,而不用寫SQL。於是我們發現了

認識大資料,盤點5款資料視覺工具

什麼是資料視覺化呢?那幾款資料視覺化工具好使用呢?資料視覺化用專業術語來就愛那個就是通過視覺的方式向人類展示資料,這種在文字基礎上的圖表即簡單又實用,而且相關性、趨勢分析都非常明確,也非常可靠,通過圖表一目瞭然。用通俗的話說就是畫一張圖表,將資料以比例的方式展示,讓人能一眼就瞭解到自己想要了解的資料。挖走了