1. 程式人生 > >這大概是今年最值得推薦的“資料分析工具”

這大概是今年最值得推薦的“資料分析工具”

前言

"資料視覺化工具,可愛者甚番。分析師獨愛R,自Python以來,世人盛愛matplotlib。餘獨愛BI之出分析而不拖沓,做視覺化還算酷炫......."。

BI是什麼?

BI全稱商業智慧(Business Intelligence),在傳統企業中,它是一套完整的解決方案。將企業的資料有效整合,快速製作出報表以作出決策。涉及資料倉庫,ETL,OLAP,許可權控制等模組。

分析師剛上手往往更多的是做報表,而做報表更多用到的是BI。

在學習資料分析的初級階段,為了培養分析思維,快速瞭解資料分析。我通常會推薦大家用BI上手分析。因為BI上手簡單,避免了大部分人因為工具的羈絆而讓資料分析之路止步不前。R和Python這類高階工具,可以邊分析邊學習。

關於BI,最為人津津樂道的就屬Tableau和PoerBI,百度上搜他們的介紹一搜一大把。但是本文想分享另一個BI工具,FineBI,一個被雪藏的利器。

我在之前的文章中有過推薦,不過我更愛他的"兄弟"FineReport,企業報表必備,以至於換了兩家公司都連續推薦採購,功能豐富且強大,只不過我不懂開發,只知皮毛。FineBI和它都是一個公司的,新出的5.1版本著實讓我驚豔了一把,給人的感覺,比PowerBI更成熟穩定功能更多,平價版的Tableau替代!

接下來講重點講解它的主要功能、特點和同類具的對比、以及基本使用方法。

下一篇還會用BI做一個詳細深入的實操分析。

閱讀目錄

  • 前言
  • FineBI的主要功能
  • FineBI的主要特點
  • FineBI Vs 其他同類產品
  • FineBI的分析思想
  • 獲取方法&學習資料
  • 小結

FineBI的主要功能

先來說說BI,BI全稱商業智慧(Business Intelligence),是一套完整的資料解決方案,將企業的資料有效整合,快速製作視覺化報表,以供業務決策。它一般涉及資料倉庫(現也和很多大資料方案對接)、ETL、OLAP分析,許可權控制等模組。

顧名思義,FineBI是一款BI商業智慧工具,能簡單快速的生成各種酷炫的視覺化資料報表,做有目的性的資料分析。

所以,它主要完成下面幾個工作:

1. 資料的整合

2. 資料的分析和視覺化

3. 報表製作與釋出

FineBI的主要特點

BI工具那麼多,為何我要重點推薦這款BI工具呢?

Tableau和PowerBI的好自不用我多說,知乎上大家都議論了很多。

但這款BI做為國產,不由得讓我產生好奇和好感,值得關注和鼓勵。更何況它能夠足以應對基本的資料分析,不虛於那兩者,且具備下面幾大特點:

1、打通各類資料來源

FineBI能夠從各種資料來源中抓取資料進行分析,除了支援大家常用的Oracle、SQLServer、MySQL等資料庫,還支援SAP BW、HANA、Essbase等多維資料庫。

大資料前端分析,FineBI可對接Hadoop、Kylin、Derby、Gbase、ADS、Hbase、Mongodb等大資料平臺。在對接方面有自己的分散式連線方案。

下圖是FineBI的資料連線視窗:

 

 

還支援匯入Excel資料,支援從R語言指令碼匯入資料。所以基本能對接各類資料來源,打通並整合。

2. 易用性(無需程式設計)

筆者給自己的定位是一枚資料科學家,因此不會也不能將過多精力放在視覺化工作上。畢竟資料庫/資料倉庫系統架構,資料探勘演算法研究等工作更是重中之重。而FineBI採用的拖拽資料欄位,自動出圖的操作方式,將我從視覺化的泥潭中解放出來,把更多精力投放到資料管理,演算法研究和業務溝通上。下圖展示了FineBI清爽商務的工作介面。

 

易用性還體現在資料處理方面。

要知道一份資料拿到在分析是還是要做很多公式計算、過濾篩選處理的。驚喜的是這個工具內建了各種計算公式、過濾元件。

比如時間過濾,大家覺得還要手寫公式麼。各種現成的計算公式,基本告別SQL和程式碼。

 

各種現成的計算公式,基本告別SQL和程式碼。

 

 

這裡展示的僅僅是一小個方面,絕大多數商業公司出品的軟體在易用性方面完爆開源產品。

3、視覺化顏值高

一些圖表(出自官方)

 

 

 

 

 

 

 

下面這些圖是筆者20分鐘不到就做好的,稍加美化,估計也能達到大部分客戶在顏值上的要求了:

 

 

 

要知道同樣的工作使用R語言的ggplot2至少要2小時(含除錯),使用Python的matplotlib就更久了。

4、資料許可權管控

FineBI的資料許可權管控,可以說是很專業了,這也是開源和商業不能比的。

筆者是FineReport的深度使用者,FineReport是報表應用工具,應用面更廣,資料安全性要求也更高,FineBI差不多是沿用了其兄弟產品的一套許可權管理方案。可以對不同部門/崗位/角色的人員,進行資料來源/業務包/資料表/分析報表的許可權管控。簡單來講,你可以讓不同人看到僅有自己許可權下的報表和資料。

 

嗯,暫時就說這幾點,再說有打廣告嫌疑了......

FineBI Vs 其他同類產品

1. FineBI VS Excel

兩者是不太一樣的產品,Excel更全面更加註重資料處理,而FineBI比較精簡更注重報表及視覺化,FineBI更像是資料透視表+少量VBA。不過兩者結合用相得益彰。

2. FineBI VS R語言ggplot2

ggplot2其實是R語言的視覺化包,因此對於熟悉R語言的人來說,使用ggplot2會非常得心應手。同時由於ggplot2是由程式語言R驅動,因此它在定製化方面肯定做得比FineBI要好。但是要寫一定量程式碼,這個不是每個人都擅長,畢竟如果是簡單的分析,大可不必入R的門。

3. FineBI VS Echarts等開源圖表

Echarts一般是給前端程式設計師用的,需要程式語言JS驅動,不推薦沒有程式設計基礎的分析師使用,雖然Echarts視覺化更豐富。

4. FineBI VS 其他商用BI工具(如Tableau、PowerBI等)

功能方面都沒有太大差異,就是你多一個,我少一個的區別。對大部分人來說日常的資料分析足夠了。

使用感都有所不同,FineBI有個建立業務包環節,對資料做業務/場景區分。PowerBI屬於元件拖拽式風;Tableau在分析時和FineBI差不多,探索式分析,調整視覺化樣式。

實際企業級商用有差異,因為要考慮得更多。企業級應用出產品使用上還要更多關注平臺對接,架構方案,資料抽取方式還有效能,包括之前提的許可權管控等,FineBI和Tableau更有商用基因,具體要看自己的實際需求和使用環境。

綜上所述,以上的工具都沒有單純的優劣之分,具體問題具體分析,什麼需求用什麼工具。不過,如果你想快速地做美觀的視覺化報表,那FineBI值得一學。

FineBI的資料分析思想

用FineBI做資料分析,總體的思路是這樣的,和Tableau有點像:

1.先連線資料庫,匯入資料來源。支援的資料來源型別前文已說過。

2.然後初步處理資料,選擇要分析的欄位,分組彙總、新增列、合併表、行列轉換等等。

3.接著進行資料分析。如果沒目的,可以先根據自己的假設拖拽資料欄位,看看資料是什麼趨勢是否有規律,漸漸摸清楚思路,所謂探索性分析。如果有目的,直接視覺化就行。

4.最後形成視覺化分析報告,匯出或分享。

這裡,我後面會出個一個詳細的案例,可能會更容易理解。

小結

有些人可能會對商業軟體帶有一種排斥觀念,個人覺得完全沒要。商業軟體固然需要花錢,但劣質的開源軟體更可能浪費大家的寶貴時間。顯然我們應該將精力更多的投放到資料和演算法本身以及具體業務上,工具只不過是工具罷