1. 程式人生 > >資料分析為什麼能夠打敗傳統的商業分析(二)

資料分析為什麼能夠打敗傳統的商業分析(二)


在上一篇文章中,我們給大家介紹了傳統的商業分析模式是怎麼被資料分析一步一步取代的,資料分析這種新型的分析方式使得傳統的商業分析模式逐漸的走向死亡,那麼資料分析和傳統的商業分析中有什麼優點呢?下面就由小編為大家解答一下這個問題,希望這篇文章能夠給大家帶來幫助。

資料分析中有計算引擎上的編譯器和多樣化的資料清洗。我們先來說一說計算引擎上的編譯器。一般來說,新鮮的資料分析往往採用以下兩種方式:預處理和分析引擎。分析引擎負責執行所需的計算,以回答關於存在於業務資料中的關鍵問題。而現在又出現了一個新的競爭者:分析編譯器。分析編譯器可以靈活地將計算部署到不同的基礎設施。分析編譯器的例子包括現在熱門的TensorFlow,它可以將計算部署到GPU或CPU,Drill和Quasar、Analytics。但是編譯器比引擎更加靈活,因為編譯器可以採取數字處理的方法,並將它們轉換為執行在不同的基礎架構(資料庫,Spark,GPU等)。理論上,編譯器也可以生成工作流,其執行速度比任何採用直譯器執行的引擎都要快。即使Spark一致尋求新增基本的編譯元件,但是保留編譯器的訊號已經很明確了,並且最終可能會迭代出一個純粹的計算引擎。與此可見,資料分析行業中東西都是不斷的被取代,結果卻走向更好。

然後給大家說一說多樣化的資料清洗。依據英文首字母進行的縮寫詞會極大地增加“ETL”的工作難度和壓力,會導致抽取轉換裝載不完整、重複和不相關。而ETL是智慧化,效率和資料驅動的對立面。ETL意味著無限複製的資料,無數的延遲和高昂的費用。這通常還意味著無法回答最重要的問題。

資料分析師為了使ETL更加靈活,業界開發了多種替代方案,目前VC積極參與其中。這些解決方案的範圍很廣,從使ETL更容易進入Hadoop或資料倉庫的高階ETL工具,到流式ETL解決方案,到利用機器學習交叉引用和重複資料刪除的ETL解決方案等等。技術類別包括Dremio和Xcalar等工具,它們將ETL重新設計為提取負載轉換。實質上,它們將轉換一推到底並使其變得簡單化,因此使用者不必進行任何前期提取,載入或轉換。從歷史上看,ELT的發展一直很慢,但是這些下一代解決方案通過動態重塑,索引和快取常見轉換來使ELT更快速。這為您提供了傳統ETL的效能,以及後期轉換的靈活性。

通過上面的內容,我們不難發現數據分析行業中存在了很多的內容,這些內容就是使得資料分析行業不斷進步的過程,所以,我們要順應這個時代的發展,才能夠立於不敗之地。