1. 程式人生 > >如何為您的企業選擇最佳的自助式BI工具

如何為您的企業選擇最佳的自助式BI工具

30120e3ca4bd45b8822e5a699e5a3d6f.png

          該業務資訊(BI)市場競爭激烈和擁擠。從歷史上看,大型企業 - 想想甲骨文和IBM - 參與功能戰爭,試圖證明預算延伸(如果不是預算破壞)定價,並嚴重依賴高觸控推銷技巧。更糟糕的是,供應商希望您的IT部門與供應商自己的顧問合作,配置他們的產品並將其與您的每個記錄系統整合,通常需要額外付費。

          一旦傳統的BI系統安裝並執行,管理人員就必須等待每週或每月的業務線報告,這意味著決策通常需要一個月,再加上另一個月的實施。新增報告需要一個嚴重積壓IT的請求,並且可能需要數週或數月才能完成設計和編碼。

          這一切都隨著2004年推出的自助式BI而改變,例如我在同伴比較中涵蓋的五個頂級自助服務平臺:億信WonderBI,Domo,Power BI,Qlik Sense,QuickSight和Tableau。向自助式BI過渡的部分原因是能夠在幾天而不是幾個月內做出業務決策。最近,雲端計算和高速網際網路接入的可用性已成為自助BI的關鍵技術驅動因素。

          當然,傳統商業智慧仍然存在並且很好,儘管有些減少。特別是財務報告需要100%的準確性,並且通常需要數週才能生成報告。雖然一些較新的平臺試圖完全取代傳統的BI系統,但報告結果卻是一個單獨的用例,自助服務BI產品可能並不總是能夠很好地服務,這些產品強調互動式視覺發現。

          與此同時,傳統的BI平臺也在不斷髮展。有些人已經添加了足夠的自助服務,視覺化發現和分析,以滿足現有客戶的需求。

          選擇自助BI平臺的標準          選擇自助式BI平臺時執行自己的評估是關鍵,因為供應商提出的許多功能可能對您的企業沒有實際好處。例如,如果您的公司已經擁有高效能資料湖,您可能不希望為將所有資料匯入其自己的商店的BI平臺支付差額。同樣,您可能更喜歡將BI系統與已經存在的協作平臺整合,而不是使用專用的BI協作功能,因為要求員工使用兩個協作系統通常不是首發。

          如果您的大部分資料都在Azure上,則可能需要排除僅在Amazon Web Services上執行的BI系統,反之亦然。如果可能,您希望出於效能原因並置資料和分析。

          供應商傾向於引用對其產品最有利的分析報告。不要相信供應商的摘要摘要或採用他們向您展示的圖表:要求並閱讀整個報告,其中將提到警告和弱點以及優勢和特徵。同時考慮一下包含在分析師報告中的大量事實:大多數大型分析公司對付費客戶的興趣高於非客戶的供應商,儘管個別分析師真心想要公平和中立。

          以下是評估自助BI平臺時關注的七個關鍵領域。

          資料來源          您需要確保BI平臺可以讀取所有資料來源。其次,你要知道這個平臺是否具有處理之前,將資料匯入到自己的商店,或者如果它能夠處理的飛行資料的查詢。

如果必須匯入資料,分析速度是否足夠快以證明匯入時間的合理性?BI系統可以自動更新原始資料中的資料嗎?

如果BI系統中存在資料儲存費用,請最大限度地猜測您將在5年內獲得多少資料並將其增加三倍。儲存該金額的成本會影響您的預算嗎?

另一個關鍵問題:BI系統可以執行資料所在的位置嗎?如果沒有,移動資料有多難?

          資料轉換          收集資料時,資料總是很髒。欄位可能在一行中丟失,或者可能包含無意義的值。一行中的多個欄位可能具有相互不一致的值。文字欄位可能包含拼寫錯誤,拼寫變體或術語變體,使其無法自動分組。某些領域,尤其是自由形式的評論,可能很長,而且用處不大。

此外,欄位可以是非引數(文字),並且需要編碼為數字以用於分析目的,儘管一些BI系統在內部自動化。欄位的數字範圍可以按數量級而不同,並且需要標準化。可能需要從其他值推斷出值,例如,如果源資料中尚未存在性別,則可能需要從名字和/或標題中推斷性別以用於統計目的。

BI系統可能要求您編寫SQL SELECT語句,或者它可能自己執行匯入。如果它要求您編寫資料庫查詢,它是否可以幫助您選擇欄位和建立連線?

這些和其他問題意味著您應該在某些資料上試用BI系統。在檢視和繪製資料時構建提取/轉換/載入鏈。看看它有多容易或多麼困難。將其與其他BI系統進行比較。不要低估清理資料進行分析所需的時間 - 它可以輕鬆佔總分析時間的80%。

          分析力量          您需要以多種方式分析清理過的資料。在最簡單的層面上,您將以各種格式繪製資料,並對歷史資料和趨勢執行直接的統計分析。除此之外,您還需要深入瞭解資料以瞭解特定功能,並構建模型以測試您對原因的看法。最後,您可能希望基於統計模型甚至機器學習模型來預測未來的績效指標(例如,銷售和庫存要求)。

您將遇到的一個功能戰爭是提供的圖表型別數量。當炒作圖表型別不適用於您的資料時,這通常毫無意義。另一方面,一些圖表型別很重要:例如,我不願意使用沒有地理顯示支援的系統,因為在位置表中檢視原始數字與看到不同顏色的視覺和直覺影響不同或在地圖上改變氣泡大小。

          支援分析是另一個特色戰爭。是的,您絕對應該能夠在BI平臺中執行簡單的統計,至少包括迴歸模型。更進一步的可能是與使用者的阻抗不匹配。

          例如,為探索性BI分析選項新增機器學習和深度學習支援可能是管理者和業務分析師的橋樑。資料科學家是另一個故事,但他們通常擁有專門的專用工作空間來建立ML模型和深度神經網路,使用的工作流通常需要比典型的BI使用者擁有的更多的統計知識和程式設計技能。

另一方面,用於分析常見資料模式的自然語言支援和內建智慧使得不熟練使用者更容易使用平臺。將機器學習應用於使用者體驗通常是好的,即使要求業務分析師培訓深度學習模型也可能毫無結果。

          一些BI平臺現在使用記憶體資料庫和並行性來加速查詢。在未來,您可能會看到內置於BI服務中的更高度並行化的基於GPU的資料庫 - 第三方正在構建這些資料庫,展示了令人印象深刻的加速。

          您通常需要在分析期間修改或增加資料轉換,例如通過新增反映其他列之間差異或比率的列,這通常在財務分析中進行(例如債務/權益)。此類修訂有時可以將匯入過程從ETL(提取,轉換和載入)管道更改為ELT(提取,載入和轉換)。某些供應商僅支援ETL或ELT中的一個,但大多數使用ETL的BI系統都在分析步驟中提供了額外的轉換。

          易於學習和使用          儘管針對經理和業務分析師,自助式BI系統很複雜,並且有很多可移動的部分。在我嘗試過的BI平臺中,使用者體驗和學習材料的質量差異很大。嘗試讓您的評估中涉及不同技能水平的幾個潛在使用者,以瞭解他們的反應。另外一定要測試文件本身。最好的文件搜尋,索引和組織與最差的文件之間存在巨大差異。我有時會被迫要求銷售工程師在重大但失敗的個人努力之後為我找到一個教程。

演示靈活性

          一些BI系統顯示了幾乎任何變數選擇的合理資訊圖表。其他BI系統等待您單擊您認為想要檢視的圖表型別。如果你知道你想要什麼和需要什麼,那麼任何一種方法都可以; 如果沒有,最好是系統根據您選擇的變數的數量和種類提供幫助。

通常,BI系統區分始終為數字的度量和可以是非引數的維度。一些維度,例如城市,州和國家,可以轉換為緯度和經度等度量。有時您希望看到尺寸合格的措施,例如“按產品顯示我們的利潤率”或“按商店顯示我們的逐年銷售額”,有時您希望看到其他措施合格的措施,例如“向我展示中西部所有商店的利潤與銷售額。“

          看到有意義的圖表後,您經常需要放大特定功能,調整顯示並添加註釋。BI系統在這方面差異很大,所以值得做這個練習。

          協作選項          您可以共享的具體內容因系統而異,以及您是要與完全許可的使用者,只讀註冊使用者還是未註冊的使用者共享。在某些情況下,只讀使用者可以從您提供的圖表中對資料進行排序和篩選; 在其他情況下,他們只能看到根據您的分析製作的幻燈片。

這種區別通常會對您是否能夠為整個公司或僅選定的受眾提供BI產品以及當然的定價產生很大影響。

          成本和收益按成本計算,我並不僅僅指供應商的年費,還包括儲存資料,在本地或雲端託管平臺以及培訓員工的成本。好處包括減少勞動力和時間來做出決策,做出更好的決策,最終提高利潤和增長。