1. 程式人生 > >大資料平臺效能測試(phrase1)

大資料平臺效能測試(phrase1)

前一個月,一直在和師兄做實驗室的一個專案,沒有時間更新。現把第一階段結果附上,希望能夠幫到更多做類似事情的朋友。

本次測試我們使用TPCDS標準進行。第一階段我們主要測試hive&kudu匯入資料速度以及impala+hive和impala+kudu兩者的查詢速度。

結果上來看

針對較大規模資料 (100G),Hive的匯入效能在行數較少的表上面依然表現微弱的優勢,但是針對行數超過千萬量級資料表時,Kudu的匯入效能具有巨大的優勢,針對 Store_sales匯入時間僅為Hive的十分之一。 針對較大規模的資料 (100G),Kudu的查詢效能有較大的優勢, 而針對小規模資料 (10G)Hive和 Kudu具有類似的查詢效果