1. 程式人生 > >關於DTCC數據庫技術大會

關於DTCC數據庫技術大會

hbase 網易 多表 多維 spa lin 倉庫 索引 多維分析

本次DTCC數據庫技術大會是第9屆了,這次大會雖然有不少公司的產品推介,總體來說還是有不少幹貨的。

專場較多,有選擇地主要聽了大數據實踐跟流式計算這塊。網易跟滴滴的分享比較不錯。

了解到了現在大家是用spark streaming/ Flink來進行流式計算的比較多。

我們之前都是用kafka+storm+spark來做實時倉庫的。

不知道spark streaming/Flink跟storm比較有什麽先進之處,這個問題記下來,似乎是開發更簡潔?使用SQL式開發?

對於hbase的查詢,我們之前是通過solr來做二級索引,用kylin做多維分析。

但是大家現在好像用kudu+impala來做搜索的比較多,不過kylin用的也不少。但是大多沒說kylin使用中的坑,有點遺憾。

說到kylin,還見到kylin的創始團隊了,但是對於我提問的多表join、多字段group by效率低下的問題似乎沒有解決,只說可能是我使用的方式不對。沒有再追問了。

關於DTCC數據庫技術大會