1. 程式人生 > >2018-09-14面經

2018-09-14面經

1、實時資料加工,兩個表的資料如何做join?

2、spark 兩個RDD做join,如何優化?

3、python 的yield和lambda是什麼作用?

4、java的hashMap原理?

5、svm核對映?

6、決策樹分類原理?

7、kafka consume group個數、consume 個數和kafka的partition個數關係?

8、p值含義?

9、湯普森悖論?

10、天貓某天使用者數增加了,分析一下原因?學生群體比白領群體新增使用者多,分析一下?

11、colesce和repartition區別

12、衡量模型的指標有哪些?f1是什麼?