1. 程式人生 > >阿里資料分析師實習生筆試題2014年3月29日

阿里資料分析師實習生筆試題2014年3月29日

時間為90分鐘

題型:10道選擇,3道簡答,2道分析題

回憶版

選擇題:

1)若 r=0,則兩者的關係:

我選擇的是  沒有線性關係

2)以下兩種行為分別對應哪種分類演算法的評價標準:

行為1:警察如何判別某人是小偷

行為2:小偷是如何被識別出來(+_+行為記不清楚,請記得的童鞋補上)

選項是Recall  Precision ROC的組合,這題不會

3)以下哪項對Hadoop的描述是不正確的

4)HIVE的描述

5)公司員工的平均工資是3000,中位數是2500,眾數是2000,則下面哪個說法不正確:

我選擇的是 大部分員工的工資都在2000

6)有個小松鼠從離家100米的地方搬松子回家,共有1000顆(?),小松鼠每次最多能搬50顆,小松鼠很饞,每走兩米就要吃掉一顆,問小松鼠最後能搬多少顆松子回家?

A 0 B 5 C 10 D 25 嗚嗚~記不太清,我選了0

7)正態分佈的區間估計,若其他條件不變,置信水平L越小,則置信上限和置信下限的差

A 越大 B 越小 C 不變 D 不確定

簡答:

1)世界上每十萬人中有一個患有艾滋病,如果某人患有艾滋病,則一定會被檢查出來,如果某人沒有患艾滋病,被錯誤診斷的概率為1%,假設有一個人被診斷出是陽性,那麼他患艾滋病的概率多大?

2)按要求寫出SQL語句

a)表t1,欄位有user_id(字元型),city(城市,字元型),age(年齡,數值型)

b)表t2,欄位有user_id(字元型),yyyymmdd(數值型,日期),age(年齡,數值型),city,GMV_1314(銷量,數值型)

其中表t2中的user_id都能在t1中user_id找到

建立一個表t3,使其中包含t1中所有user_id,年齡大於或者等於16,城市是廣州或者深圳,表t2中12月銷量彙總

3)什麼是層次分析法?使用的一般過程?舉個使用的場景或者例子

分析:

1)淘寶是萬能的,怎挑出小眾且有品位的店鋪,給出方案

2)雙11做促銷活動,商家發放促銷券,請從平臺和商家角度完成以下分析:

a)給出評估指標

b)根據給出的資料,為商家和平臺推動計劃給出建議

其中,優惠券是商家自動發放的,有兩種,一種是滿200減50,一種是滿300減100;優惠券發放日期為10月15到11月10,使用時間為11月11日