1. 程式人生 > >網上搜到的一些資料分析工程師的面試題

網上搜到的一些資料分析工程師的面試題

,有哪些聚類分析方法,寫出原理和演算法。
3.SQL題,給出一個表,寫SQL語句,建立表名為B(結構和原表一樣),按列出最早訪問的url
id:使用者名稱
time:使用者訪問時間
url:使用者訪問網頁
4.一個B2C網站,使用者群是辦公室女性,一個表是一週的銷售額:工作日的銷售額都是5000-5100,週六大概是3400,週日大概是3000
(1)從表中資料看出什麼,分析其原因
(2)寫一個運營計劃
5.有ABC三類客戶,現有一個改進計劃,設計資料分析調研支援該決策
(1)調查需要提供什麼資料
(2)如何制定使用者群、資料指標,採用什麼調查分析方法


B、百度2011資料探勘研發工程師實習生筆試題
一、簡答題30分
1. extern”C”{}的作用還有應用場景;
2.寫出兩者你熟悉的設計模式,及應用場景,可以給出虛擬碼;
3.TCP中time_wait是表示那種狀態,及應用場景,以及起好處和壞處;
二、演算法題40分
1. 有一個任務執行機,任務數N<1000,該機器每次只能執行一個任務,而任務之間存在依賴關係,但是任務之間沒有迴圈依賴,請給出適當的任務執行順序。演算法、虛擬碼,並分析其時間複雜度和空間複雜度。
2. 編寫函式,統計在某段英文文字中完整句子的數目,文字中只包括大小寫字母,空格,點號(.),逗號(,)。
完整的句子必須包含至少一個字母並以點號,結束。
要求:完整的程式碼,達到目標;高效;簡潔;
三、系統架構30分
有一個監控系統,有大量的資料記錄包括{url,使用者訪問ip,時間},要對這個監控系統進行維護,並提供查詢。
設計一個能儲存和維護1000億條記錄,實時監控,並支援一下兩種查詢:
1. 指定任意一個時間段(精確到分鐘)和某個url,查處這個時間段內的所有url的訪問總量。
2. 指定任意一個時間段(精確到分鐘)和某個ip,查詢這個時間段內的ip訪問總量。


C、亞信2009資料分析師筆試題記憶版兩小時內完成

先填一張表,包括個人資訊以及對亞信的簡要認識等
第一部分 基礎題  4道
1.某過橋費實行單一價2元,不太合理,應該怎麼進行過橋費的收取
4.如果你是上海移動的諮詢,如何做會上海世博會的舉辦工作,有哪些解決方案
第二部分 統計資料挖掘題  10道
1.計算平均有哪些指標,各有哪些優缺點
2.資料庫查詢語句,給了兩個表
3.相關分析和迴歸分析有什麼關係
4.給出一組資料說是服從正態分佈,求方差和均值
5.給出一個概率分佈函式,求極大似然估計
6.決策樹和神經網路在資料預處理過程中用到哪些方法
7.資料探勘的應用步驟
8.給出浙江移動的移動客戶數和缺失率,問如何建立客戶缺失率預測模型會遇到哪些難題如何解決
9.給了一段文字,大概是說預測彩信使用者量的。三個小問題,a,問會用到哪些統計數學模型,如何選擇模型為什麼 b 如何客戶變數間的資料相關性 c 如何評價模型
第三部分 邏輯推理題 2道

1.給出4個論述,說其中只有一人是正確的,給出了5個答案,說出哪個答案正確
2.5個人分100顆鑽石問題
  5個海盜分100顆寶石,每個人提出一種意見,如果意見有半數或以上通過,就算通過並實施,否則把提出意見的丟海里幹掉,如果第一個人意見沒通過就殺掉並由第二個人提出建議,以此類推。
條件:每個海盜都是很聰明的人,都能很理智的判斷得失,從而做出選擇。第一保命,第二掙錢,第三儘可能多的殺人
問題:第一個海盜提出怎樣的分配方案才能夠使自己的收益最大化