1. 程式人生 > >kaggle窺屏(知乎說入門需要獨立完成101和playground比賽)

kaggle窺屏(知乎說入門需要獨立完成101和playground比賽)

1.titanic

主要是設計pd的資料處理,使用的是最簡單的regression模型,不太明白怎麼本地跑程式碼。

2.digital recognizer

3.我去,原來101說的是playground。

4.房價預測,

可以使用RandomForestRegressor和DecisionTreeRegressor,

對資料前處理:

https://www.kaggle.com/serigne/stacked-regressions-top-4-on-leaderboard/notebook

one-hot ;使正態分佈;drop(['some_columns'],axis = 1 )

後面的有些不是很明白,

LabelEncoder和get_dummy不一樣

 

-- NORMAL --