1. 程式人生 > >機器學習(四)邏輯迴歸模型訓練

機器學習(四)邏輯迴歸模型訓練

本篇不講演算法

只講用Python (pandas, matplotlib, numpy, sklearn) 進行訓練的一些要點

1.合併index

np.concatenate([index1,index2])

2.from sklearn.cross_validation import train_test_split

train_test_split(X, y, test_size = 0.3, random_state = 0) 一般要指定切分比例

返回X_train, X_test, y_train, y_test

做樣本劃分用的

3.

接下來看看具體怎麼訓練模型

from sklearn.linear_model import LogisticRegression

from sklearn.cross_validation(現在應該是model_selection,版本更新了) import KFold, cross_val_score

from sklearn.metrics import confusion_matrix, recall_score, classification_report

所以總的來說沒有一步一步程式碼寫的必要,這裡也就不寫了。

總結一下,主要有以下幾個操作:

1.train_test_split劃分資料集

2.KFold建立交叉驗證

3.recall_score 和 cross_val_score 的使用

4.把資料填進合適的模型