在做模型訓練的時候,尤其是在訓練集上做交叉驗證,通常想要將模型儲存下來,然後放到獨立的測試集上測試,下面介紹的是Python中訓練模型的儲存和再使用。

scikit-learn已經有了模型持久化的操作,匯入joblib即可

from sklearn.externals import joblib
  • 1

模型儲存

>>> os.chdir("workspace/model_save")
>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)  
>>> clf.fit(train_X,train_y)
>>> joblib.dump(clf, "train_model.m")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

通過joblib的dump可以將模型儲存到本地,clf是訓練的分類器

模型從本地調回

>>> clf = joblib.load("train_model.m")
  • 1

通過joblib的load方法,載入儲存的模型。

然後就可以在測試集上測試了

clf.predit(test_X) #此處test_X為特徵集