1. 程式人生 > >深度學習中的訓練集與測試集

深度學習中的訓練集與測試集

摘自https://testerhome.com/topics/10811

測試集與訓練集

看上面的圖,這是一個邏輯迴歸演算法的DAG(有向無環圖),它是這個二分類演算法的簡單應用流程的展示。 

可以看到我們在採集完資料並做過處理後,會把資料進行拆分。 訓練集作用訓練模型,而測試集會被輸入到模型中來評估模型的效能。這是我們測試人工智慧服務的最常用方式, 通過這個流程會產生一個模型的評估報告,如下:

當然這種拆分是有一定的規則的,如果資料集比較小,那麼一般遵循7:3的經驗拆分,7分用來訓練模型,3分用來評估模型效能。 測試集不能太少,少了結果不準確,不能太多,太多了會導致訓練集資料不足。 但這個規則不是死的。 如果資料集本身比較大,例如有100W行資料。那麼我們抽取其中1W行做為測試集也就可以了。