1. 程式人生 > >流水線和復合估算器

流水線和復合估算器

輸出 只需要 ans 連接 特征 for 那是 通過 一次

變換器通常與分類器,回歸器或其他估計器組合以構建復合估計器。最常見的工具是 管道。管道通常與FeatureUnion結合使用 ,後者將變換器的輸出連接成復合特征空間。 TransformedTargetRegressor處理轉換目標 (即對數轉換y)。相反,Pipelines只轉換觀察到的數據(X)。

管道:鏈式估算器
Pipeline可用於將多個估算器鏈接成一個。這是有用的,因為在處理數據時通常存在固定的步驟序列,例如特征選擇,標準化和分類。Pipeline這裏有多種用途:

方便和封裝
你只需要打電話fit和predict你的一次數據,以適應估計的整個序列。
聯合參數選擇
您可以 立即對管道中所有估算器的參數進行網格搜索。
安全
通過確保使用相同的樣本來訓練變壓器和預測器,管道有助於避免將測試數據中的統計信息泄漏到交叉驗證中的訓練模型中。
管道中的所有估算器(最後一個除外)必須是變換器(即必須有transform方法)。最後一個估計器可以是任何類型(變換器,分類器等)。

說的很對,我已經放棄自己寫了,那是相當的浪費時間,並行緩存都要自己寫,還有其他麻煩就不說了!

Pipelines and composite estimators

流水線和復合估算器