1. 程式人生 > >Python sklearn庫中決策樹tree.DecisionTreeClassifier()函式引數介紹

Python sklearn庫中決策樹tree.DecisionTreeClassifier()函式引數介紹


max_leaf_nodes:int,None 可選(預設為None)
    在最優方法中使用max_leaf_nodes構建一個樹。最好的節點是在雜質相對減少。如果是None則對葉節點的數目沒有限制。如果不是None則不考慮max_depth.


class_weight:dict,list of dicts,"Banlanced" or None,可選(預設為None)
    表示在表{class_label:weight}中的類的關聯權值。如果沒有指定,所有類的權值都為1。對於多輸出問題,一列字典的順序可以與一列y的次序相同。
    "balanced"模型使用y的值去自動適應權值,並且是以輸入資料中類的頻率的反比例。如:n_samples/(n_classes*np.bincount(y))。
    對於多輸出,每列y的權值都會想乘。
    如果sample_weight已經指定了,這些權值將於samples以合適的方法相乘。


random_state:int,RandomState instance or None
    如果是int,random_state 是隨機數字發生器的種子;如果是RandomState,random_state是隨機數字發生器,如果是None,隨機數字發生器是np.random使用的RandomState instance.


persort:bool,可選(預設為False)
    是否預分類資料以加速訓練時最好分類的查詢。在有大資料集的決策樹中,如果設為true可能會減慢訓練的過程。當使用一個小資料集或者一個深度受限的決策樹中,可以減速訓練的過程。