1. 程式人生 > >用DecisionTree決策樹來求取分類閾值

用DecisionTree決策樹來求取分類閾值

在二分類任務中,我們經常需要根據概率值來確定類別。通常的方法是設定0.5的中間閾值,但是在一些不平衡的任務中,我們並不知道閾值應該設定為多少,這時可以簡單的利用決策樹的方法,視覺化的來求得最優閾值。當然你也可以用一個簡單的神經網路來擬合這個閾值。

下面就是python呼叫sklearn庫來實現的閾值求解程式碼:

from sklearn import tree

X = []
Y = []
for line in f_lines:
    x = [line.strip()]
    X.append(x)
for line in f1_lines: 
    Y.append(line.strip
()) print(len(X)) print(len(Y)) clf = tree.DecisionTreeClassifier() clf = clf.fit(X, Y) print(clf.get_params()) import graphviz dot_data = tree.export_graphviz(clf,out_file=None) graph = graphviz.Source(dot_data) graph.render("iris") graph