1. 程式人生 > >資料探勘-目錄-特徵處理(feature)

資料探勘-目錄-特徵處理(feature)

Feature Extractors(特徵提取)

    TF

    TF-IDF

    Word2Vec

    CountVectorizer

Feature Transformers(特徵變換)

    Tokenizer(分詞器)

    StopWordsRemover(停用字清除)

    n-gram

    Binarizer(二元化方法)

    PCA(主成成分分析)

    PolynomialExpansion(多項式擴充套件)

    Discrete Cosine Transform (DCT-離散餘弦變換)

    StringIndexer(字串-索引變換)

    IndexToString(索引-字串變換)

    OneHotEncoder(獨熱編碼)

    VectorIndexer(向量型別索引化)

    Normalizer(範數p-norm規範化)

    StandardScaler

    MinMaxScaler(最大-最小規範化) 

    MaxAbsScaler(絕對值規範化)

    Bucketizer(分箱器)

    ElementwiseProduct (Hadamard乘積)

    SQLTransformer(SQL變換)

VectorAssembler(特徵向量合併)

    QuantileDiscretizer(分位數離散化)

Feature Selectors(特徵選擇)

    VectorSlicer(向量選擇)

    RFormula(R模型公式) 

    ChiSqSelector(卡方特徵選擇)