資料探勘-目錄-特徵處理(feature)
阿新 • • 發佈:2019-02-02
Feature Extractors(特徵提取)
TF
TF-IDF
Word2Vec
CountVectorizer
Feature Transformers(特徵變換)
Tokenizer(分詞器) StopWordsRemover(停用字清除) n-gram Binarizer(二元化方法) PCA(主成成分分析) PolynomialExpansion(多項式擴充套件) Discrete Cosine Transform (DCT-離散餘弦變換) StringIndexer(字串-索引變換) IndexToString(索引-字串變換) OneHotEncoder(獨熱編碼) VectorIndexer(向量型別索引化) Normalizer(範數p-norm規範化) StandardScaler MinMaxScaler(最大-最小規範化) MaxAbsScaler(絕對值規範化) Bucketizer(分箱器) ElementwiseProduct (Hadamard乘積) SQLTransformer(SQL變換)
VectorAssembler(特徵向量合併)
QuantileDiscretizer(分位數離散化)
Feature Selectors(特徵選擇)
VectorSlicer(向量選擇)
RFormula(R模型公式)
ChiSqSelector(卡方特徵選擇)