1. 程式人生 > >學習筆記:聚類降維矩陣分解

學習筆記:聚類降維矩陣分解

學習內容:

        lightgbm, pca, clustering, k-means

關鍵詞:

        聚類,降維

LightGBM:

        LightGBM(Light Gradient Boosting Machine)是微軟開發基於決策樹演算法的分散式梯度提升框架.支援高效率並行運算,低記憶體消耗,高準確率分散式支援.

         LightGBM優化:

            基於Histogram的決策樹演算法,僅需要儲存離散化後的數值,不需要原始特徵值無需排序,相對於xgboost的exact演算法,記憶體佔用量為xgboost的1/8.同時,對每個個正計算增益點的次數減少,次數為bin次.帶有深度限制的leaf-wise演算法(leaf-wise高精度,容易過擬合,level-wise低效,易進行多執行緒工作).LightGBM可以直接支援類別特徵


        LightGBM使用:

             imort lightgbm as lgb 或者from sklearn import lgb.sklearn.LGBMClassifier

第一步構造dataset:

第二步進行訓練:


第三部進行評價: