機器學習中的sklearn中的聚類資料生成器

阿新 • • 發佈：2018-12-09

引數的意思：

n_samples: int, optional (default=100)待生成的樣本的總數。
n_features: int, optional (default=2)每個樣本的特徵數。
centers: int or array of shape [n_centers, n_features], optional (default=3)要生成的樣本中心（類別）數，或者是確定的中心點。
cluster_std: float or sequence of floats, optional (default=1.0)每個類別的方差，例如我們希望生成2類資料，其中一類比另一類具有更大的方差，可以將cluster_std設定為[1.0,3.0]。
center_box

: pair of floats (min, max), optional (default=(-10.0, 10.0))
shuffle: boolean, optional (default=True)
random_state:

return：

X : array of shape [n_samples, n_features]
The generated samples.
生成的樣本資料集。
y : array of shape [n_samples]
The integer labels for cluster membership of each sample.

1）make_classification

sklearn.datasets.make_classification(n_samples=100, n_features=20, n_informative=2, n_redundant=2,
                   n_repeated=0, n_classes=2, n_clusters_per_class=2, weights=None,
                    flip_y=0.01, class_sep=1.0, hypercube=True,shift=0.0, scale=1.0,
                   shuffle=True, random_state=None)

通常用於分類演算法。
n_features :特徵個數= n_informative（） + n_redundant + n_repeated
n_informative：多資訊特徵的個數
n_redundant：冗餘資訊，informative特徵的隨機線性組合
n_repeated ：重複資訊，隨機提取n_informative和n_redundant 特徵
n_classes：分類類別
n_clusters_per_class ：某一個類別是由幾個cluster構成的

樣本資料集的標籤。
2）make_circles and make_moons

sklearn.datasets.make_circles(n_samples=100, shuffle=True, noise=None, random_state=None, factor=0.8)

3）make_gaussian_quantiles 和make_hastie_10_2

sklearn.datasets.make_gaussian_quantiles(mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3,
shuffle=True, random_state=None)

機器學習中的sklearn中的聚類資料生成器

機器學習中的sklearn中的聚類資料生成器

機器學習庫sklearn中整合學習模型引數釋義

機器學習：Python實現聚類算法(三)之總結

軟件——機器學習與Python，聚類，K——means

Python機器學習(1)：KMeans聚類

吳恩達老師機器學習筆記K-means聚類演算法（二）

吳恩達老師機器學習筆記K-means聚類演算法（一）

Stanford機器學習---第九講聚類

Andrew Ng 機器學習筆記 12 ：聚類

機器學習之agglomerative_clustering-層次聚類

【機器學習筆記12】聚類（k-means)

【機器學習筆記13】聚類（高斯混合聚類）

機器學習實戰———k均值聚類演算法

吳恩達機器學習個人筆記(七)-聚類

【原】Coursera—Andrew Ng機器學習—Week 8 習題—聚類和降維

【機器學習】K-means聚類演算法初探

機器學習實戰-62:層次聚類演算法(Hierarchical Clustering)

python機器學習：K-means聚類演算法

用Python開始機器學習（10：聚類演算法之K均值）

python機器學習案例系列教程——聚類演算法總結

機器學習中的sklearn中的聚類資料生成器

相關推薦