1. 程式人生 > >第四十五篇 入門機器學習——數據加載和簡單的數據探索

第四十五篇 入門機器學習——數據加載和簡單的數據探索

com 矩陣 desc ica 花瓣 入門機器學習 data 類別 機器學習

No.1. 導入相關類庫,並加載鳶尾花數據集

技術分享圖片

No.2. 這個鳶尾花數據集類似於一個字典,可以查看都有哪些鍵

技術分享圖片

No.3. ‘DESCR‘這個鍵對應的值為鳶尾花數據集的文檔,簡單對其進行查看

技術分享圖片

從文檔中我們可以了解到,這個數據集共保存了150個鳶尾花樣本;每個樣本包含4個特征:萼片長度、萼片寬度、花瓣長度、花瓣寬度;共分為三類鳶尾花:Iris-Setosa、Iris-Versicolour和Iris-Virginica等等信息

No.4. 通過‘data‘這個鍵,可以訪問150個樣本的數據

技術分享圖片

很明顯,這些數據保存在一個矩陣中,我們可以檢查這個矩陣的形狀

技術分享圖片

150行4列,表示150個樣本,每個樣本有4個特征

No.6. 每個樣本所屬的鳶尾花類別,通過索引的方式保存在一個向量中,可以通過‘target‘這個鍵進行訪問

技術分享圖片

No.7. 相應的,每個索引所指代的鳶尾花名稱保存在另一個向量中,可以通過‘target_names‘這個鍵進行訪問

技術分享圖片

No.8. 我們可以嘗試選取鳶尾花的前兩個特征繪制散點圖

技術分享圖片

No.9. 添加篩選條件,對不同種類的鳶尾花添加不同樣式

技術分享圖片

No.10. 我們再試著繪制鳶尾花的另外兩個特征的散點圖

技術分享圖片

第四十五篇 入門機器學習——數據加載和簡單的數據探索