1. 程式人生 > >ML之預測:以某個資料集為例從0到1深入理解科學預測之分類問題的思路框架

ML之預測:以某個資料集為例從0到1深入理解科學預測之分類問題的思路框架

ML之預測:以某個資料集為例從0到1深入理解科學預測之分類問題的思路框架

總體思路設計框架

 

 

 

 

1、獲取資料集,並確定新資料集的規模

資料集規模為(208*61)

2、確定資料集每個屬性的型別

 

3、對資料集統計特徵

Mean = 	0.053892307692307684		Standard Deviation = 	 0.04641598322260027

Boundaries for 4 Equal Percentiles 
[0.0058, 0.024375, 0.04405, 0.0645, 0.4264]
 
Boundaries for 10 Equal Percentiles 
[0.0058, 0.0141, 0.022740000000000003, 0.027869999999999995, 0.03622, 0.04405, 0.05071999999999999, 0.059959999999999986, 0.07794000000000001, 0.10836, 0.4264]
 
Unique Label Values 
{'M', 'R'}

Counts for Each Value of Categorical Label 
['M', 'R']
[111, 97]

4、篩查資料集中的異常值:用分位數圖展示異常點