1. 程式人生 > >python大資料分析——屬性規約

python大資料分析——屬性規約

屬性規約通過屬性合併或者刪除不相關的屬性來減少資料維數,尋找出最小的屬性子集並確保資料子集的概率分佈儘可能地接近原來資料集的概率分佈。

1.常用方法

(1)合併屬性:將一些舊屬性合為新屬性;

(2)逐步向前選擇:從一個空屬性集開始,每次都從原來屬性集合中選擇一個當前最優的屬性新增到當前屬性子集中,直到無法選擇出最優屬性或滿足一定約束為止;

(3)逐步向後刪除:從一個全屬性集開始,每次從當前屬性子集中選擇一個當前最差的屬性並將其從當前屬性子集中消去,直到無法選擇出最差屬性為止或滿足一定約束為止;

(4)主成分分析:用較少的變數去解釋原始資料中的大部分變數,即將許多相關性很高的變數轉化成彼此相互獨立或不相關的變數;