1. 程式人生 > >資料清洗(二)---------缺失資料處理

資料清洗(二)---------缺失資料處理

缺失資料處理

(一)定位輸入(適用條件缺失值以空白單元格的形式展現)

選擇單元格區域---快捷鍵 Ctrl+G彈出定位對話方塊---選擇定位條件---空值---確定





(二)處理缺失值

a.用一個樣本統計量的代替缺失值。典型做法:使用改變數的樣本平均值代替缺失值。

b.用一個統計模型(迴歸模型,判別模型)計算出來的值代替缺失值,得用專業資料分析軟體。

c.將有缺失值的記錄刪除,但會導致樣本量的減少。

d.將缺失值的記錄保留,僅在相應的分析中排除。適用條件:樣本量大,缺失值數量不多,變數之間相關度低。


實際操作情況中,a法最常見實用,Ctrl+G定位查詢,Ctrl+Enter快捷鍵一次性輸入樣本平均值。


(二)查詢替換(適用條件:缺失值以錯誤識別符號形式出現)

選擇單元格區域---Ctrl+F查詢---Ctrl+H替換