1. 程式人生 > >資料清洗(三)------檢查資料邏輯錯誤

資料清洗(三)------檢查資料邏輯錯誤

檢查資料邏輯錯誤

資料邏輯錯誤通常分兩種:(1)被調查者輸入的選項不符合要求。eg:最多3個選項的多選題,答題者選了4個選項。

                                            (2)錄入錯誤。eg:二分法的多選題錄入時,出現了0和1以外的資料。

檢查方法:if函式和or函式

IF(logical_test,value_if_true,value_if_false)

OR(logical1,logical2,logical3,.......)----至少一個引數為真,就返回true

AND(logical1,logical2,logical3,.......)--所有引數都為真時,才返回true

(一)用IF函式檢查第一類錯誤

有4道題,每道題有ABCDEFG個選項,每個選項被選中則為1,否則為0,既不為0又不為1的屬於錄入錯誤。



如上圖所示,在 I21單元格內輸入=IF(COUNTIF(B21:H21,"<>0")>3,"錯誤","正確")等式,在檢驗列的剩下單元格也輸入相應的等式。由結果可知,被調查者在答第2道題的時候輸入的選項不符合要求。


(二)用條件格式和OR函式標記錄入錯誤

開始---條件格式---突出顯示單元格規則---其他規則---使用公式確定要設定格式的單元格---在“為符合此公式的值設定格式”文字框中輸入“=OR(B21=1,B21=0)=FALSE”



由上圖所示,錄入錯誤即被標記出來。