統計分析之ROC曲線與多指標聯合分析——附SPSS繪製ROC曲線指南
在進行某診斷方法的評估是,我們常常要用到ROC曲線。這篇博文將簡要介紹ROC曲線以及用SPSS及medcal繪製ROC曲線的方法。
定義
ROC受試者工作特徵曲線 (receiver operating characteristic curve,簡稱ROC曲線),又稱為感受性曲線(sensitivity curve)。得此名的原因在於曲線上各點反映著相同的感受性,它們都是對同一訊號刺激的反應,只不過是在兩種不同的判定標準下所得的結果而已。受試者工作特徵曲線就是以假陽性概率(False positive rate)為
ROC曲線是根據一系列不同的二分類方式(分界值或決定閾),以真陽性率(靈敏度)為縱座標,假陽性率(1-特異度)為橫座標繪製的曲線。傳統的診斷試驗評價方法有一個共同的特點,必須將試驗結果分為兩類,再進行統計分析。
主要作用
1.ROC曲線能很容易地查出任意界限值時的對疾病的識別能力。
2.選擇最佳的診斷界限值。ROC曲線越靠近左上角,試驗的準確性就越高。最靠近左上角的ROC曲線的點是錯誤最少的最好
3.兩種或兩種以上不同診斷試驗對疾病識別能力的比較。在對同一種疾病的兩種或兩種以上診斷方法進行比較時,可將各試驗的ROC曲線繪製到同一座標中,以直觀地鑑別優劣,靠近左上角的ROC曲線所代表的受試者工作最準確。亦可通過分別計算各個試驗的ROC曲線下的面積(AUC)進行比較,哪一種試驗的 AUC最大,則哪一種試驗的診斷價值最佳。
繪製方法
SPSS:
首先在分析列表選擇ROC曲線圖
輸入檢驗變數和狀態變數,如果檢驗變數輸入多個,則會在圖上顯示每個檢驗變數的曲線。狀態變數還需輸入表示陽性組的數值。
在輸出檔案中可以看到ROC曲線
有時ROC曲線的AUC小於0.5這是由於SPSS預設越大的量越為陽性造成的
點選選項
選擇較小的檢驗結果表示更明確地檢驗即可
多指標聯合分析時,只需將預測概率值加入到檢驗變數中即可。預測概率值計算方法見https://blog.csdn.net/tuanzide5233/article/details/83240500