1. 程式人生 > >箱線圖概念

箱線圖概念

箱線圖概念  https://blog.csdn.net/kevinelstri/article/details/52937236

      箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組資料分散情況資料的統計圖。 
這裡寫圖片描述

      計算過程:

(1)計算上四分位數(Q3),中位數,下四分位數(Q1) 
(2)計算上四分位數和下四分位數之間的差值,即四分位數差(IQR,interquartile range)Q3-Q1 
(3)繪製箱線圖的上下範圍,上限為上四分位數,下限為下四分位數。在箱子內部中位數的位置繪製橫線。 
(4)大於上四分位數1.5倍四分位數差的值,或者小於下四分位數1.5倍四分位數差的值,劃為異常值(outliers)。 
(5)異常值之外,最靠近上邊緣和下邊緣的兩個值處,畫橫線,作為箱線圖的觸鬚。 
(6)極端異常值,即超出四分位數差3倍距離的異常值,用實心點表示;較為溫和的異常值,即處於1.5倍-3倍四分位數差之間的異常值,用空心點表示。 
(7)為箱線圖新增名稱,數軸等