格魯布斯檢驗法
格拉布斯檢驗法(Grubbs's test),有時也被稱為最大歸一化殘差檢驗,是一種在統計學中用於分析異常值的方法,因發明者弗蘭克·E·格拉布斯而得名[1]。
定義
格拉布斯檢驗法基於數據服從正態分布的假設,用於檢驗單變量數據集內的離群值。因此,在使用格拉布斯檢驗法時,必須先檢驗數據的分布是否可以用正態分布進行近似[2]。
格拉布斯檢驗法定義於如下假設之上:
- H0:數據集中沒有異常值;
- Ha:數據集中只有一個異常值。
定義格拉布斯檢驗統計量為:
如果採用雙邊檢驗的方法,則格拉布斯檢驗可按照以下步驟進行:
將數據集中的 個數值由最小排列到最大,則最小值 或最大值 為可能的可疑數值。若要檢驗最小值是否為離群值,則可以按如下公式計算:
檢驗最大值時,則為:
對該雙邊檢驗,若下式成立,則在置信度為 處,無偏差值的假設不成立:
參考文獻
- ^ Grubbs, Frank E. Sample criteria for testing outlying observations. Annals of Mathematical Statistics. 1950, 21 (1): 27–58. doi:10.1214/aoms/1177729885.
- ^ 1.3.5.17 Detection of Outliers. NIST/SEMATECH e-Handbook of Statistical Methods. NIST. 2012 [2019-03-09]. (原始內容存檔於2019-06-19).
參見
延伸閱讀
- Grubbs, Frank. Procedures for Detecting Outlying Observations in Samples. Technometrics (Technometrics, Vol. 11, No. 1). February 1969, 11 (1): 1–21. JSTOR 1266761. doi:10.2307/1266761.
- Stefansky, W. Rejecting Outliers in Factorial Designs. Technometrics (Technometrics, Vol. 14, No. 2). 1972, 14 (2): 469–479. JSTOR 1267436. doi:10.2307/1267436.