總體

統計分析的對象,具某公共性質的物件之全體

總體(英語:statistical population,中國大陸作總體,香港作總體,台灣作母體,又稱為母集團整體),是指統計學中是指由許多有某種共同性質的事物組成的集合[1],會在此集合中選出樣本進行統計推斷,選取樣本的方式可能會用亂數或是其他抽樣方式。

例如要針對所有烏鴉的共有特性進行研究,總體是目前存在、以前曾經存在或是未來可能存在的所有烏鴉,此情形下,因為時間的限制、地域可取得性的限制、以及研究者的有限資源等,不可能觀測總體中的每一個,因此研究者會從總體中產生樣本,再由樣本的特性去了解總體的特性。

產生樣本的目的之一就是為了要知道總體的特性,包括

  • 總體均值,用表示[2],若總體的數量是有限的,總體均值等於所有數值的算術平均數
  • 總體標準差,用表示,基本定義如下

子總體

總體的子集稱為子總體[3],若不同的子總體有不同的性質,則整個總體具有異質性,若將總體區分為不同的子總體,可以對整個總體的特質有較多的了解。例如某特定藥物可能對不同的子總體有不同的影響,若在取樣時沒有取到該子總體,可能就忽略了這樣的影響。

區分子總體也有助於更精確的估計參數,例如考慮男性和女性是不同的子總體,可以針對人類身高的分佈有更好的建模。

包括子總體的總體可以用混合模式建模,將各子總體的分佈結合成整個總體的分佈,不過即使子總體都可以用簡單的模型來表示,總體仍可能在用簡單模型來擬合時有很差的效果。例如有二個都是正態分佈的子總體,兩者的標準差相同,但平均值不同,所得的總體分佈會是峰度較低的正態分佈,若兩者平均值的差距過大,甚至還會變成雙峰分佈英語bimodal distribution,而其標準差也可能會比原來子總體的要大。例如有二個都是正態分佈的子總體,兩者的平均值相同,但標準差不同,會有峰度較高的正態分佈。

相關條目

參考資料

  1. ^ 李金昌、蘇為華. 统计学. 高等院校精品課程系列教材. DynoMedia Inc. 2007: p.12. ISBN 711120493X. [永久失效連結]
  2. ^ Underhill, L.G.; Bradfield d. (1998) Introstat, Juta and Company Ltd. ISBN 0-7021-3838-X p. 181頁面存檔備份,存於互聯網檔案館
  3. ^ 杜子芳. 抽样技术及其应用. 清華大學出版社有限公司. 2005: p.220. ISBN 7302110395.