[學習筆記] 取樣分佈 Sampling Distributions

取樣分佈 Sampling Distributions

對於特定樣本數 (sample size) N,所有可能的取樣之統計量(舉例來說,算術平均數)的機率分佈。

算術平均數的取樣分佈 Sampling Distribution of the Mean

若母群(X)為常態分佈(算術平均數為μ,標準差為σ),
則對於任意樣本數,所有可能的取樣的算術平均數(eq1)亦為常態分佈
且算術平均數為μ,標準差為eq2

可以看出來,若樣本數愈大,算術平均數的變異數及標準差會越小。

舉例來說,若台灣人口(設2000萬人)的體重呈常態分佈,則任意調查N個人,所有可能的取樣的體重的算術平均數,也是呈常態分佈。
若N=1,所有可能的取樣為2000萬筆體重資料。

中央極限定理 Central Limit Theorem

從任何一個母群(算術平均數為μ,標準差為σ)中取大小為N之樣本,
當N足夠大時,取樣的算術平均數會接近常態分佈
且算術平均數為μ,標準差為eq2

一般來說,N=30,可視為「足夠大」。是否足夠大,視母群的分佈近似常態分佈的程度。

舉例來說,電機系主任宣稱電機系畢業生的月薪平均為NT$80,000,標準差為$10,000。
某甲想要驗證這個說法的真實性,調查了25位電機系畢業生,發現月薪平均為NT$75,000。
某甲想要瞭解,樣本數為25,月薪平均<=NT$75,000的機率。
X: 母群的月薪。
eq1: 所有可能的取樣的算術平均數,其中樣本數為25。
我們想計算的是 P(eq1 < 75,000)
eq3
機率很低,所以可以認為電機系主任的說法很可能是不符合事實的。

fig1

延伸閱讀

[學習筆記] 統計學:基本概念

Managerial Statistics, Chap 9 Sampling Distributions