統計學:隨機變數及離散型機率分佈 (Random Variables and Discrete Probability Distributions)

隨機變數 (Random Variable)


隨機實驗 (random experiment) 的每一個結果 (outcome) 指定相對應的數字的函數或規則。

舉例來說,擲兩顆骰子,我們可以定義隨機變數 \(X\) 是兩顆骰子的點數的和,\(X\) 的值域為 \(2, 3, 4, ..., 12\)。

隨機變數 \(X\) 的某個值 \(x\) 發生的機率表示為 \(P(X=x)\) 或 \(P(x)\)。

離散型隨機變數 (Discrete Random Variable)


值域為「有限」,或「無限且與自然數有一對一的對應」。

連續型隨機變數 (Continuous Random Variable)


值域為「某一區間」或「區間的集合」內的所有數值。

機率分佈 (Probability Distribution)


描述隨機變數的「值」及其「相對應的機率」的表格、公式或圖。

離散型隨機變數的機率分佈的要求 (Requirements for a Distribution of a Discrete Random Variable)


1. \(0 \leq P(x) \leq 1 \text{, for all x} \)

2. \(\sum_{\text{all} x}P(x) = 1\)

母體平均, 又稱為期望值 (Population Mean, or Expected Value)


\(E(X) = \mu = \sum_{\text{all} x}x P(x) \)

母體變異數 (Population Variance)


\( V(X) = \sigma^2 = \sum_{\text{all} x}(x - \mu)^2 P(x) \)

期望值定律 (Laws of Expected Value)


1. \(E(c) = c\)

2. \(E(X + c) = E(X) + c\)

3. \(E(cX) = cE(X)\)

變異數定律 (Laws of Variance)


1. \(V(c) = 0\)

2. \(V(X + c) = V(X)\)

3. \(V(cX) = c^2 V(X)\)

雙隨機變數的機率分佈 (Bivariate Distributions)


離散型雙隨機變數的機率分佈的要求 (Requirements for a Discrete Bivariate Distribution)


1. \(0 \leq P(x,y) \leq 1 \text{, for all pairs of values (x,y)} \)

2. \(\sum_{\text{all} x} \sum_{\text{all} y} P(x, y) = 1 \)

共變異數 (Covariance)


\(COV(X, Y) = \sigma_{xy} = \sum_{\text{all} x} \sum_{\text{all} y} (x-\mu_x) (y-\mu_y) P(x, y) \)

雙隨機變數的和的期望值定律 (Laws of Expected Value of the Sum of Two Variables)


\( E(X + Y) = E(X) + E(Y) \)

雙隨機變數的和的變異數定律 (Laws of Variance of the Sum of Two Variables)


\( V(X + Y) = V(X) + V(Y) + 2COV(X,Y) \)

二項式實驗 (Binomial Experiment)


1. 包含固定次數(表示為 \(n\))的實驗。

2. 每次的實驗都有可能出現兩種結果。標示為成功或失敗。

3. 成功的機率是 \(p\);失敗的機率是 \(1-p\)。

4. 每次的實驗彼此是獨立的。也就是說,某次實驗的結果,不會影響到其他次實驗的結果。

舉例,擲銅板 100 次。

舉例,在只有 2 位候選人的情況下,調查 5000 位選名會投給哪位候選人。

若滿足上述 2,3,4 的條件,則稱每次的實驗為白努力程序 (Bernoulli process)。

二項式隨機變數 (Binomial Random Variable)


\(n\)次二項式實驗中成功的次數。

二項式機率分佈 (Binomial Probability Distribution)


在實驗 \(n\) 次的二項式實驗中,若成功的機率為 \(p\),成功 \(x\) 次的機率為

\( P(x) = \frac{n!}{x!(n-x)!} p^x (1-p)^{n-x} \text{, for x=0,1,2,...,n} \)

二項式隨機變數的算術平均數 (Mean of a Binomial Random Variable)


\( \mu = np \)

二項式隨機變數的變異數 (Variance of a Binomial Random Variable)


\( \sigma^2 = np(1-p) \)

Poisson 實驗


1. 在任意區間 (interval) 內成功的次數和在其他區間內成功的次數是彼此獨立的。

2. 對於所有相同大小的區間,在任一區間內成功的機率都相同。

3. 在某一區間內成功的機率和該區間的大小成正比。

4. 當區間變小,超過 1 次成功的機率會趨近於 0。

舉例,1 小時內抵達公車站的車次。

舉例,1 天內在某個區段的高速公路發生事故的次數(同時包含時間區間及空間區間)。

Poisson 隨機變數


在 Poisson 實驗中,在指定的區間內成功的次數。

Poisson 機率分佈 (Poisson Probability Distribution)


\( P(x) = \frac{e^{-\mu}\mu^{x}}{x!} \text{, x=0,1,2,...} \)

\( \mu \): 在區間中成功次數的平均值

\( e \): 自然對數的基底 (2.71828)

Poisson 隨機變數的變異數 (Variance of a Poisson Random Variable)


\( \sigma^2 = \mu \)

延伸閱讀


[書籍] Managerial Statistics, Chap 7 Random Variables and Discrete Probability Distribution, 作者: Gerald Keller