[學習筆記] 統計學:圖表描述技巧 Graphic and Tabular Descriptive Techniques

基本名詞定義

變數 (variable): 母群體 (population) 或取樣 (sample) 的某種屬性。

舉例來說,母群體為某個班級的學生,想研究的變數為數學期末考的成績。

變數的值域 (values of the variable): 變數所有可能呈現的值的集合。

舉例來說,想研究的變數是數學期末考的成績,值域為0-100的整數。

資料 (data): 對於一項變數,所觀測到的值的集合。

舉例來說,班級有5名學生,想研究的變數是數學期末考的成績,取得的資料為52, 76, 82, 86, 95的整數。

資料的形態

區間資料 (interval data, quantitative data, numerical data)

實數 (real numbers)。

可以對區間資料進行各種運算。

類別資料 (nominal data, qualitative data, categorical data)

舉例來說,變數是班長候選人,值域為「沈佳宜」、「柯景騰」。
有時我們會為類別指定數值。以上例而言,可以指定「沈佳宜」為1,「柯景騰」為2。

對於類別資料,唯一能進行的運算是加總各個類別發生的次數
接續上例,加總「沈佳宜」得33票,「柯景騰」得17票。

序位資料 (ordinal data)

舉例來說,變數是餐廳的評價,值域為「非常好吃」、「好吃」、「普通」、「難吃」、「非常難吃」。
當我們為序位資料指定數值時,需要保持數值的順序性。以上例而言,可以指定「非常好吃」為5、「好吃」為4、「普通」為3、「難吃」為2、「非常難吃」為1。

對於序位資料,能夠進行的運算包含: (1) 加總各個類別發生的次數。 (2) 和排序相關的運算,舉例來說,計算中位數 (median)。

描述類別資料的圖表技巧

頻率分佈 (frequency distribution) 及相對頻率分佈 (relative frequency distribution) 的表格

2011_09_10_DescriptiveStatistics_A1

直條圖 Bar Chart

2011_09_10_DescriptiveStatistics_A2

圓餅圖 Pie Chart

2011_09_10_DescriptiveStatistics_A3

描述區間資料的圖表技巧

範例資料:

2011_09_10_DescriptiveStatistics_B1

直方圖 Histogram

2011_09_10_DescriptiveStatistics_B2

肩形圖 Ogive

2011_09_10_DescriptiveStatistics_B3

描述時間序列資料 (time-series data)

範例資料:

2011_09_10_DescriptiveStatistics_C1

線條圖 Line Chart

2011_09_10_DescriptiveStatistics_C2

描述兩個類別變數之間的關聯性

Cross-classification Table of Frequency

2011_09_10_DescriptiveStatistics_D1

Cross-classification Table of Relative Frequency

2011_09_10_DescriptiveStatistics_D2

直條圖 Bar Chart

2011_09_10_DescriptiveStatistics_D3

比較兩組以上的類別資料

範例資料:

2011_09_10_DescriptiveStatistics_E1

圓餅圖

2011_09_10_DescriptiveStatistics_E2 2011_09_10_DescriptiveStatistics_E3 2011_09_10_DescriptiveStatistics_E4

描述兩個區間變數之間的關聯性

範例資料:

2011_09_10_DescriptiveStatistics_F1

散佈圖 Scatter Diagram

2011_09_10_DescriptiveStatistics_F2

若呈現較強的線性關係,只是代表兩個變數之間的關聯性(correlation)高,並不代表於兩個變數之間一定有因果關係(causation)。

延伸閱讀

[學習筆記] 統計學:基本概念

[學習筆記] 統計學:數值描述技巧 Numerical Descriptive Techniques

Managerial Statistics, Chap 2 Graphic and Tabular Descriptive Techniques