You are on page 1of 5

2.

檢定統計方法及其應用
欲了解統計檢定之概念,我們先從一個簡單的例子開始。假若我們希望知道兩個學校(分別為 A 校
與 B 校,學生人數分別為 1200 人與 1500 人)學生之平均身高是否有差異,我們從兩校學生各抽樣 10
人,計算其平均身高,分別為 170 公分與 169 公分,那麼,我們可以有多少「信心」說 A 校同學比 B
校同學高 ?欲從不到 1%的樣本,及一公分的差距「論斷」,顯然「證據」薄弱了些。進一步,若我們各
抽樣 800 名同學計算出的平均身高為 170 公分與 165 公分,則顯然,即使我們不能百分百保證 A 校
高於 B 校,「信心」也會高出許多。但「信心」到底有多高?這就是統計檢定要解決的問題。我們先介紹關
於統計檢定的相關名詞與定義,再說明如何用 Excel 的分析工具箱來作統計檢定。
統計檢定與估計均為統計推論(以有限樣本推估母體統計特性)的形式,估計乃利用抽樣的樣本結
果推論單一母體特性;而統計檢定必須先對母體特性作假設(即假想的答案),然後根據母體隨機抽
樣的樣本特性,檢驗此假設是否可以被接受。
統計假設(Statistical hypothesis)是指有關母體特性之敘述,其真(True)假(False)可由此母體抽樣所
得之樣本訊息判斷。統計假設有兩種形式彼此互補,分別為「虛無假設」與「對立假設」,「虛無假設」以
H0 表示,為我們希望透過統計檢定加以否定的,而「對立假設」以 H1 表示,為「虛無假設」的反面。
統計假設檢定的精神是—「除非有足 的證據可以否定 H0,否則只好接受 H0」。但接 受H0 並不表
示 H0 絕對為真,只是由樣本資料中我們沒有「足夠」證據否定它(即無法通過「顯著性檢定」)。由此,
我們可以了解,統計檢定的結果可能出現兩種誤差,稱之為「型 I 誤差」與「型 II 誤差」 「 型 I 誤差」意

指其實 H0 是真的,但統計檢定的結果,我們卻拒 接受 H0;「型 II 誤差」意指其實 H0 是假的,但
統計檢定的結果我們卻接受了 H0。
「型 I 誤差」是我們不希望發生的,我們當然希望它發生的機率越小越好,「型 I 誤差」發生之機率
稱為「顯著水準( α )」,通常我們會取「顯著水準( α )」為 0.05 或 0.01,端視我們不希望「型 I 誤差」發生
機率高低而定。
假設檢定根據虛無假設的形式,可分為「單尾檢定」與「雙尾檢定」;「單尾檢定」用於虛無假設為「
≥ 」或「 ≤ 」者;「雙尾檢定」用於虛無假設為「=」者。
Excel 分析工具箱中提供的統計檢定方法包括(共五種):

(1) F 檢定:用以檢定兩常態母體變異數是否相等。
(2) Z 檢定:假設兩母體變異數已知,檢定兩常態母體平均數是否相等,但樣本必須大於或等於
30(即大樣本之均 檢定)。
(3) t 檢定:為針對小樣本,檢定兩常態母體平均數是否相等。又可分為三種:分別為「成對母體平均
數差異檢定」、「假設變異數相等情況下,兩母體平均數差異檢定」以及「假設變異數不相等情況 下,
兩母體平均數差異檢定」 。

上述五種檢定方法,如何判定使用時機呢?圖 8.1.6 為一分析適用之統計檢定方法之決策樹。

變異數檢定 F 檢定

判斷作「均值
檢定」或「變異 Z 檢定
數檢定」 大樣本

均值檢定 大樣本或
小樣本 成對 t 檢定

小樣本
樣本是
否成對

變異數相等
否 是
之 t 檢定
變異數是
否相等

變異數不相
等之 t 檢定

圖 8.1.6 分析適用之統計檢定方法之決策樹

在圖 8.1.6 中,「均值檢定」或「變異數檢定」之判別,乃依據問題而定,以前述兩校身高比較為例;
若是比較身高之平均差異,則屬於「均值檢定」,若是想知道,兩校學生身高之變異狀況(分散狀況)
是否有差異,則屬於「變異數檢定」。至於大樣本與小樣本之判斷通常會 以 30 為界。成對與否之判斷,
則根據兩兩樣本資料是否相關,例如,我們希望比較兩種評價模型,在過去兩年,每個月的績效(月
報酬,共 24 筆),則樣本資料不能互調,即模型 I 的一月績效不能與模型 II 的二月績效比較,此狀況
則為「成對比較」;最後「變異數是否相等」之判定則需先針對樣本進行「F 檢定」 。
統計檢定在程式交易應用領域中,可用於對不同交易策略模型回測實證結果進行分析,以確認
不同的方法在實證上有無差異(例如新的評價模型之績效表現,是否顯著優於原有模型)。
上述不同的檢定方法,在 Excel 分析工具箱中的操作介面均類似(除了 Z 檢定必須提供兩比較群
體之變異數外,均相同。在 Z 檢定中,由於必須提供變異數資料,可使用 Excel 之 VAR 函數計算樣本
資料之變異數代替母體變異數),在此我們僅以「成對 t 檢定」說明使用方式。
我們使用的範例資料如圖 8.1.7 所示,圖 8.1.7 中,我們使用兩種不同之操作模型,評價 10 隻股
票在過去一段時間之操作績效,每一個樣本為操作模型之報酬率,由於欲進行均值檢定、為小樣本,
且資料具成對特性(因 A 股票操作績效與 B 股票操作績效比沒有意義,故成對);由圖 8.1.6 知,應使
用「t 檢定:成對母體平均數差異檢定」 。
圖 8.1.8 為「成對 t 檢定」分析範例之工具箱設定,在其中必須設定兩輸入變數的範圍、假設的均數
差(在此例中為 0,意指希望比較兩操作模型之績效差異是否為 0)、輸入資料是否包含標記,以及前述
的顯著水準( α )。設定輸出範圍後按「確定」鍵,即可得到如圖 8.1.9 的輸出結果。
由於此例中,乃作「雙尾檢定」,因此在圖 8.1.9 中,我們可觀察「P-Value」(即「P(T<=t)雙尾」)與
「臨界 :(雙尾)」,判斷原則如下:

(1) 若 t 統計量界於雙尾臨界 之內,或 P-Value 大於 α (0.05),則接受 H0;


(2) 否則,拒絕 H0。
圖 8.1.7「成對 t 檢定」分析範例之輸入資料

圖 8.1.8「成對 t 檢定」分析範例之工具箱設定

圖 8.1.9「成對 t 檢定」分析範例之結果輸出

3. 變異數分析方法及其應用
假若,我們希望檢定的是兩個以上母體之均值,又應如何呢?
這就要用到「變異數分析」了。變異數分析是實驗設計(Experimental design)的基本工具,而實驗設
計是科學研究的基礎,由此可知變異數分析的重要性。實驗設計之目的在於檢定一種或多種統計假設;
實驗設計所衡量的基本對象是實驗單位,實驗單位可在不同條件下被衡量,這些條件稱為「因子」
(Factor),因子表現程度稱為「水準」(Level),而不同因子的特定水準組合稱為「處理方式」(Treatment)。
影響實驗單位表現的因子可能包括一個以上,多因子間可能不完全獨立,亦即會產生交互作用
(綜效或綜損),到底哪一單一因子或因子間的交互作用會影響實驗結果,變異數分析可以告訴我們
答案。但變異數分析包含以下幾個基本假設:(1)每個變數的母體均為常態分布;(2)每個母體變異數
均相等;以及(3)各組隨機樣本互為獨立。
在 Excel 的分析工具箱提供的變異數分析工具包括以下三種:

(1) 單因子變異數分析:針對兩組以上由單一因子影響之實驗(樣本)資料,進行分析,檢定其平均數
是否相等。
(2) 不重複實驗之雙因子變異數分析:針對兩組以上由兩因子影響之實驗(樣本)資料,進行分析,檢
定其平均數是否相等,並了解不同因子對實驗結果之影響。
(3) 重複實驗之雙因子變異數分析:針對兩組以上由兩因子影響之「重複」實驗(樣本)資料,進行分析,
檢定其平均數是否相等,並了解不同因子對實驗結果之影響。

以上三種變異數分析,以「重複實驗之雙因子變異數分析」較為複雜,以下以此舉例。
若我們希望檢定特定操作模型之績效表現,受到不同市場狀況(此為因子一,包括上漲、盤整與下
跌三種狀況)或不同類股(電子類股、金融類股、石化類股、水泥股等)之影響,以確認此操作模型適用於
哪一種市場狀況以及哪一種類股。對每一類股在不同市場狀況中,我們以不同時期(測試連續三個期
間之績效表現)重複實驗,所得到的實驗數據如圖 8.1.10 所示,其為「雙因子變異數分析:重複實驗」
之輸入數據。圖 8.1.11 為「雙因子變異數分析:重複實驗」工具箱設定,包括輸入範圍,每一樣本列數
(此即重複實驗次數),與顯著水準( α )。繼而設定輸出範圍後,按「確定」鍵,即可得到如圖 8.1.12 的
輸出,在圖 8.1.12 中,我們可由不同因子之 F 統計量與 F 臨界值之比較,了解個別因子或交互作用
是否會影響實驗結果,判斷原則如下:

(1) 若 F 統計量大於 F 臨界值,則拒絕 H0 之假設;即該因子(或交互作用)「會」影響實驗結果。


(2) 若 F 統計量小於 F 臨界 ,則接受 H0 之假設;即該因子(或交互作用)「不會」影響實驗結果。

圖 8.1.10「雙因子變異數分析:重複實驗」分析範例之輸入資料
圖 8.1.11「雙因子變異數分析:重複實驗」分析範例之工具箱設定

圖 8.1.12「雙因子變異數分析:重複實驗」分析範例之結果輸出

You might also like