如何用統計方法檢驗操作策略之成效

2.
檢定統計方法及其應用
欲了解統計檢定之概念，我們先從一個簡單的例子開始。假若我們希望知道兩個學校(分別為 A 校
與 B 校，學生人數分別為 1200 人與 1500 人)學生之平均身高是否有差異，我們從兩校學生各抽樣 10
人，計算其平均身高，分別為 170 公分與 169 公分，那麼，我們可以有多少「信心」說 A 校同學比 B
校同學高 ?欲從不到 1%的樣本，及一公分的差距「論斷」，顯然「證據」薄弱了些。進一步，若我們各
抽樣 800 名同學計算出的平均身高為 170 公分與 165 公分，則顯然，即使我們不能百分百保證 A 校
高於 B 校，｢信心｣也會高出許多。但「信心」到底有多高?這就是統計檢定要解決的問題。我們先介紹關
於統計檢定的相關名詞與定義，再說明如何用 Excel 的分析工具箱來作統計檢定。
統計檢定與估計均為統計推論(以有限樣本推估母體統計特性)的形式，估計乃利用抽樣的樣本結
果推論單一母體特性；而統計檢定必須先對母體特性作假設(即假想的答案)，然後根據母體隨機抽
樣的樣本特性，檢驗此假設是否可以被接受。
統計假設(Statistical hypothesis)是指有關母體特性之敘述，其真(True)假(False)可由此母體抽樣所
得之樣本訊息判斷。統計假設有兩種形式彼此互補，分別為「虛無假設」與「對立假設」，「虛無假設」以
H0 表示，為我們希望透過統計檢定加以否定的，而「對立假設」以 H1 表示，為「虛無假設」的反面。
統計假設檢定的精神是—「除非有足的證據可以否定 H0，否則只好接受 H0」。但接受H0 並不表
示 H0 絕對為真，只是由樣本資料中我們沒有「足夠」證據否定它(即無法通過「顯著性檢定」)。由此，
我們可以了解，統計檢定的結果可能出現兩種誤差，稱之為「型 I 誤差」與「型 II 誤差」「型 I 誤差」意
。
指其實 H0 是真的，但統計檢定的結果，我們卻拒接受 H0；「型 II 誤差」意指其實 H0 是假的，但
統計檢定的結果我們卻接受了 H0。
「型 I 誤差」是我們不希望發生的，我們當然希望它發生的機率越小越好，「型 I 誤差」發生之機率
稱為「顯著水準( α )」，通常我們會取「顯著水準( α )」為 0.05 或 0.01，端視我們不希望「型 I 誤差」發生
機率高低而定。
假設檢定根據虛無假設的形式，可分為「單尾檢定」與「雙尾檢定」；「單尾檢定」用於虛無假設為「
≥ 」或「 ≤ 」者；「雙尾檢定」用於虛無假設為「=」者。
Excel 分析工具箱中提供的統計檢定方法包括(共五種)：
(1) F 檢定：用以檢定兩常態母體變異數是否相等。
(2) Z 檢定：假設兩母體變異數已知，檢定兩常態母體平均數是否相等，但樣本必須大於或等於
30(即大樣本之均檢定)。
(3) t 檢定：為針對小樣本，檢定兩常態母體平均數是否相等。又可分為三種：分別為「成對母體平均
數差異檢定」、「假設變異數相等情況下，兩母體平均數差異檢定」以及「假設變異數不相等情況下，
兩母體平均數差異檢定」。
上述五種檢定方法，如何判定使用時機呢?圖 8.1.6 為一分析適用之統計檢定方法之決策樹。
變異數檢定 F 檢定
判斷作「均值
檢定」或「變異 Z 檢定
數檢定」大樣本
均值檢定大樣本或
小樣本成對 t 檢定
是
小樣本
樣本是
否成對
變異數相等
否是
之 t 檢定
變異數是
否相等
否
變異數不相
等之 t 檢定
圖 8.1.6 分析適用之統計檢定方法之決策樹
在圖 8.1.6 中，「均值檢定」或「變異數檢定」之判別，乃依據問題而定，以前述兩校身高比較為例；
若是比較身高之平均差異，則屬於「均值檢定」，若是想知道，兩校學生身高之變異狀況(分散狀況)
是否有差異，則屬於「變異數檢定」。至於大樣本與小樣本之判斷通常會以 30 為界。成對與否之判斷，
則根據兩兩樣本資料是否相關，例如，我們希望比較兩種評價模型，在過去兩年，每個月的績效(月
報酬，共 24 筆)，則樣本資料不能互調，即模型 I 的一月績效不能與模型 II 的二月績效比較，此狀況
則為「成對比較」；最後「變異數是否相等」之判定則需先針對樣本進行「F 檢定」。
統計檢定在程式交易應用領域中，可用於對不同交易策略模型回測實證結果進行分析，以確認
不同的方法在實證上有無差異(例如新的評價模型之績效表現，是否顯著優於原有模型)。
上述不同的檢定方法，在 Excel 分析工具箱中的操作介面均類似(除了 Z 檢定必須提供兩比較群
體之變異數外，均相同。在 Z 檢定中，由於必須提供變異數資料，可使用 Excel 之 VAR 函數計算樣本
資料之變異數代替母體變異數)，在此我們僅以「成對 t 檢定」說明使用方式。
我們使用的範例資料如圖 8.1.7 所示，圖 8.1.7 中，我們使用兩種不同之操作模型，評價 10 隻股
票在過去一段時間之操作績效，每一個樣本為操作模型之報酬率，由於欲進行均值檢定、為小樣本，
且資料具成對特性(因 A 股票操作績效與 B 股票操作績效比沒有意義，故成對)；由圖 8.1.6 知，應使
用「t 檢定：成對母體平均數差異檢定」。
圖 8.1.8 為「成對 t 檢定」分析範例之工具箱設定，在其中必須設定兩輸入變數的範圍、假設的均數
差(在此例中為 0，意指希望比較兩操作模型之績效差異是否為 0)、輸入資料是否包含標記，以及前述
的顯著水準( α )。設定輸出範圍後按「確定」鍵，即可得到如圖 8.1.9 的輸出結果。
由於此例中，乃作「雙尾檢定」，因此在圖 8.1.9 中，我們可觀察「P-Value」(即「P(T<=t)雙尾」)與
「臨界：(雙尾)」，判斷原則如下：
(1) 若 t 統計量界於雙尾臨界之內，或 P-Value 大於 α (0.05)，則接受 H0；

(2) 否則，拒絕 H0。
圖 8.1.7「成對 t 檢定」分析範例之輸入資料
圖 8.1.8「成對 t 檢定」分析範例之工具箱設定
圖 8.1.9「成對 t 檢定」分析範例之結果輸出
3. 變異數分析方法及其應用
假若，我們希望檢定的是兩個以上母體之均值，又應如何呢?
這就要用到「變異數分析」了。變異數分析是實驗設計(Experimental design)的基本工具，而實驗設
計是科學研究的基礎，由此可知變異數分析的重要性。實驗設計之目的在於檢定一種或多種統計假設；
實驗設計所衡量的基本對象是實驗單位，實驗單位可在不同條件下被衡量，這些條件稱為「因子」
(Factor)，因子表現程度稱為「水準」(Level)，而不同因子的特定水準組合稱為「處理方式」(Treatment)。
影響實驗單位表現的因子可能包括一個以上，多因子間可能不完全獨立，亦即會產生交互作用
(綜效或綜損)，到底哪一單一因子或因子間的交互作用會影響實驗結果，變異數分析可以告訴我們
答案。但變異數分析包含以下幾個基本假設：(1)每個變數的母體均為常態分布；(2)每個母體變異數
均相等；以及(3)各組隨機樣本互為獨立。
在 Excel 的分析工具箱提供的變異數分析工具包括以下三種：
(1) 單因子變異數分析：針對兩組以上由單一因子影響之實驗(樣本)資料，進行分析，檢定其平均數
是否相等。
(2) 不重複實驗之雙因子變異數分析：針對兩組以上由兩因子影響之實驗(樣本)資料，進行分析，檢
定其平均數是否相等，並了解不同因子對實驗結果之影響。
(3) 重複實驗之雙因子變異數分析：針對兩組以上由兩因子影響之「重複」實驗(樣本)資料，進行分析，
檢定其平均數是否相等，並了解不同因子對實驗結果之影響。
以上三種變異數分析，以「重複實驗之雙因子變異數分析」較為複雜，以下以此舉例。
若我們希望檢定特定操作模型之績效表現，受到不同市場狀況(此為因子一，包括上漲、盤整與下
跌三種狀況)或不同類股(電子類股、金融類股、石化類股、水泥股等)之影響，以確認此操作模型適用於
哪一種市場狀況以及哪一種類股。對每一類股在不同市場狀況中，我們以不同時期(測試連續三個期
間之績效表現)重複實驗，所得到的實驗數據如圖 8.1.10 所示，其為「雙因子變異數分析：重複實驗」
之輸入數據。圖 8.1.11 為「雙因子變異數分析：重複實驗」工具箱設定，包括輸入範圍，每一樣本列數
(此即重複實驗次數)，與顯著水準( α )。繼而設定輸出範圍後，按「確定」鍵，即可得到如圖 8.1.12 的
輸出，在圖 8.1.12 中，我們可由不同因子之 F 統計量與 F 臨界值之比較，了解個別因子或交互作用
是否會影響實驗結果，判斷原則如下：
(1) 若 F 統計量大於 F 臨界值，則拒絕 H0 之假設；即該因子(或交互作用)「會」影響實驗結果。

(2) 若 F 統計量小於 F 臨界，則接受 H0 之假設；即該因子(或交互作用)「不會」影響實驗結果。
圖 8.1.10「雙因子變異數分析：重複實驗」分析範例之輸入資料
圖 8.1.11「雙因子變異數分析：重複實驗」分析範例之工具箱設定
圖 8.1.12「雙因子變異數分析：重複實驗」分析範例之結果輸出

如何用統計方法檢驗操作策略之成效

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

如何用統計方法檢驗操作策略之成效

Uploaded by

Copyright:

Available Formats

2.

上述五種檢定方法，如何判定使用時機呢?圖 8.1.6 為一分析適用之統計檢定方法之決策樹。

(1) 若 t 統計量界於雙尾臨界之內，或 P-Value 大於 α (0.05)，則接受 H0；

(1) 若 F 統計量大於 F 臨界值，則拒絕 H0 之假設；即該因子(或交互作用)「會」影響實驗結果。

You might also like

如何用統計方法檢驗操作策略之成效

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

如何用統計方法檢驗操作策略之成效

Uploaded by

Copyright:

Available Formats

2.

上述五種檢定方法，如何判定使用時機呢?圖 8.1.6 為一分析適用之統計檢定方法之決策樹。

(1) 若 t 統計量界於雙尾臨界 之內，或 P-Value 大於 α (0.05)，則接受 H0；

(1) 若 F 統計量大於 F 臨界值，則拒絕 H0 之假設；即該因子(或交互作用)「會」影響實驗結果。

You might also like

(1) 若 t 統計量界於雙尾臨界之內，或 P-Value 大於 α (0.05)，則接受 H0；