序
本書主要目的在於探討各類效果值指標的估計、選用與解釋。效果值(effect size),簡單地說,就是實驗效果大小或雙變項關係強度的量化指標,其值愈大,常代錶著組平均數間之差異愈大或雙變項間之關係愈強。由於研究者對於統計顯著性考驗的運用邏輯存在著一些迷思或誤解,過去許多研究報告常忽略瞭效果值大小的評估,僅依p值(p-value)的大小就下結論,易導緻結論的偏差。
為何效果值與p值同等重要?假如事先沒有適切的樣本規劃,研究者僅利用p值進行統計假設考驗,可能導緻不當的結論。主因在於p值易受樣本大小的影響,隻要樣本過大,通常會推翻虛無假設;反之,樣本過小,通常很難推翻它。反觀效果值不僅可用來評估臨床上的應用價值,而且不會受樣本大小的影響,足以彌補統計顯著性考驗設計上的不足。統計上的顯著性並不一定等於實務上的有用性,因此近幾年來學術研究期刊逐漸要求作者同時報告p值與效果值。
令人睏擾的是效果值的定義或類型,會因研究設計、研究問題與統計方法而改變,假如研究問題的焦點在於組間差異,那麼效果值的定義在於組間平均數的平均差異,需要獨立樣本的研究設計;假如研究問題的焦點在於個體的改變量,那麼效果值的定義在於平均改變量,需要重複量數的研究設計。此外,有時同一種統計方法(如多元迴歸分析)卻存在著許多不同形態的效果值統計量(如未標準化迴歸係數、標準化迴歸係數、淨相關、部分相關),何者為佳,研究者亦常生睏惑。由此觀之,欲正確估計與選用效果值統計量,需先釐清效果值與研究問題、研究設計及統計方法間的複雜關係。
本書另一個目的在於探究各類效果值間的轉換,使其具有可比較性(comparable),以利整閤分析(meta-analysis)。效果值估計是整閤分析的核心工作,除瞭需知道如何正確估計之外,尚須注意效果值可能衍生自不同統計方法(如單變項ANOVA 考驗、迴歸分析、多變項分析或HLM、GMA分析),為瞭使效果值能跨不同統計方法而具有可比較性,必須透過適當公式與對比分析的橋接(參見內文第12章圖12-18~圖12-20),使其具有共同量尺(如全部轉換成Cohen’s d值或Pearson’s r值),纔能進行整閤分析。
本書涵蓋單變項與多變項統計方法的效果值指標,從t考驗、ANOVA到MANOVA,從Regression、GLM到SEM或HLM應有盡有,不僅可作為整閤分析研究者查考的寶典,也適閤於應用統計學課程之主要教材、一般量化研究課程之輔助教材。本書緻力於效果值及其信賴區間公式的推演,並透過應用軟體輔以應用實例,以利研究者能正確估計、描述與解釋效果值。本書經多年之腦力激盪,終能順利完成。特別感謝恩師Dr. Olejnik&林清山教授的教誨。書中引介適用於跨研究比較的通用指標η2G,就是來自Dr. Olejnik&Algina的創見,而本書內有一些應用實例的數據,係引自林清山教授的大作:《心理與教育統計學》與《多變項分析統計法》,以利教學上的結閤。此外,為瞭減輕研究者計算效果值及其變異量的繁重負擔,書中除瞭提供筆者新開發的軟體之外,也推薦瞭一些網路計算器,以便利效果值的估計。筆者秉持知識傳承的使命感,日夜戮力以赴力求完善,內容倘有疏漏之處,尚請同好不吝指教。
李茂能
2022年夏於嘉義