序言 回想35年来,在耶鲁大学心理系教授研一生统计学的点点滴滴,最让我感到印象深刻的是统计教学的改变与不变。
最明显的变革来自于电脑的使用。在1950年代,电脑实验室就是一种塞满各种计算机械的庞然巨兽。在深夜,一定距离之内,你能从咔嗒咔嗒的操作声音,判断还有多少位学生在实验室里工作。其实,还蛮怀念过去这种吃苦当作吃补的岁月,但我也想到,在过去的日子里,统计分析不仅仅充满噪音,还充满了错误。现今,个人电脑与统计套装软体的发明,使得统计分析变得又快又准确。这对于大数据库、反覆计算、多因子或多变项技术,更是如虎添翼。此外,1992年计算与图形统计期刊(Journal of Computational and Graphical Statistics)的创建,把电脑、图形和统计连结了起来(也参看Cleveland, 1993; Schmid, 1983; Wainer&Thissen, 1993)。我并不是说电脑剷除了愚笨--事实上,或许鼓励了它。我主要是指,精细构思的分析,能够以极大的效率与细节来完成,而这是几十年前做不到的。
另一些值得重视的发展是:探索式数据分析(Hoaglin, Mosteller, &Tukey, 1983, 1985, 1991; Tukey, 1977),从强调统计显着性检定转弯至随心所欲地寻找数据所浮现的模式;对数线性模式(Goodman, 1970; Wickens, 1989),分析多向列联表的细格次数;结构方程与验证式因素分析以及LISREL程式(Jöreskog, 1978);处理抽样变异的自助抽样法技术(Efron, 1992);以及使用后设分析(Glass, 1978; Hedges&Olkin, 1985; Mullen, 1989; Rosenthal, 1991; Wachter&Straf, 1990)来统合研究并下结论的爆炸性兴趣。
尽管各大学里,有许多新发展的统计学科系以及相关训练课程,一般而言,学生们还是对统计困惑不已。长期观察学生们对于学习统计的无助挣扎,我总结,问题不全然是计算这方面。对许多学生而言,统计是一座孤岛,与他们的研究事业处于分离的状态。统计被视为令人不悦的义务,最好尽快从他们的生活中消失。此外,处理不确定性是很困难的,不论是日常生活或是小小的推论统计学世界。许多学生天真地以为,只要紧紧抓住摸得到看得见的计算值,用电脑输出堆叠成山的数据来增加数值的份量,就能避免模稜两可的情形。学生们变得死板板的,把统计实作视为一种医学或宗教规则。他们常常从病人或教徒的角度,以焦虑和不安的态度询问这样的问题:「我被允许使用这个方法来分析我的数据吗?」好像做错就会病情加重或犯罪一样,而他们似乎也想要获得处方式的答案,像是「依照电脑统计套装软体的指示,跑变异数分析,好好睡一觉,明早再把我叫醒。」
多年来,对于学生的问题:「我可以这样做吗?」我总是回答:「你可以做任何你想做的,但如果你用方法M,就要有得到批评Z的准备。如果你使用程序P并且够幸运得到结果R,那么你能够进行有效的主张,如果你没有得到结果R,那么恐怕你必须谦虚一点。」
慢慢地,我开始意识到我回答的言下之意:亦即,陈述统计分析的推论结果与雄辩息息相关。当你做研究时,会有人批评你对结果的诠释,而你最好准备说服他们。(这些批评也许不会成为现实,但对批评的预期心态,对于做好研究与数据分析是必要的。事实上,想像遭遇充满敌意的批评者,会让我们在一开始的研究设计就很小心。)统计分析工作与律师的工作有点像--案例具有说服力,或证据薄弱(甚至可疑),或是推论方式严谨或松散,以及惯例与规则可能被援引或无视等等。
一直以来,我总是想写一本饶富趣味、忠告与智慧的统计书籍,读者群为研一生和大学主修心理学或其他社会科学进阶统计课程的学生。标题自嘲是「许多你应该知道的统计大小事,但却困惑到不知如何提问」,但又不想写成像是一本烹饪书。当统计即有原则的论据在我脑海出现时,我知道我有一个统一的主题了。
除了辩论之外,统计分析也具有叙事功能。有意义的研究就像是说故事,而统计能够使故事变得更好,学生通常没有注意到这一点。随口问一位学生:「如果你的研究要被刊登在报纸上,标题会是?」得到的回答通常是喃喃自语不知所云,好像这个问题从来就没有被考虑过。
借由抛出这个问题,我不得不想想,要如何陈述统计故事的主张,怎么样让这个主张变得令人感兴趣。借由清晰的论据,让显而易见的解释溃败,使得一般大众对于重要关系的信念产生改变,是令人感兴趣的。因此,我理想中的统计学家,必须集律师、说书人以及侦探的角色于一身。这三种角色可以是有趣的,并且有开放的心胸,预期没有意料到的线索和关系出现。
把这些都考虑进去,构成一个图像。那就是,统计之目标是把量化证据组织起来,使用有原则的措词,形成有用的论据。有原则(principled)是很重要的点,这意味着你不应该在统计报告里恣意而为。我并不完全是在提倡统计领域的相对主义(relativism),或解构主义(deconstructionism)。只是,主张应该很清楚地奠基于证据。当我说「论据」,我并不是鼓励研究者应该为反对而反对。只是,对数据所引起的议题,要有论辩精神。
我的主题无法不包含技术上的东西。特定的统计方法必定会被讨论,但是我已经最小化数学公式与复杂数据的使用。本书大部分的观念围绕着基础机率理论、t-检定、变异数分析以及研究设计。因此,读者需要具备一些基础统计学的知识,像是大学统计课所学的东西。第一章至第五章,重新探讨与诠释基本素材。第六章以后,转向没有受到足够关注的统计与研究设计大小事。
我已经努力使本书内容清楚且易读,但有些读者可能还是会认为,少数段落令人费解(尤其是第六与第七章),请自行判断哪些是你可以略过的。如果你跟不上偶尔出现的公式,尽管读文字内容即可。如果还是不理解,先去放松听个音乐,稍后再继续阅读。
书里范例的作用,并非像是食谱里的图解功能,而是为了解释统计与真实世界之间的连结。大部分的范例,来自于我所熟悉的实验社会心理学领域。(许多范例有点年纪,就跟我一样。)其他范例散见于各实证研究领域。我希望,所有想要磨练其统计论辩理解力的读者,都能感到被鼓舞。我也希望,统计与研究专家,能够容忍我过度简化的技术性议题,而在本书里发现许多的精炼思想。
教师与研究者可能会发现,本书的价值在于所讨论的内容,超越一般统计学教科书会探讨的范围。学生可以把本书当作标准统计学教科书的辅助教财,或者仅仅是独立阅读。研究团体可能会发现,本书所探讨的议题非常有价值,因为这些议题时不时会出现在他们的研究领域里。我观察到一个现象,大部分学生并不真正了解统计,除非他们经历三个阶段--首先是接触,再来是实作,最后才能产生真正的洞见。本书为这第三个阶段而设计。我希望,读者能把在本书所学到的东西带入其研究计画中。
最后,感谢对本书草稿提供意见的许多伙伴。如果读者发现本书的任何不经意的瑕疵,请使用这个金律:Mea culpa(我有罪)。
译者序 与本书结缘大约在十年前。如今,可能由于人类集体潜意识对统计知识的渴望,所以在因缘际会之下,透过我,把本书翻译出来,以飨广大的中文读者。
翻译已逝作者的大作有两点好处。第一,不会有改版的问题;第二,内容扎实,禁得起时间的考验,因此才能一再地出版,即使作者已不在人世。这让我想起了当年在美国留学时,我的指导教授喜欢带我到校内的一间二手书店喝咖啡,恩师会顺道挑选一本二手诗集。端详着他把二手书看得比新书还要珍贵的模样,不禁令我这个惯于採购新书的东方学生,起了好奇心。
的确,老书自有其魅力。例如:1963年出版的实验与类实验设计(作者为Campbell与Stanley),是我读过最精采的研究设计类书籍,因为内容精粹,叙述清楚,举例引人入胜。把它从美国亚马逊网路书店购买回来的时候,发现内文有前人的重点注记,还有疑似图书馆藏书的编号,这真的让我有种新书不如老书的感觉,因为每一位读过本书的人,都赋予了它新的生命。所以,老书的魅力,来自于内容与痕迹。
这本书的确不年轻了。它在1995年出版,于2009年──作者去世几年后──又再度重印问世。在这个鼓吹汰旧换新的年代,也许本书早已被图书馆给随意丢入了资源回收桶,取而代之的是最新出版,但却真的值得资源回收的新书。我为什么这么说?因为本书内容能够启迪读者的统计与研究智慧。
经验贫乏的研究者,喜欢堆砌统计文字,彷彿这就代表了自己的学术成就。然而,一堆令人摸不着头绪的统计段落,加上不知所云的内文,再配合上一点也不令人感兴趣的标题,只会让人望而生畏,不想阅读。一篇没人想阅读的研究报告,遑论能增进什么人类福祉了。本书内容能帮助读者消弭这种弊病。
阅读本书需要具备一些基础统计学知识,如果有一点点的实务经验,读起来会更有体悟。学造句就是要学写作文;学统计就是要学会作研究。要很有效率且充满自信地,写出一篇能应用至日常生活当中的研究报告,而且还能得意洋洋地解读与评论他人的研究,一本基础与一本进阶统计类教科书必不可少,本书可以帮助你达到这个理想。
书中引用的几乎都是重量级的真实研究。其中,Milgram(1963)着名的服从研究,甚至在2015年被拍成了电影(Experimenter)。本书的大量引用特色,是一般统计学教科书所缺乏的,因为你不会在一般统计学教科书里,看见如此详尽的引用资讯。据此,阅读本书不但能增进读者的论文写作能力,还能精进读者的统计论述智力。可以想见,本书含金量之高。
除了重量级的引用讯息与范例之外,有的实例来自于耶鲁大学的学生作业。阅读这些例子,可以一窥耶鲁大学教授是怎么培育学生的,这也彷彿得到了耶鲁大学教授的指导。所以,就算读者不是就读于名牌大学,只要熟稔本书内容,躬身实践,那么一些外在的环境影响,对读者而言,也就不再具有任何的意义了。
市面上有许多如何使用统计软体的书籍。初学统计的学生,通常也会先从这一部分着手,这并没有错。但是,输出的数值意义何在?这是许多统计学教科书所没有深入探讨的。对我而言,统计软体的标准化操作,在网路世界轻易就可以搜寻得到,似乎连参考书都不必了。然而,个人一生的统计教学精华,却是「网路搜寻」不到的。
我很欣慰能把本书翻译出版。英文原版索价将近40美元,现在你只需要付出极低的代价,就能得到几乎是原汁原味的东西了。这也是我从事统计教科书翻译工作的初衷──让知识产权降价,造福广大的中文读者。愿展读愉快!
杜炳伦