序
如何阅读本书? 乐于从事别人似乎恨之入骨的事情,感觉真的很怪。我从一堆数字当中,梳理出有助于人们过得健康长寿的知识。然而,如果我告诉朋友们,统计学是我的热爱,他们会奇怪地看着我,好像我有沟通障碍才会当个统计学宅男。
我认为,统计学被教授的方式,尤其是统计学教科书,使得大部分人们认为学习统计是一种虐待。统计学教科书很厚又很无聊,而且很贵。因此,我跟编辑建议我要写一本很薄又很无聊又很贵的书。他考虑了一下,但最终决定我必须要有更好的点子。所以我是这样想的:典型的统计学教科书(1)告诉你怎么跑统计,而非如何了解它,(2)充斥着公式,以及(3)一点也不有趣。我想,是否我可以写一些聚焦于(1)如何了解统计,(2)避免公式,以及(3)有趣的东西。
于是,我想到了要用说故事的方式,来写这本书。圣经的第十诫有提到,「你不应该贪图邻居的房子、妻子、驴或牛。」但没人会这样对话。取而代之,人们会说「隔壁的草地比较绿。」假设你不知道「隔壁的草地比较绿」来自于一个古老的有关羊吃草的故事,故事是这样的,羊儿们每天快乐地在自家草地吃着绿草。有一天牠们心血来潮,抬头张望了一下,发现隔壁桥下靠近溪水的草地比较绿,于是就跑过去吃那边的草。吃着吃着,牠们又抬头张望了一下,觉得还是原来吃草的草地比较绿。于是,牠们就这样来来回回地过桥吃草,总觉得隔壁的草地比较绿。我最后一次听见这个故事是我还在幼稚园的时候,但我现在仍然记得它以及它的意义。十诫说的道理一点也没错,但很难记住,因为它只告诉你应该要做什么,而非它的意义。我的意思是,说故事能帮助你了解事情的意义,所以终其一生都很难忘记。
本书各章就像故事一样,读起来简短又有趣。本书的另一个特色──讨论区,稍微严肃了一点。讨论的题目非常多样化,通常会有一个值得深思的问题,其他的题目可视为调剂学习之用。像是,讨论关于数学常数e的起源。
如果你有一些统计基础,大可随意浏览本书。否则,你应该从头读到尾。前十二章涉及一些最基本的概念。例如:平均、变异、分配以及信赖区间。接着有几章论及假设检定与p-值。最后讨论回归分析──这也是我在工作上最常使用的统计方法,以及决策──这通常是统计学应该扮演的角色,但却往往不是。本书的最后三分之一内容,从「比约翰汤米多一个」这一章开始,专注于讨论各种统计错误,因为我认为科学就是尝试错误的学习。在教学时,我会给提出蠢答案的学生奖励分数,因为我们往往能从这些回答上面学到东西。以p-值而言,只有在你看过其被误用的方式以及思考为何会犯下这样的错误之后,你才能够真正了解p-值的意涵。最后这几章,能真正地充实你的统计知识。
本书的能与不能 诚恳地希望,在读完本书之后,你将能够掌握许多统计的关键概念。我也希望你将能够避免那些常犯的统计错误。
因为我并没有在本书呈现任何统计公式,所以你并不能够确实进行计算与分析。如果你想要为你的研究或课堂作业进行统计分析,你必须查阅有公式和分析步骤的传统统计教科书。此外,本书也并不能如传统教科书一般,有专文索引能提供你查阅忘记的东西。所以,如果你的目的是跑统计分析,本书不应该是你唯一购买的书籍(即使它很适合你买来赠送给亲戚、朋友、同事、邻居以及路人甲)。另一方面,如果你是那种不想亲自进行任何统计计算与分析的人(这世界大多数人都是),但必须了解与诠释你遇到的统计──这部分人比你想像的要多,那么本书也许正是你所需要的。
研究设计的部分在哪里 我是个设计导向的统计学者。举例来说,缺失值在医学研究里是个大问题。统计学家已经提出许许多多处理缺失值的复杂统计技术。我个人的贡献在于提出一个非常简易的降低缺失值的方法,也就是在一开始时,电访在家的病人并只问两个问题以代替冗长的问卷。依照这个方法,我们把缺失值的百分比从25%降低至6%,那么复杂的缺失值处理技术就显得多余了。
因此,你也许会讶异在本书中并没有研究设计的段落。简言之,这是因为我不认为研究设计可以独立于统计之外并另辟章节。有专门的两章分别介绍回归分析与威寇森(Wilcoxon)检定,这是因为理论上,你可以分别操作它们。然而,你并不会认为,在进行回归分析或是威寇森检定时,可以完全不考虑你在分析的研究设计。据此,我没有特别写一章讨论研究设计。相反的,关于研究设计的评论已然交织于本书内容当中。
关于本书的故事与数据 当我开始写作的时候,编辑告诉我说:「安德鲁,我要你写出一本,到目前为止,最有趣的统计教科书。」所以我是这么想的:「太棒了,那么我只需要写下一则笑话就完成啦!」
的确,事情并不会如此简单,但也并不是那么遥不可及。从任何一点来看,本书的故事与数据都有助于你学习统计。这有时意谓着,简化与修饰有益于理解。在一些案例里,我模拟数据(统计术语「模拟」就是凭空捏造的意思)。我这么做是因为我手上的数据过于复杂,可能会让读者无法专注于理解统计概念。此外,你也会对一直看见前列腺癌厌烦──这是我目前主要的研究工作。
因此,接下来的故事与数据并不会100%贴近事实。我并不认为这会有所误导,但请不要用本书去诊断瑞典男性血球数(参看〈梯盘棋与血清血红蛋白水平:常态分配的见解〉),前列腺癌(参看〈何时拜访芝加哥:关于线性与逻吉斯回归〉),非洲裔美国人叫一辆计程车要多久时间(参看〈永远不会发生在我身上的一些事情:你为什么不应该比较p-值〉),或是我朋友麦克(参看〈回归单身的麦克:一位条件不错的朋友仍然单身的统计解释〉)。或甚至是否「恐吓从善」计画,有助于少年犯避免往后的犯罪生涯(参看〈干牙刷的机率:p-值到底是什么?〉):我说它并不奏效,但是不要照单全收我的话,你自己去查查看(www.cochrane.org)。毕竟本书之目的是在阐述统计,而非制定什么打击犯罪政策。
我确实为这本书分析数据并且毫无回避地呈现我发现的结果。你应该能够复制我的分析。大部分的原始数据在网路上都找得到,但是如果你找不到,请让我知道,我将看看该如何帮助你。附带一提,我使用费雪精确检定。分析本书大部分的类目式数据。
我想要答谢普由(Pew)研究中心(www.pewresearch.org)发布其对美国大众所做有趣调查的原始数据。对跨宗教婚姻所持态度的数据,修改自2006年北爱尔兰生活与时代调查(www.ark.ac.uk)。美国1996年犯罪统计採自于www.statcrunch.com,这是对教学很有用的数据来源(但是,需要订阅才能使用)。针灸与头痛数据可下载自www.trialsjournal.com/content/7/1/15(你也可以读到一些我关于数据分享的想法)。前列腺癌数据(和瑞典男性血球数)来自于我和我的同事汉斯.莉亚(Hans Lilja)所进行的一系列研究。在医学数据库「PubMed」(http://www.ncbi.nlm.nih.gov/sites/entrez),使用关键字「Vickers Lilja」搜寻,可以找到更多的数据。产假的数据来自于珍妮.戈尼克(JanetGornick)的研究(参看Families That Work: Policies for Reconciling Parenthood and Employment. New York: Russell Sage Foundation, 2003)。
译者序 现今,统计教学已然蔚为显学。讽刺的是,不是因为这门学科很有趣,而是因为很难懂。老师们对于统计课程的有效教学,往往一筹莫展;学生们对于统计课程的莫名恐惧,每每浇熄了其想要做研究的热情。统计是一种科学方法。如果一个国家的统计教育处于奄奄一息的地步,那么这个国家的科学发展就会受阻,影响可谓深远。
既然要有效教学,就要从教学法着手。行为学派的教学法,强调胡萝卜与棍子。以统计教学而言,这根棍子打下去可不得了,因为统计学科的标准化纸笔测验,很可能让你得到难堪的分数,从此恨之入骨。认知学派强调输入与输出。老师使出洪荒之力,在黑板上写下一堆统计公式,企图把十年功力如醍醐灌顶般地传授给学生,然而个个消化不良,殊不知输入与输出只存在于电脑世界。这些都对统计教学造成了伤害。
要学好一件事,首先必须不能讨厌它;要学好统计,首先要去除对统计的厌恶感。因此,基础统计学课程的教学目标,反而不是汲汲营营于认知与技能方面的东西,而是要把学习情绪当作是最先要处理的课题。感谢一些统计学家注意到这方面的重要性,一些不那么生硬的教科书应运而生,如同本书。
本书作者有丰富的实务经验,结合了许多趣闻,以深入浅出的方式把统计观念介绍给读者。我把这本书定位在统计学辅助用书,如果是正式的统计学课程,建议搭配一本有系统性内容的基础统计学教科书。然而,请不要误会「辅助」二字为「不重要」,这本书所探讨的内容极为重要,很多地方都是基础的衍生,甚至有一般统计学教科书所达不到的深度。如果同学们进行小组合作学习,探索讨论区问题的可能答案,那么透过这样的训练,渐渐地,你会发现,你的研究报告读起来很有深度且具有个人风格,而不是只有统计数值的堆砌。
由于作者背景的关系,书中案例偏向于医疗领域。然而,统计观念是跨学科领域的,牛牵到北京还是只牛;t-检定不论用在教育学、心理学或社会学,都还是t-检定。书中所探讨的统计分析,只有一小部分是医疗领域常用的技术。这也不打紧,因为多一点点的医疗知识,其实对个人身心健康很有帮助,尤其在现今医病关系紧张的年代。
统计学有许多很绕口的名词。有时候,完全相反的名称却是代表同一件事。例如,本书所提及的单变量回归(univariate regression),指的就是二变量回归(bivariate regression)。前者以独变项作为计算单位,所以只有一个独变项;后者是二变量相关分析(bivariate correlation analysis)的进化版,也是只有一个独变项。有时候,多变项回归(multivariable regression)指的就是多重回归(mutiple regression)。如果你学习统计时发现类似的情况,请不要恼怒,因为甚至有专文探讨到底名字要怎么取。这件事实告诉我们,只要懂得其分析结构,读者们大可以绕过这些似乎是来自于外星球的语言,迳自取名为自家宠物的名字。
本书原价约42块美金,换算成新台币之后,约是一位研究所学生十天的饭钱,这实在是不小的负担。有鑑于中文类的统计学教科书选择性不多,引进此种风格的原文书实属必要。「引进」的模式有一个好处,就是让知识产权降价,造福广大的中文读者,这也是我翻译统计学教科书的主要目的。这种模式,从我的第一本译作已被两岸四地各类型大学图书馆收藏的情况看来,已然发酵。
最后,不论你是在书店随手翻阅到本书,或是在统计课的建议阅读书单上看见本书,甚或是在图书馆的书架上不小心瞄到本书,我都要说声恭喜,因为你将以极低的代价,得到几乎是原汁原味的东西。愿展读愉快!
杜炳伦
台北