序 有时候,再明显不过的事情,我们反而常常视而不见。1990年代末,我还是个年轻经济学者时,就有过这样的经验。对经济学界而言,那是令人振奋的年代,我有幸在哈佛大学和麻省理工学院度过这段时间,这两所声誉崇隆的学府正好是经济学新浪潮的发展中心。
综观历史,经济学一直由理论所主导,往往因为某些聪明绝顶的人写下复杂的数学模型,勾勒出世界运作的抽象定理,而促使经济学出现大跃进。随着电脑运算威力和大数据的大爆发,经济学专业在1980年代和1990年代开始转变。许多经济学家的研究重心愈来愈偏向实证研究,努力分析现实世界的各种数据。像我这样的年轻经济学者,在认清自己的聪明才智还不足以发展出新奇的理论见解后,我开始觉得,辛苦钻研数据并从中找出一些趣的事实,也是可敬的研究方式。
当时(现在也一样)我们面对的重要挑战是,如何釐清两个变数之间的关系是否真的是因果关系,或只不过相互关联罢了。这件事为何如此重要?因为因果关系对公共政策的寓意重大。如果能找到因果关系,我们对于世界究竟如何运作,也会多一分重要的理解。
随机实验大不易
不过,要证明因果关系非常不容易,最好的方式是透过随机实验来证明。这是为什么美国食品药物管理局要求新药在核准通过之前,必须先进行随机实验。问题是,像我这样的经济学者探讨的问题,不见得适合採取实验室测试新药的方式来作实验。结果,我们耗费不少心力寻找所谓「意外实验」—在依稀模拟随机实验的现实世界中碰巧发生的怪异事件。比方说,飓风横扫某个城市,另外一个城市却毫发无伤,你或许以为哪个城市会遭受风灾或多或少是随机决定的。
或以美国最高法院在1973年「罗伊对维德案」(Roe v. Wade)中裁定堕胎合法为例,在某些州,堕胎发生的机率从此大幅改变,但在其他州则未必如此。如果我们比较那段时间在不同州出生的婴儿后来的人生发展,或许会对政策的冲击多几分理解,甚至有助于探讨更深层的问题:例如,一个不受欢迎却来到人世的婴孩,往后的人生会因此受到什么样的影响。
于是,我和其他许多经济学家开始花时间寻找「意外实验」。
有一天,我碰到一个小我几岁的经济学家,从此一切都改变了。他的出身背景和我截然不同。他从来不曾进过哈佛大学或麻省理工学院,他大学念的是威斯康辛大学史蒂芬角分校,后来又拿到怀俄明大学的博士学位。他的第一份教职是在中佛罗里达大学教书—也不是什么名校。
现场实验带来新契机
他的名字是约翰‧李斯特(John List)。李斯特和我及其他着名经济学家很不一样,事后看来,他开创的研究方式显然十分合情合理:在现实世界中操作随机的经济学实验。但不知怎么的,当时几乎没有人和他採取同样的做法。受经济学界的传统及前辈经济学家树立的榜样所影响,我们从来不曾想过可以在实际的经济环境中,以真人为随机实验的对象,而且这些人完全不晓得自己是实验的一部分。而这位卡车司机的儿子告诉我们该怎么做。
不妨以偏见为例。如果一个人对待别人的方式十分偏颇,大家会假定他是种族主义者、性别歧视者、同性恋等等,但是从来没有人像李斯特和尤瑞‧葛尼奇(Uri Gneezy)这样,剖析表面上似乎基于不喜欢、讨厌或纯粹出于憎恨而展现出来的行为,并找出行为背后的潜在动机。他们的实验(将在本书的第六章与第七章中讨论)显示,其实歧视背后隐藏的动机不见得是憎恨,有时候只不过是为了多赚点钱罢了。
在我看来,真正的天才总是独具慧眼,能看出明明显而易见、但大家都视而不见的事实。按照这个标准来看,李斯特和葛尼奇是真正的天才,也是真正的开拓者,他们的贡献可说是过去五十年来最伟大的经济学创新成就之一。本书是他们的故事,让我们看到深思熟虑又富于创意的学者如何透过上述实验方法,解析日光之下的任何问题。
实地进行的随机现场实验是非常有力的工具,而且各位很快会发现,这种实验方式非常有趣。希望各位像我一样,从阅读本书中得到莫大的乐趣。
史帝文‧李维特(Steven Levitt)
芝加哥大学经济学教授、《苹果橘子经济学》作者
导读
人生无处不相关,随机实验定因果 「我用本书将经济学从学者的象牙塔带进你家客厅。」--李斯特(本书作者)
世界纷扰,面对海量资讯的轰炸,诸多专家学者的意见,想要独立思考,做出正确选择,其实并不容易。一个理想的决策过程似乎应该像这样:如果做某件事(A)会导致好的结果(B),我们就说A和B有因果关系;接着,我们评估实行A的成本与B带来的好处,如果利大于弊,就可以放手去做。这个程序再理性客观、简单明了不过。
然而,大部分人的做法却是,先看A和B是否相关,再揣想其中是否可能有故事,如果有,就如法炮制。举几个例子:隔壁那个聪明伶俐的小孩,妈妈怀孕时每天都听莫札特:嗯,想必是莫札特的音乐,对小孩的神经元连结产生正面影响,因此花几万块买莫札特全集跟高级音响绝对值得!「天龙国」的「天龙国中」升学率破表,是因为学区好、同学优,因此花五百万买学区小套房肯定是好投资!大学毕业生的平均薪资高于高中生,是因为大学教育提升了学生的人力资本,因此政府应该花纳税人的钱,广设大学!村庄来了很多自称是医生的人,同时伊波拉病毒在村内肆虐,一定是这些人带来霉运,因此一定要把穿白袍的人都杀了!总统辅选愈多次,得票率愈低,候选人即使随便编个理由,也绝对不可以跟「You-Know-Who」同台!
切记!相关不等于因果
只是,事情从来不像表面上看起来这么简单。「相关」(correlation,A的变动与B的变动同时出现)与「因果」(A导致B)的距离,经常比「全世界最遥远的距离」还遥远。
基本上,有两个理由会让相关与因果指向完全不同的方向。第一个是遗漏变数(omitted variable),亦即其实是有个C同时造成了A与B,但因为我们没有观察到C,因此就把A的发生算到B头上。在前述的例子里,有可能是孩子的父母由于社经背景所致,而爱听古典乐、积极让小孩挤进好学区,同时注重孩子的能力培育;大学毕业生薪资高,有可能只是因为能考进大学的人,天生的智力与非认知能力(如工作态度)较佳。也就是说,我们因为遗漏了C,而高估B对A的影响(如果有的话)。第二个理由是反向因果关系(reversed causality):其实是病毒肆虐,WHO的医生才会出现;就是因为选情艰困,所以党主席才会常来!
遗漏变数与反向因果关系造成我们误解世界的运作方式,如果误解与公共政策有关,犯错成本肯定会更高。这也就是为什么《苹果橘子经济学》的作者李维特在「如何做实证研究」这门课的最后一堂,总会以一句话做结尾:如果你们只能从这门课记得一句话,那我希望是「相关不等于因果」。
经济学实验的发展历程
过去几十年来,经济学家发展出了许多有创意但复杂的方法,如工具变数(instrumental variable)、双重差异(difference-in-difference)、回归不连续(regression discontinuity),以及自然实验(如美国越战时期,被征召与否是依你的出生日期随机决定)等方法,希望可以更细致地分析人们「做完选择」后的资料(observed data),找出变数间因果关系的强度。不过这其实非常困难,要找到随机的自然实验,机率比天上掉下礼物还低!
这时,有些经济学家就想:为什么不仿效科学家,以类似实验室控制的方式解决这个问题?毕竟早在1882年,巴斯德(Louis Pasteur)就曾以五十只羊进行炭疽病疫苗的随机对照实验。但是,尽管「看来不难」,实验方法在社会现场的运用,直至1990年代还是无法普及,原因就如同萨缪尔森(Paul Samuelson)在他畅销四十年的经济学教科书中所说:「生物科学家的实验是经济学家的奢侈品,因为在现实世界中,我们就是无法控制所有的变因,达到『其他条件不变』(other things being equal)的境界。」另外,实验方法所需要的资金、协调,还有对突发状况的反应,以及是否符合研究伦理(不能伤害到受试者是首要原则)等,也都大幅增加现场实验(field experiment)的困难度*。
一个重要而有趣的例外发生在1974到1982年。当时,美国兰德智库想要了解全民健保在财务上的可行性以及道德风险(moral hazard)问题,因而实施了知名的RAND实验。该计画将人们随机分派到14个不同自付额的保险计画,既然是随机分派,代表大家的健康状况、所得以及生活习惯等都是一样的,也就是符合「其他条件不变」。实验结果发现,幸运抽中完全免费的群组,相较于负担比例为95%的群组,看病次数多了50%!这项实验的结果让美国政府基本上放弃了全民健保计画,堪称是科学方法评估公共政策的经典之作。
虽然现场实验看来难度颇高,但是实验室实验(lab experiment)倒是早在1970年代就开始蓬勃发展。基本上,这支学派的做法是召募受试者到大学的实验室中,经由事先精心安排且随机指派的问卷与测试,检验各种经济学理论的有效性。2002年的诺贝尔奖得主卧龙‧史密斯(Vernon Smith)与丹尼尔‧康纳曼(Daniel Kahneman) 就是这种做法的代表性人物。
现场实验见人性真章
本书的作者之一李斯特的经济学家之路,说来颇为传奇。他在怀俄明大学取得博士学位后,投了一百多封履历,最后只拿到中佛罗里达大学的聘书。除了负担沉重的授课,还要指导该校滑水队,薪水也相当微薄。但是在2005年,也就是从名不见经传的怀俄明大学毕业九年后,他进入了所有经济学家梦寐以求的圣殿──芝加哥大学经济学系,并在2012年担任系主任。
当时,李斯特得到贝克与李维特的挖角,原因并不是他在实验室经济学的研究成果,而是他从大学时期就开始从事的副业──买卖球员卡,以及参加球员卡展览会时,私底下进行的一些古怪实验。以下就是其中一个。
首先,李斯特在会场随机召募顾客和商贩,请他们到一个房间里玩经济游戏,规则如下:顾客在4到50元中挑选一个价格(如20美元),然后与这位顾客配对的商贩要给顾客一张价格相当的棒球卡。在这个游戏中,由于是顾客先出价,而且商贩比较了解市场价格(资讯不对称),因此商贩较有交易优势的。不过,实验结果发现,顾客并不会倾向出低价,而商贩也会都诚实地给出价值相当的棒球卡。
实验至此,一般人可能就做出以下结论:棒球卡是一个诚实交易、相互信任的市场。但是,李斯特知道这不代表什么,因为这是有第三人(也就是实验主持人)在场的结果。于是,他简单更动了实验:也是随机召募顾客,但这次让顾客直接到展览场里向对实验不知情的商贩说道:「我有20元(或65元),请你给我一张最好的Frank Tomas卡。」在这个比较像现实世界的情况下,商贩的表现如何呢?结果,顾客一再受骗,而且外地来的商贩比本地商贩更常欺骗顾客!
谁说人是善良的?
自利心(self-interest)是经济学另一个相当重要、但也最有争议的假设,许多实验经济学家都利用最后通牒赛局验证。此一赛局的基本架构如下:实验者会给A受试者100美元,A可以决定自己留下多少,剩下的给匿名受试者B。如果B接受,就依照A的提议分钱;若B不同意,两人都拿不到一毛钱。依照倒推法的逻辑,A应该自己留下99元,只剩1元给B,因为对B来说,拿到1元总比什么都没有好!但是在现实世界中,大部分人都会选择给对方30%到40%的钱!但是,难道这就是利他吗?不一定,因为避免被拒绝也可能是愿意慷慨的原因。
于是,此时有人将最后通牒赛局稍做修改,称为独裁者赛局,也就是完全按照A的决定分钱,B完全没有置喙余地。在不可能遭受报复的情况下,A的决定如何?结果,不论是来自大城市或世界最偏远地区十五个原始部落的独裁者,都会提供20%的钱给其他人!
这些实验结果似乎证实人类确实有利他的天性,也让其他研究社会现象的学者军心大振,因为这不啻是对传统经济学的当头棒喝!不过,李斯特却另有想法:「如果人类天生利他,有100元就会分给别人20元,那为何我家门口不会出现装着钞票的信封?」其实,实验里的受试者常会展现「受试者期望效应」(subject expectancy effect),也就是按照实验者希望的结果做选择,而分钱行为可能不过是这种效应的展现。
于是,按照这个逻辑,李斯特又设计了几种实验。在一种实验中,独裁者有另一个选择,就是可以拿走接受者手中一小部分的钱;结果愿意分钱给接受者的独裁者居然少了一半!在另一种实验里,双方都拿到同样的钱,而独裁者可以选择把自己的钱分一些给对方,但也可以拿走对方所有的钱。结果呢?只剩一成的独裁者愿意分钱,甚至有四成的独裁者不但一毛不给,还拿走了接收者所有的钱!
到了这一步,李斯特似乎已经证明,人类的利他心是很脆弱的。但故事还没完,因为这些实验还不能解答「为什么没人放钱在我家门口」这个疑问,因为在这些实验中,100美元都是天上掉下来的礼物,在现实世界几乎不可能发生。因此,李斯特进一步设计了另一项更接近现实世界的实验:独裁者与接收者各自拥有的钱,都是在实验室工作赚来的。结果呢?有三分之二的独裁者不分给接收者任何钱,但也不从对方身上拿钱:既然大家赚的都是辛苦钱,那就井水不犯河水啰!
我想,这些实验的重点并非要证明人类天性到底是利己还是利他,而在探究利他行为到底受到什么诱因结构的影响。许多人(即便是社会科学家)因为希望看到利他的美好社会,因此在看到自己满意的结果就止步,这对科学的进步是最大的阻碍。
什么?慈悲心也不单纯?
循着利他行为与诱因结构的互动,慈善捐款是另一个现场实验成果丰硕的研究领域。所有的捐款都来自利他动机吗?如果慈善捐款纯綷出于乐善好施的利他心理,对社会福利就能有所增进:捐款者因捐款感到满足,受赠者也得到实质的好处。但若慈善行为是出自其他诱因(如压力),情况就完全不同。
李斯特和其他两位研究者设计了一个聪明的实验,验证捐款到底是因为「乐善好施」,还是出于「社会压力」。实验有三个组别,第一个是一般的随机登门拜访(按门铃),募款者上门询问捐款意愿。第二组跟第一组类似,但是在拜访前一天,募款者会先在受访者门前留下传单,告知募款目的以及隔天登门拜访(按门铃)的时间。第三组也在拜访前一天发给传单,但是传单上能让受访者勾选「拒绝受访」,募款者看到门口有勾选「拒绝受访」的传单,就会直接离开(不按门铃)。实验结果显示,留传单的组别,应门人数少于对照组。大约有一半的受访者不愿意与募款者直接接触,这可能是因为他们不愿意捐款,或是捐款少(捐款太少时,与募款者接触可能会有社会压力)。他们估计,登门拜访募款的社会压力所造成的成本大约是1到4美金,而大约有75%的捐款都可以用社会压力解释。
其实读通经济学的人应该马上就会发现:善心捐款其实也是一种消费财:你付钱消费的是对自我的良好感觉。由此可推,做慈善的「价格」上升时,需求量应该跟着下降。经济学家克劳费特(Charles T. Clotfelter)就发现,在最高所得税率调降之后,最高税率级距的有钱人,捐款金额就大幅减少了!另外,派美女募款平均能提高50%的募款金额(而且对中年大叔特别有效,不过这事我早就知道了);在捐款信上承诺仅此一次、下次不会再来,不但能提高回覆率,而且这些人还是会继续捐款。这些研究发现,都有助于慈善事业提升效能、永续经营。
教育从小(实验)开始
本书对李斯特自2006年起做的教育研究实验也多所着墨。美国的教育不平等程度在全球名列前茅,但是许多因应政策都诉诸「看起来感动,那就一定有效」,停留在道德热血的层次。如果不能正确估计教育生产函数,也就是衡量老师、器材、教学方法、奖惩制度等各种学习辅助资源与学习效果之间的关系,有限的教育资源就不能做到最好的配置。这个想法得到芝加哥市教育当局与世界最大避险基金Citadel创办人葛理芬的襄助。于是,李斯特在芝城南边的Chicago Heights学区,执行一项可能是全世界最大的高中学习成就实验计画,目的在于找出哪些方法可以提高学生的成绩。
这项计画以经济学的诱因结构理论为蓝本,针对老师与学生设计了许多金钱(如成绩进步就有奖赏等)与非金钱(公开鼓励等)的诱因。其中有许多大概都能够让成绩进步50%到100%!有兴趣的读者可以仔细研读书中第四、五两章或是附注所列的论文。
得到如此惊人的成就,但李斯特和同事并不满足,因为他们看到一个更大的问题:他们所面对的是一群几乎被社会放弃的青少年,他们早期的学习经验几乎已经决定了他们的未来,现在这些诱因或许能够改变部分行为,但是和在现代社会生存所需的学习,显然还是天差地远。一个数学程度只有小三的16岁学生,即使给他一百万美金的奖励,也几乎不可能学会解微分方程式!
于是,他们再次接洽葛理芬,说服基金会再次慷慨解囊,捐款一千万美金成立Chicago Heights Early Childhood Center,针对学前跟小学教育的孩子,评估各种学习方法的效果。这个计画才刚开始不久,但已有一些初步成效:十个月内,这些来自芝加哥最贫穷地区的小孩,认知与非认知能力都突飞勐进。
人生无处不(实验)经济
本书探讨了慈善、教育、歧视、性别差异是先天决定或后天形塑等问题,议题非常多元,但背后的逻辑都是相通的:只要能恰当定义市场,掌握价格与数量的衡量方法,搞懂市场运作的逻辑以及人做决策时所面临的诱因结构,就可以设计出好的实验,确定两个变数间的因果关系。这本书就是两位作者过去研究的经济普及版。现场实验近年的研究成果,不仅常在媒体曝光,也对实际的政策制定产生一定的影响力。身为李斯特的好朋友,我想,现场实验对社会改革的助力,以及改变孩子生命的真实果效,这些所带给他的感动,一定远胜在JPE**发表十篇论文吧?
林明仁
美国芝加哥大学经济学博士、台湾大学经济学系教授
(本文作者为美国芝加哥大学经济学博士、台湾大学经济学系教授)
*李斯特对现场实验的14点建议,建议有兴趣的读者阅读,一窥现场实验的门道:List, John A., 2011, "Why Economists Should Conduct Field Experiments and 14 Tips for Pulling One Off." Journal of Economic Perspectives, 25(3):3-16.
**《政治经济期刊》(Journal of Political Economy),芝加哥大学出版的顶尖经济研究期刊)
推荐序
整个世界都是经济学家的实验室 从十九世纪以来,实验方法在心理学就有长足的进展,以致心理学很早就有实验心理学这个次领域,协助心理学能脱离哲学的层次,而进到科学的境界。然而,心理学理论百家争鸣,迄今并没有一个大家公认、放诸四海皆准的理论能够解释所有的心理学现象。因此,心理学实验结果如何应用于解释实验室外的人类行为[也就是该实验的「外部效度」(external validity)],取决于实验背后的心理学理论,适用范围究竟有多大。而对于不同派别理论的适用范围,不同学者通常有不同的看法,众人莫衷一是。
走进世界体验经济理论的普遍真实
相反地,经济学自从十九世纪马歇尔等人的边际革命(marginal revolution)以降,经济学家大都同意,有一个大一统的经济理论可以用来解释人们大部分的经济行为。这个理论通常可以被简化成为一句话,「人对诱因有反应」(People respond to incentives),也就是一般人所讲的「上有政策,下有对策」。举例来说,某个商品的价格上升时,人们对该商品的需求数量就会下降。政府祭出补贴,让公共脚踏车前三十分钟免费时,大部分人自然会拚命利用公共脚踏车──但总是不超过三十分钟。
因此,当经济学引入实验方法,面对「实验结果能否推广」这个问题时,实验经济学家的做法是,根据所有经济学家都认可的经济理论来设计经济学实验,使得人们对实验室里、研究者所赋与的诱因(induced value)有反应。这种做法上承实验经济学的鼻祖、2002年诺贝尔经济学奖得主卧龙‧史密斯(Vernon Smith),要求所有的经济学实验都必须有「真实的后果」、提供真实的诱因(比如说发真钱),让人们对这些诱因有所反应。也因此自八十年代以降,经济学实验严格要求所有研究者都不能欺骗来参与实验的受试者,必须「徙木立信」,借以确保受试者相信诱因的真实性。这也让经济学实验与「允许欺骗(隐瞒性研究)、只要事后告知」的心理学实验分道扬镳,因为「事前欺骗、事后告知」无法保证受试者相信诱因的真实性,毕竟,如果研究者在某些方面可能欺骗受试者,难保人们会怀疑研究者其他方面的诚信。
然而,正如物理学家不满足于观察实验室真空中的物理现象,转而透过观测天体运行,验证物理学定律的普遍性,实验经济学家也不满足于只在抽象的经济学实验中检验经济理论。因为如果经济理论确实放诸四海皆准,应该就会出现在经济社会的各个层面。因此,实验经济学家也仿效经济学其他的实证研究,从不同经济问题发生的「现场 」蒐集资料、分析结果,只是所蒐集的资料有研究者主动进行的随机分组,据以得到「随机试验」的结果,这就是本书主要所要介绍的经济学「现场」实验。
现场千变万化,主题百花齐放
其实,社会科学早在六十年代就有类似的社会实验。在经济学领域,健康经济学家约瑟‧纽豪斯(Joseph Newhouse)所带领的团队,则在七十年代初期就展开着名的蓝德智库随机健保实验(RAND Health Insurance Experiment)。而早在1977年,加州理工学院的查理‧布拉特(Charles Plott)也根据政治经济学的投票理论,操弄投票程序,进行投票现场实验,并与以学生为研究群体的其他经济学实验结果对照。但是,早期的政策实验受限于经费,只能零星尝试,无法持续大规模进行。而且当时经济学实验的方法论仍在发展中,还没有累积足够的实验结果可以有系统地与经济理论对话。
因此,迟至九十年代末期,经济学现场实验才在多位先驱的努力下逐渐开花结果。先有柯林‧凯莫尔(Colin Camerer)尝试操弄加州赛马赌盘,以验证资产定价是否容易偏离基本面、产生泡沫;后有大卫‧乐金─莱利(David Lucking-Reiley)以一连串的网拍实验,验证拍卖理论在网拍现场如何应用;后来,多位精研拍卖理论的理论经济学家,也开始跟专研拍卖实验的实验经济学家合作,共同设计美国联邦通讯委员会的手机执照拍卖;终于,由李斯特所进行一系列在商展贩卖球员卡的现场实验,以及发展经济学家以斯帖‧达芙珞(Esther Dufflo)和麦可‧克莱马(Michael Kremer)等人到非洲、印度等地所进行的政策现场实验而集大成。现在甚至有管理顾问公司,例如:美商亚博德(Applied Predictive Technologies, APT),专门教育企业如何自己进行(销售通路的)现场实验,除了协助企业处理巨量资料,更教他们如何利用现场实验,釐清营收获利背后的因果关系。
想要见识现场实验的威力吗?就来看看李斯特和葛尼奇如何解开经济诱因的秘密吧!
王道一
(本文作者为台湾大学经济学系教授)