推薦序
保持警覺,莫掉入數字陷阱
張瑞棋
我們生活中充斥著各種統計數字,這些數字所產生的影響不容小覷,甚至會左右我們的行為。例如政黨會根據民意調查推出候選人、用數字說服你支持其政策;廠商會引用研究數據告訴,你他們的產品有多棒。除了這些推銷式的資訊,你自己在做重大決策時,也會參考各種數字,例如用排行榜來選大學、用平均薪資來選擇就業的產業與公司、用保護力與致死率來選哪種疫苗。
問題是,你怎麼知道這些數字是否反映出真實情況?甚至有沒有被特意操弄扭曲?就算數字是真的,所引申出的結論又是否正確?
聰明如你,或許已經知道一些常見的統計謬誤,例如調整Y軸刻度來誇大或弭平差異、以偏概全——將特例或巧合當成普遍現象,或是把相關性與因果關係混為一談。這些在經濟學家桑妮.布勞所寫的《數字偏見》這本書中也都有提及,但特別的是,她還進一步地指出更深層的謬誤起源。
以「黑人先天智力不如白人」這個謬論為例,這不僅僅是少數人先入為主的種族偏見。布勞舉出實例告訴我們:即使受過高度學術訓練的學者也如此認為,因為他們憑藉的是智力測驗的結果。但其實智力測驗背後有許多商榷之處,例如題目的設計可能本來就對特定族群或背景的人不利、對平均值的錯誤解讀可能推論出不當的比較結果,而將抽象複雜的智力簡化為一個數字又是否恰當?
值得注意的是,這些謬誤往往都不是主持研究的人刻意為之,相反地,他們很可能毫未察覺,以為所得出的數據與結論相當客觀中立,連帶著外界也跟著引用,使得錯誤的結論散播得更遠、更廣。這種情況不僅見於智力測驗,其他諸如民意調查、醫學實驗、科學研究……等也都會有類似的謬誤。
但另一方面,有心人士又會藉此操弄懷疑,為利益團體護航,例如抽菸與肺癌的關係、地球暖化與氣候變遷的關係。其中最令人感嘆的,莫過於早在 50 年代就出版的暢銷書《別讓統計數字騙了你》,揭露各種統計謬誤的赫夫,竟在十幾年後為菸草公司作證,宣稱相關研究不足以證明抽菸與肺癌有因果關係。
看到這樣的角色反轉令人不禁為之氣結,但作者布勞特別提醒我們:我們個人的意識形態,往往也是謬誤的來源。我們很容易因為研究結果是否令人「滿意」,來決定採信與否,而不是檢視研究方法是否符合科學精神。就像書中所舉考科藍醫生的例子,我們很高興看到他透過試驗比較,成功說服德軍改善戰俘水腫的問題,但其實他後來在自傳中坦承試驗方法有誤,這是他個人最成功,也是最失敗的試驗。
對抗數字偏見不是件容易的事,因為從源頭資料如何產生、到資料如何呈現與解讀,乃至我們自己的喜惡,都會造成誤解與偏見。但至少,我們可以從《數字偏見》這本書,知道哪個環節可能出錯,進而提醒自己保持警覺,莫要掉入數字陷阱裡。
(本文作者為「科學棋談」粉絲團版主、《科學史上的今天:歷史的瞬間,改變世界的起點》作者。)
升級識破數字偏見的能力
黃貞祥
西方有一句著名的諺語:「世界上有三種謊言:謊言、該死的謊言、統計數字。」(There are three kinds of lies: lies, damned lies, and statistics.);另有一句和騙子有關:「騙子有三種:單純的騙子、該死的騙子、專家證人。」(the liar simple, the damned liar and the expert witness),前者據說是來自美國作家馬克.吐溫(Mark Twain),他還說過另一句諺語:「給你帶來麻煩的,不是你不知道的東西,而是你自以為很了解的東西。」(It ain't what you don't know that gets you into trouble. It's what you know for sure that just isn't so.)
馬克.吐溫儘管已過世百年,世人似乎還未學到教訓,除了使用統計數字的專家證人之外。換句話說,國家、政權或即得利益者,更加擅長利用統計數字來蒙騙民眾。然而,一般民眾也並非只能坐以待斃,有許多有識之士會站出來,戳穿這些陰謀詭計。可是道高一尺、魔高一丈,當騙術被識破後,謊言也會升級,雙方你來我往的較量,就像是軍備競賽一樣,新招層出不窮。作為社會大眾,我們當然也要升級跳出謊言誤區的能力!
在眾多升級我們思維能力的書籍中,這本《數字偏見:不再被操弄與誤導,洞悉偽科學的防彈思考》特別值得推薦給社會大眾一讀,因為身為荷蘭新聞網站《通訊員》的記者,作者桑妮.布勞比起許多學者,更擅長用精簡扼要、通順易懂的文字,來讓我們了解到數字、分數、排名、民意調查和大數據等統計數字,如何讓我們自以為理性地理解這個複雜的世界。
就因為政客和有心人士掌握了愈來愈多話術能力和話語權,有不少不甘受騙的民眾,改而更加相信統計數字,認定語言文字能夠騙人,可是統計數字不會。前蘇聯獨夫史達林(Joseph Stalin)有句名言:「死一個人是悲劇,死一百萬只是統計數字。」,難道統計數字就不會讓我們對千千萬萬的具體案例無感,還有見樹不見林地錯失了豐富的細節嗎?《數字偏見》帶我們還原歷史現場,用故事串連脈絡,讓我們認識到從什麼時候開始,我們愈來愈相信統計圖表。
為了打動英國政府以拯救更多傷兵的生命,英國護理師及統計學家佛蘿倫絲.南丁格爾(Florence Nightingale)使用了統計圖表,成功地說服了政府當局。爾後,人類經歷了標準化的過程後,發展出了蒐集和分析資料的方法,統計數字和圖表的流行,迄今仍可說是方興未艾。只要受過文明社會的義務教育,不管使用的語言為何,都能夠用相同的數字和單位溝通,因此簡單易懂的圖表比起千言萬語,可能更能無遠弗屆地快速打動人心。
然而,不管是不同種族的智商也好,經濟的GDP也好,我們測量的目標,只是我們人為的選擇。哪些認知能力或經濟數字更放入公式中,比重要分配多少,畢竟是少數專家說的算。這些專家甚至可能事後告知我們,他們當初的選擇,只是權宜之計,受限於他們當時取得資料的便利性等,可是後世卻奉為圭臬;加上要計算哪些東西,還涉及價值判斷,從不會是純客觀的;我們也只能事後諸葛地測量我們能夠計數的。可是當整個社會陷入用統計數字排名的迷思中,就受到了少數專家、媒體、團體的操控,投入大量資源玩囚徒困境的魷魚遊戲,例如全球大學排名其實就只是少數機構牟利的工具。
抽樣的偏誤,也多次造成了民調和選舉結果有重大出入。有心人士甚至還可以調整資料蒐集的方式,以得出錯誤的統計數字來誤導社會大眾,《數字偏見》其中一章揭露了西方菸草產業如何操縱學者來誤導社會大眾,甚至還反向操作,向莘莘學子宣導「吸菸是大人的行為,千萬不要學喔」,誘導叛逆期的青少年抽菸耍酷。
大數據和演算法是我們這個時代的顯學,主宰了數以億計的人們每天接觸到的資訊。然而,大數據可能在一些商業行為方面有著前所未有的威力而讓人嘖嘖稱奇,可是大數據畢竟只是蒐集了預先設定好的資料,事實上並無法發現未曾出現的狀況。可是,過度依賴演算法得出的分數,只要個人有些微特殊狀況,就可能成為受害者,甚至萬劫不復!《數字偏見》提出了數個讓我們必須引以為戒的案例。
雖然《數字偏見》意圖揭發統計數字如何誤導我們,但是布勞其實不是個數學不好,所以有酸葡萄心態的人;相反地,她從小就是數字控,並且還投身和數字很有關係的領域——經濟學中。她在荷蘭鹿特丹伊拉斯姆斯大學取得經濟學博士學位,但也因為意識到數字掌控著太多人的命運,所以決定投身新聞界,並且在這之後接獲許多民眾舉報的數字偏誤。她也認識到,如果再不採取行動,會讓愈來愈多人深受其害。
布勞並非要標新立異地帶領大家起身反數字,她也指出,統計數字是雙面刃,圖謀不軌的是有心人士、既得利益者、政客和極端分子。只要我們都認識到不被數字牽著鼻子走,懂得真正的獨立思考和批判思維,就能不再一味地被數字主宰,活出自己該有的真正價值!
(本文作者為國立清華大學生命科學系助理教授、「Gene思書齋」版主。)
前言
數字著迷
璜妮塔推開門走進滿是灰塵的辦公室,與我握手。她身上那件大又褪色的針織衫,使她看起來更顯嬌小了。當她在我面前坐下後,我用西班牙語表示自己來自荷蘭一所大學,正在玻利維亞從事「幸福與收入不平等之關聯」的研究。我想問她一些問題,以了解她如何看待自己的生活,和國家。
這不是我第一次訪談了。我已經在玻國10天,這幾天來我一直在採訪阿根廷與玻利維亞邊界附近的小鎮塔里哈的居民。我曾和市場攤販交談過,與種植草莓的農家暢飲啤酒並和他們的家人一起烤肉—─都是為了盡可能多蒐集數據。如今我帶著成疊問卷,來到一個婦女組織的辦公室,辦公室主管提議讓我和女性工人接觸,於是我開始訪問璜妮塔。
「讓我們開始吧。」我說。
「請問您今年貴庚?」
「58 歲。」
「請問您屬於哪一個族裔團體?」
「我是艾馬拉人。」
哈哈,我內心一喜,她屬於這裡的原住民團體之一,也是我之前一直沒有接觸過的族群。
「請問您的婚姻狀態?」
「我單身。」
「您可以閱讀嗎?」
「不會。」
「寫字呢?」
「不會。」
我繼續提出各種問題—─她的職業、教育程度,以及是否擁有手機、冰箱或電視。
當我詢問她的薪資時,她說:「我1 個月的工資是200玻幣(約800新台幣)。」這數字遠低於當時的總統埃沃.莫拉萊斯在不久前制定的最低薪資:815玻幣(約3260新台幣)。「如果我要求更多薪資,我擔心老闆會開除我。畢竟我住在帳篷裡。」
我在荷蘭伊拉斯墨大學的博士論文研究主題是:幸福和收入不平等。我的研究室桌子後面,掛著我用PowerPoint繪製的5張圖表,每張圖表顯示不同的收入分配。
但在玻利維亞進行研究的第一天,我就發現我探索收入不平等的問題,並無法適用於所有人。如果我採訪的市場攤販都不了解這些圖表代表什麼,我又怎麼能期待無法讀寫的璜妮塔,可以理解有關收入不平等的問題?
但就在我繼續發問之前,她主動開口:「妳知道玻利維亞有什麼嗎?」她突然坐起身子。「我們有一大群窮人,跟一小群非常富有的有錢人。窮人跟有錢人之間的差異只會愈來愈大。而且你是否會感到奇怪,這個國家沒有人會互相信任?」
在未事先告知的情況下,她描述了我的圖表中,圖A所代表的意義。而且她還立即回答了我另外兩個問題:關於她對玻利維亞的未來,和相互信任度的看法。我完全低估了她。我的臉色漲紅,但我裝作若無其事地繼續訪談。現在已經到了最後幾個問題。
「用1 到10 來評分,妳覺得自己有多幸福?」
「1 分。」
「用1 到10 來評分,5 年內妳覺得自己會有多幸福?」
「1 分。」
我想就是在2012年的這次訪談中,我開始對數字抱持懷疑。在此之前,我一直都是個數字消費者。我閱讀論文或看新聞時就會接觸到數字。攻讀計量經濟學學位時,我的教授提供許多關於數字的文獻,我也從諸如世界銀行等組織網站下載官方的正式數據資料。
但這次,我並沒有獲得一份早已完成的表格。我就是那個負責蒐集資料的人。我已經進入博士班一年了,與數字為伍已經成為我的專業,但與璜妮塔的對話,卻讓我的信念開始動搖。我想調查她的幸福程度,卻發現根本無法用數字來表達她在帳篷裡的慘澹生活。我聽到她對收入不平等的看法,我卻只能從圖表A、B、C、D或E中試圖做個詮釋。她所說的大部分內容根本無法計量,卻有重要的價值。
璜妮塔也教會了我一些其他事情。我認為幸福可以衡量。我試圖藉由圖表來詢問抽象問題。我以為璜妮塔沒有聰明到能探討諸如收入不平等這種艱深問題。如果其他人的研究問題相同但彼此抱持的信念不同,那麼他們可能就會得出截然不同的結果。數字應該是客觀的,但我卻倏然發現,數字與研究者間的關係是如此強烈。我其實對於數字背後所代表的意義,保有主觀的強烈影響。
與璜妮塔談過之後,我將她的資料輸入至Excel試算表:年齡58歲、月收入200玻幣、幸福指數1。這張表看起來非常整齊乾淨,就像我多年來做過的其他試算表一樣。然而突然間,我看到了這些數字背後的誤導性。
我在孩提時期就是一個數字控。當我還只會數數時,我就超愛連連看。我人生最初的記憶之一,就是在德國的黑森林渡假時,我用數字連成一個雪人。幾年後祖父母送我一臺LED時鐘,每到夜晚我躺在床上凝試著LED燈顯示的數字,並開始心算4個數字的加總之和。在高中時,數學是我最愛的科目,我最後決定攻讀計量經濟學博士學位。透過計量經濟學,我學到經濟模型背後所有統計數據的所有知識。我計算、分析並編列數據。因此,我重新回想起當初曾經在那些連連看中獲得的樂趣:找到數字背後的模式。
然而,數字在我的生命中還扮演另一個重要角色:數字讓我找到棲身之地。在5歲至26歲之間的求學時期,我試圖獲得各種學業獎項,用它們來衡量自己的表現。如果成績很低,我會感到非常沮喪;如果成績不錯,我會高興得像在天空翱翔。縱使幾天後早忘了背誦過什麼,我也不在乎,只要我的平均成績看起來不錯。甚至在校外,數字也控制著我。從玻利維亞回來時,我看到磅秤上的數字:56、BMI指數18.3,我感到非常自豪。
我並不是唯一一位受數字影響與牽引的人。我的大學同窗如果能在科學期刊上發表大量論文,就會獲得升遷機會;在我母親服務的醫院,每年該院總是半期待半又怕受傷害地等待年度百大醫院評鑑成績揭曉;而我的父親,65歲一到就非得退休不可。
直到後來我才意識到,與璜妮塔的交談使我了解關於數字的某個重要特質。正如我影響了自己所蒐集的數字,我周遭的人也同樣受了數字的影響,用數字來作為自身生命的指引。老師用數字來計算測驗成績;醫師用數字評估BMI 指數是否良好;政策制定者則用數字,決定你我該停止工作的時間。
2014年拿到博士學位後,我決定投身新聞界,因為自從和璜妮塔見面後,我發現數字背後的故事,比數字本身更有趣。我開始在荷蘭線上新聞平臺《通訊員》任職,並從事數字記者工作。藉由這個工作,我不僅希望能完整地跟讀者解釋數字是如何產生的,也試圖邀請讀者一起思考一個問題:我們是否應該終結數字在社會中的統治地位?
很快地,我發現努力沒有白費。讀者開始寄給我各種失真的民調結果、似是而非的科學研究以及極具誤導性的圖表。而且許多錯誤都是我在攻讀博士學位時也曾犯下的錯誤。當時在參加研討會以及對於我的論文的評論中,讓我明白自己所提出的樣本並不具備代表性,而且也混淆了相關性與因果關係。如今,在新聞界用於詮釋世界局勢、國會議員制定政策以及醫師提出健康決策時的種種數字之中,我看見我曾犯過的完全相同的錯誤。原來,這個世界充斥錯誤的數字。
關於數字的其他報告也讓我感到困擾。我聽說有父母收到幼兒園所提出的孩童學校表現報告,但他們的孩童只有1歲而已;警方為了達成取締額度而開罰單;優步司機只因評分數字過低而面臨解雇。
我愈來愈清楚一件事,那就是數字決定著這個世界的運作方式:從退休年齡到臉書點擊次數,從國內生產毛額到薪資收入。數字的力量只會愈來愈強。大數據演算法在公部門與私部門中有如雨後春筍。在愈來愈多的情況之中,發號施令的已經不是人類,而是數字。
我們彷彿都受到數字的集體催眠。文字被不假思索地批判,數字卻毫無束縛。擔任新聞工作者幾年後,我已經找到結論,那就是數字對於我們的生命有太大的影響力。數字變得如此強大,我們不能繼續忽視數字的濫用情形。如今,就是終結數字主宰一切的時刻。
但是請各位不要誤會,這不是一本「反數字」的書。就像單字一樣,數字是純粹的;真正犯錯的,是使用數字的人類。這本書的主題就是那些人,那些人的思考錯誤,那些人的直覺,與那些人的利益。我們將會遇見將種族歧視藏在統計數據的心理學家、用可疑方式蒐集數據的世界知名性學專家以及刻意捏造數據殘害百萬人的菸商巨擘。
但這本書的主題也是我們,因為你我都是數字消費者。因為我們允許自己受到數字的領導與誤導。實際上,數字會影響你喝什麼、吃什麼、在哪工作、收入多少、居住地點、結婚對象、投票選擇、是否獲得房屋貸款,和必須為健康保險支付多少。數字,甚至影響你的病情將會惡化或康復,掌控你的生與死。
你我其實別無選擇,即使是一位不關心數字的人,數字依然影響著每個人的人生。
這本書希望褪除數字世界的神祕,希望每個人看完這本書後,從此都可以正確地判讀數字是否被善用或遭到誤用。然後,我們就能有自信地自問:我們希望數字,在人生中扮演什麼角色?
現在是時候把數字放在正確的位置上了。數字不該被銘功頌德,也不該被棄如敝屣,而是回到正確的位置:文字身邊。
不過在達到這個目標之前,我們必須回到最初。人類對於數字的著迷,究竟起源於何時何處?請容我向各位讀者,介紹史上最有名的護理師:佛蘿倫絲.南丁格爾。
(本文作者為國立清華大學生命科學系助理教授、「Gene思書齋」版主。)