統計的假象:拆穿混淆的假設、揪出偏差的數據、識破扭曲的結論,耶魯大學最受歡迎的十八堂公開課(二版)

統計的假象:拆穿混淆的假設、揪出偏差的數據、識破扭曲的結論,耶魯大學最受歡迎的十八堂公開課(二版) pdf epub mobi txt 电子书 下载 2025

蓋瑞.史密斯
图书标签:
  • 统计学
  • 数据分析
  • 批判性思维
  • 科学方法
  • 概率论
  • 认知偏差
  • 信息素养
  • 决策制定
  • 耶鲁公开课
  • 统计陷阱
想要找书就要到 小特书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

  ★2013年諾貝爾經濟學獎得主、《釣愚:操縱與欺騙的經濟學》作者羅伯‧席勒(Robert J. Shiller)重磅推薦
  ★全美各大名校經濟學教授一致讚譽

  為什麼我們用毫無意義的統計資料來引領思考與行動?
  為什麼我們相信電腦從不犯錯,不管丟什麼垃圾進去,吐出的數據都是真理?
  為什麼專家欺騙我們,而我們也常欺騙自己?
  把統計當工具前,先搞懂統計常識!
  運用數據做決定前,先學會不被數據欺騙!

  每天喝兩杯咖啡會增加罹癌風險?
  在農曆五行中的火年出生的人更容易死於心臟病?
  卓越的公司有共同的成功特質與模式?
  自殺傾向和出生月份有關?

  數據可以幫助我們評估局勢,做出良好選擇;
  數據也可能誤導我們,做出錯誤決策。
  大數據時代,
  問題不再是沒有足夠資訊做判斷,而是如何不被眼前的資料誤導。
  
  到底該不該喝咖啡?每天該喝幾杯咖啡?
  該選擇哪家航空公司?
  如何投資?運彩怎麼買?

  當數據會影響你的日常決策,
  當騙子也習慣用數據說話,
  你更需要學會辨識隱藏在數字背後的陷阱與詭計。

  耶魯大學教授運用基本統計學原理,
  只要會加減乘除,就能揭穿日常生活中的各種數據騙局,
  並傳授避免落入數字陷阱的簡單準則:

  ◎為什麼我們容易被數據欺騙?
  人們容易被模式、解釋模式的理論吸引,有意或無意地忽略與之矛盾的數據。

  ◎數據如何欺騙我們?
  ‧忽略干擾因素:章魚保羅預測世界盃賽事結果成功率高達九成,但該結論忽略了章魚偏好橫向條紋圖案的因素,它只是選擇自己喜歡的國旗樣式。

  ‧倖存者偏差:對於敵軍最常攻擊飛機哪些部位的觀察,不會包含那些已經被擊落無法返航的飛機。對航空公司滿意度的調查,不會包含那些只搭過一次就不再來的乘客。

  ‧變形的圖像:圖像可以幫助我們解讀數據,但也可能扭曲或破壞數據。一旦省略數據、顛倒數軸或使用不一致的數軸間隔,將形成截然不同的圖表,產生誤導。

  ◎如何區分真確與胡謅?
  ‧常識判斷:對於看似嚴謹,但不太合常理的說法,應尋求壓倒性的證據支持。
  ‧新數據檢驗:採集新的資料,對既有的解釋進行檢驗。

好評推薦

  這是本非常有趣的書,卻揭示了非常嚴重的問題。我們經常會被數據愚弄,是時候拆穿這些詭計了!──諾貝爾獎經濟學得主、《釣愚:操縱與欺騙的經濟學》作者 羅伯‧席勒(Robert J. Shiller)

  很有趣,很八卦,卻很有見地,本書注定會成為經典。蓋瑞‧史密斯分析無數因相信數據而吃虧的案例,來告訴讀者該如何避免,這比單純講大道理有用的多了。──加州大學洛杉磯分校(UCLA)統計學系教授 愛德華‧E‧利默(Edward E. Leamer)

  蓋瑞.史密斯的《統計的假象》非常有趣,利用各種例子使讀者真正理解統計學,同時發現自己過去很多知識都是錯誤的。──哈佛大學政治經濟學教授 班傑明‧M‧傅利曼(Benjamin M. Friedman)

  本書幫助我們在統計學氾濫的時代,學會認清真正有效的數據。──貝萊德(BlackRock)投資管理公司總經理 布萊恩‧懷特(Brian White)
好的,这是一本关于如何批判性地审视统计数据、理解其背后的假设和潜在偏见的书籍的简介,旨在帮助读者更清醒地认识到统计学在日常生活和专业领域中的误导性潜力。 --- 书名: 《量化迷思:破解统计陷阱,辨识数据谎言,重构真实世界》 副标题: 洞悉概率的魔术,驾驭信息的洪流 内容简介: 我们生活在一个被数字主宰的时代。从新闻头条到商业决策,从公共政策到个人健康指南,统计数据无处不在,它们似乎为一切提供了坚实可靠的“证据”。然而,这些看似客观的数字背后,往往隐藏着精心构建的叙事、无意识的偏见,甚至是蓄意的误导。本书并非一本枯燥的统计学教科书,而是一本旨在赋予普通读者批判性思维武器的指南,教你如何剥开数字的外衣,直抵其核心的假设和局限。 第一部分:统计学的基石与沙丘 本书从最基础的概念入手,但重点不在于复杂的公式,而在于理解这些概念的“人性”弱点。我们将探讨相关性与因果关系这一永恒的陷阱。相关性只是一个信号,而因果关系则是我们渴望的解释。读者将学会如何区分两者,识别那些通过误导性图表或刻意选择的叙述来混淆这两者的论证。我们深入分析了混淆变量(Confounding Variables)的角色——那些潜伏在背景中,悄悄影响结果的“第三方力量”。 我们还会剖析“平均数陷阱”。平均数(均值、中位数、众数)在描述群体特征时极其方便,却常常抹杀了个体差异。例如,一个公司声称员工平均薪资很高,但如果高层薪水极高,而基层薪水微薄,这个平均数就会产生巨大的误导性。本书将揭示如何通过审视分布的形状,而非仅仅依赖单一的中心趋势度量,来获得更真实的图景。 第二部分:抽样的艺术与偏差的幽灵 统计推断的可靠性完全建立在样本的质量之上。本部分聚焦于抽样偏差——这是数据陷阱中最常见也最难以察觉的领域之一。我们将考察自选择偏倚(Self-Selection Bias)如何让问卷调查或在线投票的结果扭曲现实;探讨幸存者偏差(Survivorship Bias)如何使我们只关注那些“成功”的故事,而忽略了大量失败的案例,从而高估了某一策略或产品的可行性。 此外,本书将详述测量误差的本质。数据不仅仅是收集来的,它们是被“制造”出来的。不同的测量工具、不同的提问方式,甚至研究人员的预期,都会无形中影响数据的产出。我们会通过一系列生动的案例,展示一个细微的措辞变化如何将“同意”变为“强烈同意”,从而彻底改变调查结果的解读。 第三部分:图表的语言:视觉的操纵术 数据可视化是强有力的沟通工具,但也是最容易被滥用的工具。本部分是对视觉误导的深度揭露。读者将学习如何“阅读”图表背后的潜台词。我们将分析基线截断(Truncated Y-Axis)如何夸大差异,不当的比例缩放如何扭曲面积和体积的比较,以及三维图表如何通过透视效果欺骗我们的视觉判断。 我们不仅关注静态图表,也关注时间序列数据。当趋势线被拉长或缩短时,它们描绘出的未来图景可能是截然不同的。本书教导读者,看到图表时,首先要问的不是“它说了什么”,而是“它省略了什么”。 第四部分:假设的重量与模型的局限 所有统计模型都基于一系列基本假设。如果这些假设不成立,那么模型推导出的结论就如同建立在流沙之上。本书将引导读者审视那些经常被默认接受但很少被验证的假设,例如数据的独立性、正态分布,以及模型中变量的线性关系。 我们将深入探讨回归分析的威力及其限制。回归模型在预测和解释方面非常有用,但它们并不能自动揭示反常现象(Outliers)的影响。一个极端值常常能主导整个模型的拟合方向,本书将提供工具来识别和评估这些“异常分子”对整体结论的破坏性影响。 第五部分:实践中的统计陷阱与伦理考量 最后,本书将视角转向实际应用领域,包括医学研究、经济预测和社交媒体分析。我们会解析“P值文化”——过度依赖统计显著性而忽视实际效应大小(Effect Size)的现象。许多研究结果在统计学上是“显著”的,但在实际生活中却毫无意义。 此外,本书严肃探讨了统计的伦理责任。数据的使用者如何选择性地报告结果(P-Hacking),如何构建“两面派”的叙事,以及当数据与我们既有的信仰发生冲突时,我们如何保持理性与谦逊。 核心目标: 《量化迷思》的目标是培养一种健康的怀疑精神。它不是要读者放弃统计学,而是要读者以更成熟、更警惕的目光去对待所有声称“有数据支持”的论断。通过掌握识别偏见和逻辑谬误的技能,读者将能够更自信地驾驭信息时代的挑战,从被动接受数据到主动质疑数据。这本书是献给所有不愿被数字叙事所奴役的现代公民的“反数据手册”。

著者信息

作者簡介

蓋瑞.史密斯(Gary Smith)


  耶魯大學經濟學博士,並在耶魯大學任教七年,期間兩度獲得教學獎。其研究成果獲得彭博廣播(Bloomberg Radio Network)、CNBC、《富比士》(Forbes)、《紐約時報》、《華爾街日報》、《新聞週刊》(Newsweek)、美國《商業週刊》(BusinessWeek)、理財網站the Motley Fool 報導。

譯者簡介

劉清山


  清華大學畢業,譯有《物種起源》(On the Origin of Species)、《橫向領導》(Getting it Done)。

图书目录

序言

第一章 模式、模式、模式
混雜效應/選擇性報告與謊言/易受欺騙的本性/無論文,不生存/統計顯著性膜拜

第二章 不再神奇的超級暢銷書
去最好的學校/投票人數越多越好?/一醉方休/放下遙控器/請原諒我的直白/只有弱者留下來/受損的飛機/暢銷書的祕密

第三章 被誤傳的謀殺之都
麻州謀殺之都/請在我家後院開一座採石場

第四章 新的經濟學上帝
政府債務臨界點/相關性等同於因果關係?/墮胎會減少犯罪嗎?/是我的錯

第五章 洋基隊的門票真的划算嗎?
我的天哪/虛驚一場/讓他們吃蛋糕吧/有彈性的數線/將惡作劇翻倍/學生謊言/洋基隊的門票很划算/圖像的製作藝術

第六章 美國有多少非裔職業運動員?
蒙提霍爾問題/一個名叫佛羅里達的女孩/條件機率的混淆/假陽性問題/罕見病問題/達特茅斯鮭魚研究

第七章 辛普森悖論
某人的悖論/我要再來一杯咖啡

第八章 狀態火熱的雷.艾倫
小數定律/一項籃球研究/小華特.威廉姆斯/投擲馬蹄鐵/保齡球

第九章 勝者的詛咒
回歸平均值/西克理斯特的愚蠢/古老的謬誤何曾消亡?/道瓊指數落榜生/冠軍窒息/尋找學院院長和靈魂伴侶

第十章 如何改運?

第十一章  德州神槍手
癌症聚集恐慌

第十二章  終極拖延
死亡凹陷和尖峰/經過進一步研究/午夜的月餅/漫長的告別

第十三章  黑色星期一
火箭科學/巴斯克維爾的獵犬/五行噩運/花押決定論

第十四章  魔球
棒球迷信/如果你給我一個D,我就會死(die)/糟糕的出生月份/名人堂的死亡之吻

第十五章  特異功能真的存在嗎?
超感知覺/胡迪尼的挑戰/一個家庭對超自然現象的著迷

第十六章  彩券是一種智商稅
目之所及/我們都將為IBM工作/股票是一種不錯的投資/跑贏大盤(或者說為什麼我喜愛包裝工隊)/傻瓜四股/反向頭肩/如何(不)中彩券/不會破裂的泡沫/南海泡沫/波克夏泡沫/真實股價

第十七章  超級投資者
寬客/收斂交易/我只看數據/在推土機面前撿硬幣/閃電崩盤

第十八章  增長的極限
窮途末路

第十九章  何時相信,何時懷疑
被模式誘惑/具有誤導性的資料/變形的圖像/缺乏思考的計算/尋找混雜因素/手氣好/回歸平均值/平均定律/德州神槍手/當心經過剪裁的資料/缺乏理論的資料僅僅是資料而已/缺乏資料的理論僅僅是理論而已/美好的出生日

參考資料

图书序言

  • ISBN:9786267261989
  • 叢書系列:Aplus
  • 規格:平裝 / 400頁 / 17 x 23 x 2.1 cm / 普通級 / 單色印刷 / 二版
  • 出版地:台灣

图书试读

序言

  我們生活在大數據時代。高性能電腦和全球網路的強大組合正得到人們的讚美,甚至推崇。專家不斷告訴我們,他們發現了一種新的能力,可以篩選巨量資料並發現真相,這將為政府、商業、金融、醫療、法律以及我們的日常生活帶來革命。我們可以做出更明智的決策,因為強大的電腦可以分析資料,發現重要的結論。

  也許事實的確如此,也許未必。有時,這些無所不在的資料和偉大、光明正確的電腦會得出一些非常怪異的結論。例如,有人一本正經地宣稱:

  ‧凌亂的房間會強化人們的種族主義傾向。

  ‧還未出生的小雞胚胎會影響電腦的隨機事件生成器。

  ‧當政府負債相對國內生產總值的比率超過百分之九十時,國家幾乎一定會陷入衰退。

  ‧在過去二十年美國犯罪率下降的原因中,合法墮胎的比例高達百分之五十。

  ‧如果每天飲用兩杯咖啡,將大為提高罹患胰腺癌的風險。

  ‧最成功的公司傾向於變得不那麼成功,最不成功的公司傾向於變得更加成功,因此過不久,所有公司都會淪為普通的公司。

  ‧出現在雜誌《運動畫刊》(Sports Illustrated)和電玩《勁爆美式足球》(Madden NFL)封面上的運動員會受到詛咒,他們可能會陷入平庸,或者受到運動傷害。

  ‧生活在高壓電線桿附近的兒童具有更大的罹癌風險。

  ‧人類有能力將死亡推遲到重大儀式過後。

  ‧亞裔美國人更容易在每月四號突發心臟病。

  ‧如果一個人的姓名首字母縮寫擁有積極的含義(比如ACE),那麼他可以多活三到五年。

  ‧平均來說,教名(第一個名字)以字母D開頭的棒球運動員的壽命比教名以字母E到Z開頭的運動員短兩年。

  ‧臨終病人可以被幾千英里以外傳送過來的積極心理能量治癒。

  ‧當NFC冠軍球隊贏得超級盃(美國超級盃總決賽在國家聯合會〔National Football Conference〕和美國聯合會〔American Football Conference,AFL〕分別比賽產生的冠軍之間舉行)時,股市幾乎一定會上漲。如果你購買股息率最高、每股價格第二低的道瓊工業平均指數,你就可以跑贏大盤。

  這些說法顯然是錯誤的。不過,許多與此類似的說法每天都會出現在報紙和雜誌上。在如今的資訊時代,我們用沒完沒了而又毫無意義的資料指導我們的思想和行動。不難看出為什麼我們會反覆得出錯誤的推論,制定糟糕的決策。即使能夠得到比較充足的資訊,我們也不會永遠注意到數據的偏差性和無關性,或者科學研究的缺陷和誤導性。我們傾向於相信電腦從不犯錯,認為不管我們把什麼樣的垃圾扔進去,電腦都會吐出絕對真理。這種想法不僅存在於外行人的日常生活中,也存在於專業人員嚴肅認真的研究工作中。舉凡在流行刊物、電視、網路、競選活動、學術期刊、商業會議、法庭,政府聽證會,此類現象屢見不鮮。

  幾十年前,資料非常稀少、電腦還沒有出現時,研究人員需要努力蒐集優質資料並進行審慎的思考,然後花費幾個小時甚至幾天的時間,從事艱苦的計算工作。現在,面對豐富的資料,研究人員通常不會花費太多的時間區分優質資料和垃圾,或者區分合理分析和垃圾科學。更糟糕的是,我們常常不假思索地認為,我們對大量資料的處理永遠不會出錯。我們匆匆忙忙地根據這些機器發出的夢囈制定決策——比如在經濟衰退期間提高稅賦,將我們一生的積蓄交給一些說得天花亂墜的財務分析師,根據最新的管理理念制定商業決策,用醫療騙術危害我們的健康——更糟糕的是,我們還會放棄心愛的咖啡。

  英國經濟學家羅納德.寇斯(Ronald Coase)曾經嘲諷道:「如果你拷打資料足夠長的時間,它一定會招供。」《統計的假象》考察了幾十個扭曲的結論。只需片刻的思考,你就會發現這些結論的問題。有時,無恥之徒故意用這些說法來誤導我們。有時,天真快樂的研究人員並沒有意識到他們所製造的惡作劇。

  我寫這本書的目的是幫助我們遠離錯誤──包括外部錯誤和自己造成的錯誤。你將學到一些簡單的指導準則,用於測試其他人或者你自己說出的不可靠的觀點。人們用數據欺騙我們,我們也經常用數據欺騙自己。

用户评价

评分

这本书的深度远超出了我对“统计学入门”书籍的预期。它不仅仅是教你识别错误,更重要的是提供了一套构建批判性思维的框架。我特别欣赏作者对于“抽样”和“代表性”的论述。在很多商业调研和民意测验中,样本的选择往往是决定性的一步,但也是最容易被操纵的一环。书中对各种抽样方法——无论是简单的随机抽样还是更复杂的系统抽样——的利弊进行了细致入微的比较,并展示了不良抽样如何系统性地歪曲结果。读完这部分,我开始明白为什么一些看似权威的调查结果在现实中往往会大相径庭。这种对方法论根源的深挖,使得本书的价值超越了单纯的科普范畴,更像是一本关于“如何科学地质疑世界”的操作手册。

评分

坦白说,我一开始有点担心这本书会过于学术化,毕竟是耶鲁大学的公开课内容汇编,生怕自己没有足够的数理基础去跟上。然而,这本书的结构安排非常巧妙,它似乎是为完全没有统计学背景的普通读者量身定制的入门指南。它没有上来就抛出一堆复杂的公式,而是从我们日常生活中最容易犯的认知偏差入手,比如幸存者偏差、确认偏误,然后才自然而然地引申到统计工具的误用上。印象最深的是关于“相关性不等于因果关系”的探讨,作者用几个看似毫不相关的事件并列展示了这种逻辑谬误的普遍性,读完之后,我再去刷社交媒体上那些动辄断言“A导致B”的帖子时,都会下意识地停下来审视其背后的数据支撑是否站得住脚。这种思维模式的转变,是这本书给我带来的最宝贵的财富,它教会了我如何更审慎地消化信息流。

评分

这本书的封面设计和书名本身就充满了吸引力,尤其是“統計的假象”和“拆穿混淆的假設”这些词语,立刻抓住了我对数据解读背后陷阱的好奇心。我一直是那种对新闻报道中的图表和各种“专家”的结论持怀疑态度的人,总觉得有什么地方不对劲,但又说不上来。这本书就像一把钥匙,帮我打开了理解数据世界的另一扇门。它不仅仅是关于如何计算平均数或标准差,而是更深入地探讨了人类思维的局限性、统计学在社会科学和商业决策中如何被误用或滥用。作者的笔触很稳,不像有些技术书籍那样枯燥乏味,而是通过大量的现实生活案例来阐述复杂的概念,让我感觉自己像是在听一位经验丰富的讲师在娓娓道来,而不是被迫啃下一本教科书。这种娓娓道来的叙事方式,使得原本可能晦涩难懂的统计学原理变得生动起来,每一次翻页都期待着下一个被揭示的“假象”。

评分

这本书的第二版相较于第一版,据说在案例上有所更新,这一点我深表赞同,因为现实世界的数据陷阱总是在不断演变。我尤其关注了关于“大数据”时代的统计挑战那一部分内容。在人工智能和机器学习日益普及的今天,我们似乎对数据抱有近乎盲目的崇拜,认为数据量越大越好,计算越复杂越准确。但本书犀利地指出了,海量数据并不自动带来真理,它可能只是放大了已有的偏见和噪音。作者用一些当代科技公司案例(当然是以化名或概念化的方式呈现,以保护隐私和避免时效性问题)来佐证,一个有缺陷的算法,即使喂给它十亿条记录,最终产出的决策依然是荒谬的。这让我意识到,技术进步不应取代人类的理性判断,尤其是在面对统计证据时。

评分

从阅读体验上来说,这本书的行文节奏把握得极其到位。它不是那种一口气读完就束之高阁的书籍,而是需要时常停下来,反思自己最近听到的某个新闻、做出的某个决策是否也无意中落入了书中所述的逻辑陷阱。我发现自己开始在日常对话中,不经意地去追问数据的来源、比较基础率的差异,甚至对那些过于“完美”的统计结论保持警惕。作者通过清晰的图示和简洁的语言,成功地将统计学的严谨性与大众的可读性完美结合起来。这本书的价值在于,它赋予了普通读者一种“统计免疫力”,让我们不再是数据的被动接受者,而是能够主动去解构、去质疑的审视者。对于任何需要基于事实做出判断的社会成员而言,这都是一本不可或缺的指南。

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有