大数据的傲慢与偏见:一个「圈内数学家」对演算法霸权的警告与揭发

大数据的傲慢与偏见:一个「圈内数学家」对演算法霸权的警告与揭发 pdf epub mobi txt 电子书 下载 2025

原文作者: Cathy O’Neil
图书标签:
  • 大数据
  • 算法
  • 偏见
  • 数学
  • 科技伦理
  • 数据科学
  • 人工智能
  • 社会影响
  • 批判性思维
  • 算法霸权
想要找书就要到 小特书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

大数据不缺推崇者,但我不是。
甚至,我要称它是这个时代的「数学毁灭性武器」。

  一名前华尔街量化分析师提出警告:现代生活中无所不在的的数学模型可能撕裂社会!

  纽约时报非文学畅销书
  亚马逊书店「商业统计」畅销书
  《纽约时报》书评2016年最值得注意的书
  《波士顿环球报》2016年最佳书籍
  《连线》(Wired)2016年必读的选择之一
  《财星》杂志2016年选书
  《MIT科技评论》2016年编辑选书
  《科克斯》书评A Kirkus 2016年最佳书籍
  芝加哥公共图书馆2016年最佳书籍
  《自然》期刊官网(Nature.com)2016年最佳书籍
  《纽约时报》2016年度编辑选书

  这是个演算法包围现代公民的时代!演算法在幕后影响着我们生活的各种决定,包括我们上什么学校、能否借到汽车贷款,以及医疗保险必须支付多少保费,愈来愈多判断是由数学模型,而非某些人所做出。这一切看似公平:因为所有人是根据相同的规则评断,不受偏见影响。

  对热情的「问题解决者」来说,大数据像仙境,它蒐集资讯、再运用数学模型,使我们得以更有效地调配资源、筛选最优的人事物、并做出最好的决定,这些热情的宣扬者更是四处宣传大数据应用的威力。

  但是,曾在典型数据分析圈内工作的凯西.欧尼尔不是上述这种人。

  她在本书指出,事实与我们想的恰恰相反!这些数学模型不透明、不受管制,即便出错,受害者往往无法申诉。最令人不安的是,这些模型会「强化歧视」,例如,贫穷学生在申请学贷时,可能因自家的邮递区号,被审核贷款的数学模型视为还款高风险者,因而无法获得贷款……。这类问题会形成恶性循环——奖励幸运儿、惩罚遭践踏的人,创造出危害民主的「有毒鸡尾酒」。

  欢迎认清大数据的黑暗面

  欧尼尔在本书中揭开对我们人生各阶段有巨大影响的各种黑箱数学模型,不管我们愿不愿意,演算法系统都已经为我们打上「分数」。

  当前许多数学模型已经失控滥用、还自作主张地替教师和学生评鑑、筛选履历表、审核贷款、评估员工绩效、锁定目标选民、决定假释名单,以及监测我们的健康状态,决定我们个人及社会的未来。

  欧尼尔唿吁:在这个人人都被迫拥有自己在某种演算系统中持有「e化评分」的时代,那些建立模型的人应该为他们所创造出来的演算法负起更多责任,而政策制定者更应该负起监督管理的责任。这本重要着作使我们得以提出关键问题、揭露这些「数学毁灭性武器」的真相和要求变革。

强力推荐

  ……这些源自人性黑暗面的大数据与人工智能,如果不受监管,有可能撕裂社会,甚至让人类文明崩溃。但监管的标准该如何制定?谁来负责监管?如果监管者跟不上时代,甚至不可信赖,人类又该如何在AI专政的虚拟实境中维持人性尊严?-胡一天(源铂资本创办人暨执行长,源铂情报总编辑,《风传媒》专栏作家)

  生活在现代的社会里,完全不被数学模型监控几乎是不可能,这是一种最安静的恐怖主义。然而,数学模型真的是我们生存世界的绝对真理?当我们盲目地将自己交付给它并且据此生存,是否有可能我们所拥抱的真理,只是让我们的世界变得更加荒谬扭曲……-陈智凯(国立台北教育大学文化创意产业经营学系所教授)

  大数据浪潮下必读的一本书。当用数据模型替每个人打分数时,举凡信用、教育、健康等方面,带来了潜在的黑箱、歧视、道德危机。不论是数据从业人员或一般大众,都应阅读本书,建立正确的风险认知。-杨立伟(意蓝科技股份有限公司董事总经理、创办人,台湾大学工商管理学系兼任助理教授)

  进行假设检定与决策时,伪正(型1错误)率和伪负(型2错误)率常会存在。本书提醒我们必须检验数据的正确性,降低二种错误率,并考虑错误所造成的影响,进行回馈的模型校正,才能应用大数据的分析,作出合适的决策。-卢鸿兴(国立交通大学统计所教授暨大数据研究中心主任)    

  大数据、演算法、人工智慧,这些躲在数学背后的当红名词,正悄悄改变世界。作者批评它们变成一种神祇,隐形,至高无上,权力无限,且不受监督,她的警语,正可作为社群网路时代的急迫功课。-黄哲斌(新闻工作者)

  当手上只有榔头,看什么都像是钉子。现在的「大数据」就像一把神奇的榔头,不管是为其着迷还是焦虑,人们以为可以拿大数据来解决各种问题,但事实并非如此。如果你想真正了解大数据,受益而不受害,这本书便是必读。-郑国威(PanSci泛科学总编辑)

  凯西.欧尼尔是大数据的内行人,她看到的情况并不美好。本书揭露那些假装成中性数学工具,但剥削弱势、扭曲真相的演算法。本书睿智、犀利,是我们迫切需要的着作。-艾伦伯格(Jordan Ellenberg)、威斯康辛大学麦迪逊校区教授、《数学教你不犯错》(How Not To Be Wrong)作者

  本书利用令人不安的真实案例和生动的叙事,难能可贵地说明政府和大企业如何利用无形的演算法和复杂的数学模型,损害平等并增强私人权力。本书以明晰治黑箱、以理解治混淆,有助我们在为时已晚之前扭转局面。-泰勒(Astra Taylor)、《人民平台》(The People’s Platform)作者

  在这本杰作中,凯西.欧尼尔利用她的数学专长和对社会正义的热情,戳破大数据美好无瑕的假象。她有力地说明了数学正如何被用来压榨弱势和扩大不平等。她的分析精湛、文笔迷人,她的发现则令人不安。-博伊德(danah boyd)、数据与社会研究所创始人、《键盘参与时代来了!》(It’s Complicated)作者

  虽然我是职业数学家,我在阅读这本书之前,对大数据可以如何暗中为害毫无概念。本书内容令人害怕,但读起来意外有趣:欧尼尔描述的由演算法主导的世界不乏黑色幽默和愤怒,就像当代的《奇爱博士》(Dr. Strangelove)或《第22条军规》(Catch-22)。这是一本非常重要的着作,令人大开眼界又深感不安。-斯托盖茨(Steven Strogatz)、康乃尔大学教授、《X的奇幻旅程》(The Joy of x)作者

  这本杰作直白地唿吁大家有所行动。它承认数学模型不会消失:模型用来找出需要帮助的人,可以产生神奇的作用,但如果用来惩罚人和剥夺某些人的权利,则可以成为非常恐怖的工具。凯西.欧尼尔这本书之所以重要,恰恰是因为她相信数据科学的效用。本书有如一个关键的速成课程,说明了我们为何必须审视周遭的系统并要求改善。-达克特罗(Cory Doctorow)、《小老弟》(Little Brother)作者、波音波音网站(Boing Boing)编辑

  许多演算法受制于权力不平等和偏见。如果你不想受这种演算法支配,请看凯西.欧尼尔的这本书,以便解构傲慢的体制日趋严重的最新暴行。-纳德(Ralph Nader)、《任何速度都不安全》(Unsafe at Any Speed)作者

  下次碰到有人毫无保留地赞美大数据的奇蹟,你可以向他出示本书。这是有益之举。-萨蒙(Felix Salmon)、Fusion电视频道

  从找工作到找配偶,预测型演算法正悄悄地塑造和控制我们的命运。凯西.欧尼尔带我们走过一段令人愤慨和惊奇的旅程,其文字就像是与读者交谈。这是一本重要着作。我们必须处理科技产生的问题。-提拉多(Linda Tirado)、《当收入只够填饱肚子》(Hand to Mouth: Living in Bootstrap America)作者
 
《数据的迷宫:权力、结构与算法时代的生存指南》 一部深入剖析现代信息社会底层逻辑的非虚构力作。 在充斥着数据流和算法决策的今天,我们仿佛置身于一个透明的、高效的迷宫之中。然而,当我们试图从中寻找出路时,却发现那些看似中立的“数据”和“算法”正在悄然重塑我们的认知、塑造我们的选择,甚至决定我们的命运。本书并非对技术进步的简单颂歌或哀歌,而是旨在以一种冷静、审慎的笔触,揭开这一宏大叙事背后的权力结构与隐秘机制。 第一部分:透明的代价——数据采集的权力边界 我们生活在一个被持续观测的时代。从每一次点击、每一次搜索,到生物特征的扫描和环境传感器的数据抓取,我们的存在被拆解成无数个可量化的信息碎片。本书首先聚焦于数据采集的“不平衡性”。这种不平衡不仅体现在技术能力上的巨大鸿沟——少数科技巨头掌握着全球数据的主权——更体现在权力关系上:用户是原材料的提供者,而平台则是价值的提取者。 我们探讨了“默认同意”机制的陷阱。在繁复的用户协议背后,个人隐私的边界是如何被一步步侵蚀的?我们不再是数据的拥有者,而是数据的“租客”。书中详细分析了数据生命周期的每一个阶段:从原始数据的捕获、清洗、标记,到最终转化为预测模型和商业决策。这种流程并非纯粹的技术过程,而是一个深刻的社会工程。 特别值得关注的是,本书深入考察了“数据贫困”的现象。在数据化的浪潮中,缺乏资源或数字素养的群体,其数据足迹往往被忽视、误读,甚至被用于针对性的负面筛选。这种“数据沉默”如何加剧了既有的社会不公?我们审视了数据如何成为一种新的“资本”,而其分配的不均等,正在重塑阶层固化。 第二部分:算法的黑箱——决策权力的转移与偏见的固化 当决策权从人类专家手中转移到复杂的计算模型手中时,我们获得了效率,但我们失去了什么?本书的中间部分着力于解构算法的“黑箱”特性。这不是一个关于代码如何运行的技术手册,而是关于代码背后的意图、训练集和目标函数的哲学与社会学分析。 我们深入剖析了“训练数据偏见”的危害。算法并非天生中立,它们是历史遗留问题的放大器。如果用于训练模型的历史数据反映了性别歧视、种族偏见或地域不平等,那么算法的产出只会更有效地、更隐蔽地复制甚至强化这些偏见。书中列举了多个跨行业的案例——从信贷审批、招聘筛选到司法判决辅助系统中,算法是如何在“效率”的名义下,制造出难以察觉的歧视链条。 此外,本书探讨了“目标函数设定”的伦理困境。一个算法的优化目标——无论是最大化点击率、延长用户停留时间,还是最小化运营成本——都蕴含着深刻的价值取向。当这些取向与公共利益或个体福祉发生冲突时,我们该如何问责?算法的“解释性缺失”(Explainability Gap)使得问责变得异常困难:当一个决策系统出错时,我们无从追溯,只能接受结果。这种权力的“去人格化”运作,对现代治理体系构成了严峻挑战。 第三部分:导航在迷宫中——重塑数据素养与数字主体性 面对无所不在的数据霸权,我们能否夺回叙事的控制权?本书的最后部分转向了构建性的探讨,旨在为普通个体和政策制定者提供一套观察和应对的框架。 首先,我们倡导一种“批判性数据素养”。这不只是学会使用工具,而是理解工具背后的经济驱动力和权力结构。个体需要具备识别数据陷阱、质疑算法结论、并理解自身数据足迹价值的能力。我们提出了一套“数据自卫”的实践原则,鼓励人们重新审视自己的数字足迹,并采取策略性的信息共享行为。 其次,本书探讨了重新设计问责机制的必要性。如何设计出既能利用数据优势,又能保障公民权利的“可审计算法”?我们考察了诸如“数据信托”(Data Trusts)和“数字公民权”的法律构想,旨在将数据控制权从单一的私有实体手中分散开来,回归到更广泛的公共或社区范畴。 最后,本书呼吁一场关于“数据民主”的严肃对话。数据和算法的规则制定不应仅仅是技术专家和商业精英的闭门会议。我们需要建立跨学科的对话平台,让伦理学家、社会学家、法律专家和普通公民共同参与到定义“好的算法设计”的过程中。我们必须警惕技术路径的“单轨制”,坚持为技术发展设定清晰的、以人为本的伦理锚点。 《数据的迷宫》是一份对我们这个信息时代进行深入解剖的报告。它要求我们停止对技术的盲目崇拜,直面数据驱动决策背后的权力张力。唯有理解了迷宫的结构,我们才能真正掌握穿行其中的钥匙。这是一场关于认知、权力和未来生存方式的深度思考。

著者信息

作者简介

凯西.欧尼尔(Cathy O’Neil)


  数据科学家,部落格mathbabe.org网主。自哈佛大学取得数学哲学博士学位,曾任教于巴纳德学院,随后投身金融业,任职于对沖基金公司德劭(D.E. Shaw)。离开金融业后曾于多家新创企业担任数据科学家,负责建立预测人们购买和点击行为的模型。哥伦比亚大学数据新闻学莱德计画(Lede Program in Data Journalism)发起人,着有《数据科学实践》(Doing Data Science)。每週参与播客节目Slate Money。

译者简介

许瑞宋


  香港科技大学会计系毕业,曾任路透中文新闻部编译、培训编辑和责任编辑,亦曾从事审计与证券研究工作。2011年获第一届林语堂文学翻译奖。译有《红队测试》、《数位面包屑里的各种好主意》和《大鸿沟》等数十本书。(victranslates.blogspot.tw/)
 

图书目录

引言
第1章 数学炸弹元件:什么是模型?
第2章 金融业震撼:一个量化分析师的幻灭之旅
第3章 军备竞赛:大学入学问题
第4章 宣传机器:网路广告
第5章 殃及池鱼:大数据时代的执法问题
第6章 资格不符的第一关:艰难的求职者
第7章 隐形焦虑:恐慌的工作者
第8章 连带伤害:当个人信用出了问题
第9章 没有安全区:你想买保险吗?
第10章 被瞄准的公民:现代人的科技生活
结语
致谢

 

图书序言

中文版推荐书评一

偏见的结构与人工智能专政


  对关注人工智能进展的人士而言,卡夫卡笔下的绝望困境,象征着一种反乌托邦式的恶梦。在卡夫卡的经典小说《审判》中有一则寓言《法律之前》(Before the Law),讲述一名乡巴佬试图上法院寻求救济,到了门口却被警卫阻挡的故事。警卫说:「法律的大门为人人敞开,不是不给进,但不是现在。」乡巴佬只好坐在警卫给的小板凳上,既不愤怒,也不打算伤害警卫,而是继续在门前等待,到死为止。在他嚥气前,乡巴佬问警卫:「人人都想在法律之前讨个公道,为什么这么多年来我一个影子都没见到?」警卫说:「你眼前这扇门,是特别为你准备的,而我现在要将它永远关上。」

  《审判》的男主角「K」在听完这则寓言后,认为整件事就是一场用谎言罗织而成的体制化骗局。卡夫卡式法庭不在乎客观世界中的真实,而仅在乎维持体系的持续运作。法律的大门理论上向社会敞开,但在卡夫卡的世界里,人人有机会,个个没把握。整个体系不是在追求真理正义,而是在为维护体制的充分与必要条件服务。当偏见已经根深柢固,只要身在其中,就被推定有罪,取证、诘问、辩论等程序,只是过场套路。恪忠职守的各级官僚不用为受害者负责,更无需内疚自责。因为他们都像那位低阶警卫一样,只是尽看门的本分而已。藏在森严大门之后的法官,是至高无上的绝对权威。整个法律体系彷彿一只神秘的黑盒子,没人敢质疑这套威权体制的运作逻辑,也无法明白黑箱作业的各种技巧。人类知道自己身处黑箱之中,却不知道黑箱的边界,只能战战兢兢苟活。一但违规,只能逆来顺受,服从安排。

  在此,请各位想像这个黑箱不是由卡夫卡式的法官、律师与警卫把持,而是由各种人工智能及大数据演算法操纵。这些用机器语言写成的软体程式码,与用人类语言写成的法律条文一样,都不可避免地受到创造者的主观愿望与价值取向影响──一种偏见的结构。偏见会随时间沖刷被体制化,逐渐取得了可被称为「习惯」、「法律」、「民情」等「正统」地位。这个自然演进的过程,在前互联网时代,可能是渐变。在互联网席卷全球、快速迭代的世界,就是不断生灭的剧变。

  随着社会经济生活演化愈趋复杂多样,「法律」作为一种规范的上位概念,其内涵与核心价值也必须与时俱进。当掌控资源的新贵们愈发信奉数理逻辑,而非义理人情,有能力利用人类与机器语言「造法」的行为体,若不受制衡,又无法自我警惕,比卡夫卡世界更冷酷无情的人工智能专政就可能随时降临,所有捍卫自由、民主与人权的努力,在铺天盖地的技术进逼之下,将毫无招架之力。制度杀人,莫此为甚。

  「被AI专政」的世界是否已经降临?曾在纽约对沖基金德劭集团(D. E. Shaw Group)任职的数据科学家、知名部落格「mathbabe」博主,亦是本书作者凯西.欧尼尔(Cathy O’Neil)认为,非常可能。

  在哈佛大学主修代数数论并取得数学博士学位的凯西,自幼热爱数学,在获得纽约哥伦比亚大学巴纳德学院的教职之后,却毅然决定到德劭担任量化分析师,透过研究各种数理统计模型与数据分析,在全球资本市场中找寻可持续获利的交易与投资策略。她与同事所做的工作成果,可以驱动数以兆计的资金在全球市场快速流动,创造鉅额财富。2008年全球金融海啸,让她顿觉幻灭:非关道德的数理模型成为华尔街鍊金术士口中的神奇公式,由资产证券化工厂制造出来的金融衍生商品,催生了庞大的房地产信贷泡沫,将金融体系中的槓桿推升到难以为继的程度,加剧了金融危机的连锁反应,甚至差一点摧毁全球经济。

  更让她惊讶的是,金融危机爆发后,新的数据分析技术被应用至更多领域。透过日夜不停地爬梳蒐集自社群媒体、电子商务网站及各类互联网平台的海量数据,原本用来套利套汇套差价的演算法被用以研究人类的七情六慾、预测消费口味及监控信用风险,计算个人是否值得受高等教育、获得工作面试、购买医疗保险、甚至恋爱与犯罪的机率。系统工程师们或许出于好意,企图客观地找出更有效率的方式解决问题。但很多模型仍然将偏见、误解和私心纳入了演算法,而人类的生活愈来愈受这些系统管控。在数理逻辑至上的世界中,数学定律有绝对权威,数学家、电脑科学家与系统工程师彷彿神坛祭司,透过不透明的卡夫卡式黑箱,对芸芸众生的未来作出神意的裁决。其决定即使是错误或有害,也不容质疑或申诉。

  但这类数理模型之所以有商业价值,是因为它们一开始都是被设计用来自动化批量处理信息的特定程式。很多模型源自于数学、化学与物理学等无机领域,而非生物学、心理学、政治经济社会学等有机领域。在应用与诠释上一旦出现偏差,将加剧社会两极分化,让富者愈富、贫者愈贫,歧视与偏见在演算法的回馈路径中被保存、复制、放大,可能出现反人性的严重后果。民营企业若将这类程式视为商业机密,不公开揭露演算法内部细节与诱因机制,往往让数学公式成为卸责与扩权的借口,并利用资讯科技创造出问题正在被解决的幻象,收割政治与商业利益。

  在最极端的情境下,我们完全可以想像这些程式成为用数学构建的「袋鼠法庭」(kangaroo court),透过各类物联网监控技术与不透明的演算法「优化」资源分配,甚至可能在分子生物学的层次对人类进行分类、排序与缺席审判。这些源自人性黑暗面的大数据与人工智能,如果不受监管,有可能撕裂社会,甚至让人类文明崩溃。但监管的标准该如何制定?谁来负责监管?如果监管者跟不上时代,甚至不可信赖,人类又该如何在AI专政的虚拟实境中维持人性尊严?

  如果「程式即法律」(Code is Law),那么「法律也是一种计算」(Law is Computation);诸如伦理、道德、义理人情等难以量化的概念,其实是环境的一部分。针对「智能行为体」的规范,不论该行为体是程式、个人或企业,都必须充分考虑行为体之间的博弈、竞争、演化,以及所有基于人性的行为体必然会出现的认知谬误与系统内禀的统计偏差,并设计出对应的救济与争端解决机制。这份工作,人类责无旁贷。

  更深一层看,何谓智能?笛卡儿曾说:「我思,故我在」,但抽象思维是否为证明高等智能存在的充份且必要条件?如何为智能分等级?用智能方法自动做出的选择是否应该具有最终的法律效力?若把整个互联网科技的发展视为人类加速己身演化的努力成果,那么利用智能技术来鑑别、筛选、拔擢人才的尝试,是否意味着类似于智人演化出大脑新皮质之后,将尼安德塔人抛弃在演化的历史断裂点,将在互联网的下一阶段发生,定义出新旧人类之间不可跨越的鸿沟?

  因为互联网科技跨境的特质,这类议题本质上是全球性的,需要全球范围的沟通、协调与合作。本书的原文版书名取名自Weapons of Mass Destruction(大规模毁灭性武器)谐音的Weapons of Math Destruction(数学毁灭性武器),是否也需要一份「核不扩散条约」?面对益发混乱的国际局势与现实主义地缘政治的回归,霸权级资讯大国与互联网巨头竞逐全球市场的斗争,让透过全球网络的「人工智能治理」(AI governance)成为一场不断进行中的革命,构成对人类巨大的挑战。

  日本中央银行总裁黑田东彦曾在一场人工智能与金融前沿研讨会上说,面对新科技对社会经济所造成的深层变革,政策制定者不应该过度忧心新科技的负面作用,而不去关注其正面效益。人类与AI应该互补,不能也不该对抗。人类的判断往往受既有典范影响,有时对变化觉察不足,而这正是AI的强项,可以透过客观地调整那些因为主观偏见所忽视的数据关连性与新趋势。另一方面,直觉、常识与想像力,是目前人工智能最大的弱点。人类真正应该担忧被AI取代的时候,是人类放弃独立正面思考的时候。

  正如在17世纪创造计算机的法国哲学家巴斯卡(Blaise Pascal)在《沉思录》中所言:面对强大有力的宇宙,人是一根会思考的芦苇。即使柔弱如芦苇,仍可秉持高贵。希望难以量化,前途不可限量。命运没有基因,梦想没有极限。

  在经典科幻电影《2001太空漫游》中的「HAL」(该片中一台具有个性与思考能力 、甚至会「失控」的超级电脑)出现前,也许人类应该少担心些数据,让梦想与命运驱使我们继续航向未知的远方。

胡一天(源铂资本创办人暨执行长,源铂情报总编辑,《风传媒》专栏作家)

中文版推荐书评二

欢迎来到第六病房!


  「昨晚我读完了这本书,感觉莫名惊悚恐怖,好像自己也被关进了第六病房!」这是列宁对俄国知名小说家契诃夫〈第六病房〉(Ward No.6)的读后感想,同样地这股莫名恐惧惊悚也适用于本书。

  〈第六病房〉这部被称为「俄国文学中最惊悚的小说」故事内容大致描写,发生于俄国某一个城镇的小型医院里,「第六病房」是一个专门禁锢精神病患的特殊病房,它由一位粗暴的退伍老兵负责看管,或说是由他负责统治,其中关键性的病人格罗莫夫患有严重的被迫害妄想症,尽管他出身良好并且曾经担任过地方法院书记,然而,格罗莫夫脾气暴躁且言辞尖锐。在某一个忧郁的秋天早晨,他目睹了两名被戴镣铐的犯人由士兵押进监狱,于是他开始妄想自己也可能随时被捕,终日陷入惊恐泥淖,最终也因忧心被误认为是命案凶手而正式发疯,结果被送进了「第六病房」。另一方面,「第六病房」的主治医生叶菲梅奇,为人谦和有礼,处世不争,在他偶尔巡视这个被人遗弃的「第六病房」时,被这位激愤莫名有底蕴有意思的病人所吸引,一方面医生同情他的处境,另一方面他更常巡视病房找他聊天,这个异常的举动,立即引起全城的议论与猜疑,很快地人们也传出叶菲梅奇医生发疯了的流言。果不出其然,叶菲梅奇医生最终也被诱骗进入「第六病房」,被当成精神病患禁锢起来,尽管医生愤怒抗议却也遭到老兵毒打,很快地医生因绝望而在病房内死去。如果说,契诃夫的〈第六病房〉是在影射控诉当时俄国沙皇统治下的极权残暴,它不也同时揭示社会体制的冷漠执行者,最终也惨死在最初由自己设计管理的病房中。

  事实上,我和大多数人一样,在阅读《大数据的傲慢与偏见》这本书之前,对于大数据如何主导世界及其如何的丑恶毫无概念。本书作者凯西.欧尼尔是一位知名的数据科学家,她取得哈佛大学数学博士学位,并曾任教于隶属于哥伦比亚大学的巴纳德数学系,随后投身于华尔街的对沖基金公司,在离开金融业之后,更担任多家新创企业的数据科学家,负责建构消费行为的预测模型,由于这样的经历体验,在一次彻底崩毁的金融事件之后,让她彻底地体悟到,虽然数学曾经是她热爱的真理,但是包括次级房贷危机、金融机构破产、失业人口扩增等系列问题背后,竟然都与数学模型脱离不了关系,华丽极美的数学模型就像是共犯,它不只深深地卷入真实世界问题,它还更深化了许多问题困境。

  尤其当严重缺陷的数学模型再结合现代科技,上述混乱与不幸更是以倍数规模成长。作者提醒我们,如果能够立即直面数学可能遭到的误用与滥用,或许我们可能防患未来发生更大的灾难。只是事实刚好恰恰相反,更新的数学技术应用与影响范围更广,尽管多数的模型可能都是出于好意,但是许多模型也将人的偏见和误解纳入系统之中。于是数学模型变成神祇一样,既不透明也不受控管,或说只有少数的数学家和电脑科学家才能决定。因此,她怀抱着对于社会正义的热情,利用自己专擅的数学揭穿大数据美好的假象,她控诉现代生活中无所不在的数学模型如何撕裂我们的社会!数学演算法如何影响我们的生活决策,她在书中揭举了许多案例,包括学校的教学评鑑、职场的履历筛选、金融贷款的审核、员工绩效的评估、目标选民的锁定、身体健康的监测、以及假释名单如何决定等等,再再显示影响范畴不只是个体,还包括国家与社会的总体未来。

  诚如作者所言,理论上数学模型应该是一种公平的机制,因为所有人都是基于相同的规则,数学模型不容易受到偏见的影响。然而事实刚好相反,数学家借由大数据以免分析结果遭到例外或异常扭曲,结果反而因此惩罚了那些刚好属于例外情况的人们。因此,这些数学模型可能还会更深化社会的歧视与不平等,例如,贫穷的学生可能更无法获得就学贷款协助,难以脱贫的教育系统于是成为一种恶性循环,作者将这种奖励优势并惩罚弱势的模型称为「数学毁灭性武器」(Weapons of Math Destruction),它的英文缩写WMDs正好与大规模毁灭性武器的缩写相同,由于这些数学模型会界定自己的事实,并利用这些事实替自己产生的结果辩解。这些数学模型产生的结论,有如神祇一样发出命令,它不听人讲话,也不会屈服,更不理会人们的逢迎、威胁或诱骗。它还会自我强化延续,进而产生更大且普遍的危害。总的来说,尽管本书不乏用黑色幽默的方式叙述,让人读来轻松有趣,不过读后却更让人感到害怕不安。

  最后让我们再次回想,〈第六病房〉里医生叶菲梅奇与病人格罗莫夫之间的对话,格罗莫夫最初对于医生的劝诫给予暴怒回应:「我知道上帝用热血创造了人类,人的机体组织若是有生命,必然对于一切刺激有反应,我用怒吼与泪水回应痛苦,这才叫作生活!」叶菲梅奇医生则是优雅以对:「尽管我们长期被关在铁窗里受尽折磨,不过这样也好,因为这个病房与舒适的书房之间并无差异,这是多么惬意的哲学!」格罗莫夫冷冷回应:「没关系,您藐视了痛苦,不过当您的手指也被房门夹了一下,我想您恐怕也会扯开嗓门大叫!」不幸地是,叶菲梅奇医生最终果然「手指也被房门夹了一下」并且被顺利地诱骗关进「第六病房」,医生很快地陷入绝望恐惧最后死亡。

  生活在现代的社会里,完全不被数学模型监控几乎是不可能,这是一种最安静的恐怖主义。然而,数学模型真的是我们生存世界的绝对真理?当我们盲目地将自己交付给它并且据此生存,是否有可能我们所拥抱的真理,只是让我们的世界变得更加荒谬扭曲,一个错误的数学模型或许还不如没有模型。无论如何,世界的意义不应该是一个被数学模型计画好的秘密,不幸地,如果真是如此,欢迎您来到大数据下的第六病房!

陈智凯(国立台北教育大学文化创意产业经营学系所教授)

图书试读

第3章 军备竞赛:大学入学问题(节录)

故事始于1983年。在这一年,处境艰难的新闻杂志《美国新闻与世界报导》(U.S. News & World Report)决定展开一项雄心勃勃的计画:它将评估美国1,800家学院和大学,替它们排出优劣次序。如果这项计画成功了,由此产生的大学排名将成为有用的工具,有助数以百万计的年轻人做他们人生中的首个重大决定。对许多年轻人来说,上什么大学决定了他们未来的职业路向,也决定了他们将结交哪些终身的朋友(很可能包括他们的配偶)。这家杂志社也希望大学排名那一期可以创造销售奇迹,使《美国新闻》至少有一週可以追上主要对手如《时代》和《新闻週刊》。

……

《美国新闻》的人员要衡量的是「教育卓越程度」,这比玉米的成本或一粒玉米有多少微克的蛋白质模煳得多。他们没有直接的方法可以量化四年的大学教育对一名学生的影响,遑论对数千万名学生的影响。他们无法测量学生四年大学生活的各方面,例如学到多少东西、有多快乐、对个人信心有何影响,以及在友谊上有多大的收获。他们的模型并不反映詹森总统的高等教育理想──「加深个人成就、提升个人生产力和增加个人报酬的一种方式。」

他们因此仰赖一些看似与教育成就有关的替代指标,例如学生的SAT分数、师生比率,以及录取率。他们分析新生升至二年级的百分比,也分析毕业率。他们计算在生的校友捐钱给母校的百分比,假定校友愿意捐钱,代表他们很可能满意自己所接受的教育之品质。大学排名有四分之三由一个演算法根据这些替代指标计算出来;这个演算法代表一种判断,以电脑程式的形式存在。排名的另外四分之一,是以全美各大学管理层的主观看法为根据。

《美国新闻》第一份仰赖数据的大学排名1988年公佈,结果看来合情合理。但是,随着这种排名变成一种国家标准,它产生了恶劣的回馈环路。问题在于排名会自我强化。一家大学在《美国新闻》的排名上表现不济,声誉会受损,各种情况会恶化。顶尖学生和顶尖教授都会避开它,校友会很不满意,减少捐款。结果排名将进一步下跌。简而言之,这种排名决定了大学的命运。

用户评价

评分

这本书的书名实在太吸引人了!《大数据的傲慢与偏见:一个「圈内数学家」对演算法霸权的警告与揭发》,一看到就觉得,哇,终于有人要把这些在我们生活中无所不在,但又看不见摸不着的数据和演算法背后的东西给讲清楚了。我一直觉得,现在科技发展这么快,很多东西我们都在用,像是脸书、IG、YouTube,还有那些购物网站的推荐,甚至是新闻推送,好像都是为了我们好,让我们更方便,更了解自己喜欢什么。但是,总有一丝隐隐的不安,觉得是不是有什么东西在悄悄地操纵我们的喜好,甚至影响我们的判断?书名里的「傲慢与偏见」,让我立刻联想到经典小说,难道大数据和演算法也有它们自己的“傲慢”和“偏见”吗?而且是“圈内数学家”的视角,这听起来就非常有说服力,不是那种道听途说的杂音,而是来自真正懂行的人的警告。我期待作者能用浅显易懂的方式,把那些高深的数学原理和演算法的运作机制,用一种我们能理解的故事或案例来呈现,让我们这些非科班出身的读者,也能窥探到科技背后的逻辑,不再只是被动的使用者,而是能带着批判性思维去审视这一切。

评分

读到《大数据的傲慢与偏见:一个「圈内数学家」对演算法霸权的警告与揭发》这个书名,我立刻就有了强烈的共鸣。作为台湾的网民,我们每天都在接触各种大数据和演算法的应用,从精准广告到新闻推荐,它们像空气一样渗透进我们的生活。然而,这种“无处不在”的便利,有时候也让我感到一丝不安,总觉得我们好像被框在一个越来越小的信息世界里,而这个框,正是由那些“演算法”在操控。书名中的“傲慢与偏见”,让我脑海里立刻浮现出,当演算法过于自信地认为自己最了解我们,或者在处理数据时有意无意地带入某些“偏见”时,会发生什么?“圈内数学家”的身份,又让我相信,作者不是在空谈,而是有能力深入到演算法的核心,看透那些我们普通人无法触及的底层逻辑。我期待这本书能像一个“警钟”,敲醒我们对这些科技的盲目信任,让我们更深刻地理解,当演算法变得“霸权”时,它可能对个人选择、社会公平乃至于民主制度带来的潜在威胁。我希望作者能用清晰的语言,把复杂的概念讲透,让我们这些“圈外人”也能理解,并且学会如何在这样的时代背景下,保持警惕和自主。

评分

天啊,光是书名《大数据的傲慢与偏见:一个「圈内数学家」对演算法霸权的警告与揭发》,就让我脑海里涌现出无数个疑问和画面!我平时在台湾的生活,真的处处都是大数据的痕迹。每次上网搜个东西,过几天所有平台都在推相似的产品;跟朋友传了几句关于某件衣服的对话,手机广告立刻就弹出来了。这种“被看穿”的感觉,有时候觉得神奇,有时候又觉得毛骨悚然。尤其是“演算法霸权”这四个字,太有力了!它直接戳中了我的痛点,好像我们越来越依赖这些看不见的“大脑”来替我们做决定,无论是看什么新闻,听什么音乐,甚至是选择和谁交朋友。我一直很想知道,这些演算法到底是怎么运作的?它们真的比我们更了解我们自己吗?还是它们只是根据我们的过去数据,进行一种“最有可能”的推测,然后把我们牢牢地困在自己的信息茧房里?作者是“圈内数学家”,这让我想象他一定有非常独特的视角,能够看到我们普通人看不到的细枝末节。我特别期待他能揭露一些我们平时根本想不到的,演算法如何“霸权”地影响我们的生活,或许能让我们更警惕,更懂得如何守护自己的独立思考能力。

评分

《大数据的傲慢与偏见:一个「圈内数学家」对演算法霸权的警告与揭发》这个书名,简直是我近期最期待的书名之一!身为一个在台湾生活、每天都要跟手机、电脑打交道的普通人,我早就感觉到我们生活被大数据和演算法深刻地影响着。每次打开购物网站,推荐给我的东西总能精准到我的喜好,甚至有时候比我自己还了解我想要什么。但这种“被了解”的感觉,有时也会让我觉得有点毛骨悚然,总觉得自己的隐私是不是完全暴露了,而且,这些演算法到底是什么样的“思维”在指导我们的选择?书名里的“傲慢与偏见”,就点出了我对大数据和演算法一直以来的一些隐忧:它们是不是自以为是地认为自己能够准确预测一切?它们是不是在不知不觉中,将一些设计者的价值观或固有的社会偏见,通过数据和演算法传递给我们,从而加剧了社会的二元对立?“圈内数学家”的身份,更是让我对这本书的专业度和揭露性充满信心,我相信作者能够深入剖析这些演算法的运作机制,揭示它们如何形成一种“霸权”,限制我们的视野,甚至操纵我们的决策。我非常期待这本书能为我们提供一个更清醒的视角,让我们不再被动地接受科技的安排,而是能主动地思考,理解并应对大数据时代带来的挑战。

评分

这部作品的书名《大数据的傲慢与偏见:一个「圈内数学家」对演算法霸权的警告与揭发》,就如同在网络时代投下的一颗震撼弹,让我想起了台湾社会近年来对于科技发展的一些隐忧。我们总是被教育要拥抱科技,享受便利,但同时,我们内心深处也知道,越是强大的技术,越是可能隐藏着巨大的风险。特别是“圈内数学家”这个身份,让我对作者的专业性和洞察力充满信心。这不像是一般的科普读物,而是源于对核心技术的深入理解,所发出的“警告与揭发”,这背后一定有扎实的论据和令人信服的分析。我时常在想,我们每天浏览的社群媒体、购物网站,甚至我们看到的广告,背后是不是都有一套精心设计的演算法,在不动声色地影响着我们的消费习惯、政治倾向,甚至是我们对世界的认知?“傲慢与偏见”的提法,更是意味深长,它暗示了这些演算法并非全然客观公正,而是可能带有设计者的意图,或者在数据处理过程中就已经嵌入了某种“偏见”。我非常好奇,作者将如何拆解这些看似无害的演算法,揭示它们可能带来的“霸权”效应,让我们这些身处其中的普通人,能够看清楚隐藏在便利背后的真相,从而更好地保护自己的隐私和独立思考的空间。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有