大数据为什么不够聪明?
比机率更强大的思考工具又是什么?
电脑科学界诺贝尔奖「图灵奖」得主暨贝氏网路研发先驱Judea Pearl总结毕生研究成果,联手获奖的统计学家Dana Mackenzie,提出改变人工智慧及科学界的重要工具!《快思慢想》作者暨诺贝尔奖得主康纳曼、《大演算》作者多明哥斯、谷歌网路推广长文特‧瑟夫、微软研究实验室主任艾瑞克‧霍尔维兹等人重磅推荐!
▎大数据看似厉害,其实有很大的侷限
近几年大数据当红,加上它在许多领域的成功运用,其地位与能力备受追捧。与大数据密切相关的统计学,是法兰西斯・高尔顿与卡尔・皮尔森解答对于遗传的疑问未果,而开发出来的学科,这门学科创立后兴盛数十载,其名言「相关不是因果」影响科学界经常止步于探究「关联」而非「因果」,并且长期受资料本位的历史所影响,认为资料无所不能,但是朱迪亚・珀尔希望借此书告诉读者,资料本身一点也不智慧。
▎要发展出「强AI」,机率思考仍远远不够
一九八○年代初,朱迪亚・珀尔认为不确定性是AI所欠缺的最重要的能力,于是运用机率开发出强大的推理工具——贝氏网路,因而获得有电脑科学界诺贝尔奖之称的「图灵奖」。贝氏网路是首先让电脑以灰阶方式思考的工具,至今仍极受人工智慧界倚重,然而到了一九八○年代末,珀尔认为贝氏网路仍没有填补人工智慧和人类智慧的差距,于是他转而研究如何教AI学会「因果推论」,本书便是整理了历代科学家推展因果革命的努力与成果。
▎从「求得相关性」的旧阶段,迈入「釐清因果关系」的新时代
本书最初几章是有趣的科学史,探讨科学家追求因果解释的过程如何受挫,以致发展出统计学,并让统计学方法长期引领学界研究。接着书中有大约一半篇幅,作者以实例示范因果语言(图示模型)如何解决传统统计学认为无解的难题,逐一揭示「因果阶梯」三大分层的能力(越高的层级,认知挑战越高,越难理出因果关系),并让读者了解因果革命路上诸人的努力与进展,以及这些进展的重要性。本书末尾回头说明因果革命相对于人工智慧各重要发展面向(比如大数据、深度学习、资料探勘、机器学习等),有何胜出之处、能对它们起什么正面影响,以及最重要的——「因果革命」将会如何改变人工智慧。
▎「因果革命」不只影响人工智慧,还影响各研究领域
现今机器学习运作时仰赖的是「相关性」,而不是「因果」,如果能成功将因果思考导入电脑,将使电脑变成真正的科学家,使它们成为我们的得力伙伴,提供我们更合理的洞见。由于因果思考可以呈现罪责,电脑能因而具备道德感——「具备道德感的强AI」是因果革命在人工智慧领域的终极追求,作者形容这「是人工智慧给人类的第一个、也是最好的礼物」。
因果性研究还釐清了我们多年来对许多知识本质的不解,改变我们对于众多问题的认识,这些问题牵涉的层面无所不包,举凡涉及解读资料以及根据解释而採取的作法(像是致病因素、医疗资源分配、公共政策拟定等),都能受益。集结众多领域学人之力才有如今成果的因果革命,亦将回头影响整个科学界,珀尔形容它「将使科学的体质更加健全,是人工智慧给人类的第二个礼物」。在美国,因果科学已经开始被大学列入课程……
▎我们强烈建议这些人士阅读这本书:
(1)资料科学家与大数据研究者,以及对大数据深感兴趣的人
(2)统计学家、数学家,电脑科学相关从业人员与学习者
(3)对经济趋势与科研发展有兴趣的一般大众
(4)希望培养科学素养,了解最新科学方法的学子
▎各章内容简介请参阅〈目录〉的引文。
各界盛赞 ◎谷歌网路推广长文特‧瑟夫:
珀尔近三十年来的学术成就,为人工智慧发展提供坚实的理论基础……同时把「思考机器」提升到另一个境界。
◎《大演算》作者佩德罗‧多明哥斯:
因果如果不是相关,那又是什么?拜朱迪亚‧珀尔的划时代研究之赐,现在我们已能精确回答这个问题。想理解世界如何运行,这本引人入胜且读来愉快的书是理想的起点。
◎微软研究实验室科技研究员及主任艾瑞克‧霍尔维兹:
朱迪亚‧珀尔是人工智慧领域、甚至整个电脑科学界革命的核心人物。
◎诺贝尔经济学奖得主及《快思慢想》作者丹尼尔‧康纳曼 :
各位是否曾疑惑「相关」和「因果」究竟是什么关系?这本精彩着作深入浅出地说明了答案。
◎《纽约时报》乔纳山‧尼伊:解说十分详尽……本书不仅详尽介绍概念的发展史,也提供概念工具,让读者理解大数据的优势与不足之处。
◎《自然》杂志:「相关不是因果」这句科学俗语已在社会上造成影响……朱迪亚‧珀尔提出崭新的数学解决方案……现在已在生物、医学、社会科学和人工智慧领域开花结果。
◎《犹太日报》:深入浅出……珀尔是有远见的因果革命领袖,这本书则是他最大的成就。
读者好评 ◎对电脑科学、统计学或人工智慧当今发展有兴趣的人都应该读读。这本书如同康纳曼的《快思慢想》,是作者毕生科学研究的总结,不仅对同领域科学家而言价值非凡,也是全人类的瑰宝。(读者阿兰‧约瑟夫‧坎恩)
◎朱迪亚‧珀尔的贝氏网路和因果图以十分优雅的方式结合统计学、流行病学、决策和电脑科学等领域。他的研究成果赋予并扩大了大数据的潜力。这本书是市面上第一本为一般大众介绍这主题的书籍,其影响将无以估计。(读者汤玛斯 J. 阿拉冈,流行病学家)
◎知名商学研究所都应该用这本书当成教材。我送了一本给我念大学时的院长。为了现在和未来的学生着想,我希望它能成为一门课。(读者乔治‧莫札奇斯)