精准预测:如何从巨量杂讯中,看出重要的讯息?

精准预测:如何从巨量杂讯中,看出重要的讯息? pdf epub mobi txt 电子书 下载 2025

原文作者: Nate Silver
图书标签:
  • 预测
  • 数据分析
  • 决策制定
  • 信息过滤
  • 模式识别
  • 信号处理
  • 噪音消除
  • 商业智能
  • 机器学习
  • 统计学
想要找书就要到 小特书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

2008年美国总统大选,他成功预测欧巴马胜选。
50州个别选举结果,49州预测正确。
35席参议员的胜选者,则全部猜对。
2012年,他再次成功预测欧巴马胜选,
这次,50州全部命中。

  他开发的棒球预测系统精准无比,
  被知名棒球评论媒体收购。
  他个人更曾运用统计预测的专才,
  在德州扑克赌局赚进上千万元。

  他是奈特.席佛,
  当代最受瞩目的统计与预测鬼才,
  首次公开精准预测的黄金法则,
  告诉你为什么有些预测会成功、有些会失败?

  ★出版三个月稳居亚马逊书店销售总榜前20 名、商业理财类第1名、政治社会科学类第1名
  ★《纽约时报》畅销书排行榜前10名
  ★荣登亚马逊书店2012年度「非文学类」第1名
  ★获选为亚马逊书店编辑严选2012年度商「商业类」最佳书籍
  ★获选《华尔街日报》2012「十大最佳非文学类好书」
  ★《纽约时报》书评盛赞:「10年来最重要的一本书」
  ★2009年《时代杂志》将奈特.席佛列入「世界最有影响力的百大名人」
  ★2012年《滚石杂志》将奈特.席佛誉为「改变游戏规则的人」

  数据不会说话,是你在为它说话。

  .美国政府长期蒐集许多情报,但为何还是无法预见911恐怖攻击?
  .2007年房市泡沫爆发前,华尔街的金融专家们为何看不见崩盘的警讯?

  身处「巨量资料」(big data)时代,照理说我们拥有空前充足的资料,去做各项预测。但各行各业掌握最多资料的专家与决策者,却都还是不断做出失败的判断,这是怎么回事?作者奈特.席佛指出,人的解读比数字更关键,而预测最难的部分在于:人要懂得分辨出哪些是无意义的杂讯,哪些才是关键的讯号。误把杂讯当讯号,做出来的预测,自然不会准确,甚至会造成严重的谬误与损失!

  数据导向的预测会成功也会失误,要求更多数据之际,人更应该自我要求。

  最常出错的就是过度自信、被称为「刺猬」型的预测者,他们很会归纳、喜欢大原则、很有胆识,虽不断收到新讯息却很少修改预测,他们做预测常成为一种「表演」,模煳了追求精准预测的动机。(代表人物:成为名嘴的专家、认定自己能翻盘的赌徒。)

  另外一个大家常犯的错,是忽略「样本外」的重大新资讯。假设你从未酒后驾车,肇事纪录也很低。今晚你喝了酒,请预测今天驾车肇事的机率?如果你拿过去的记录分析预测,那么你出事的机率肯定相当低;但是喝酒开车并不在你过去记录的样本内。这个预测问题出在模型错了、忽略样本外的重大讯息──而这也就是席佛认为,大家对房市泡沫以及雷曼兄弟垮台,无法精准预测的主因。

  在本书中,席佛针对政治选情、球赛结果与球员价值的评估、金融风暴、气象、地震、扑克赌局、西洋棋赛、股市投资等跨领域的预测难题,做了精辟的个案分析。虽然领域迥异,但预测要精准,背后的原则与逻辑却都是一样的。在一个个精彩的故事中,即使没有统计背景的读者,也能一点一滴拼凑、建立预测的基本功,并且可以练习把这些原则与技巧,运用在自己的专业领域上。(甚至可以用来预测伴侣外遇的机率:详见第8章)

  ◎席佛在书中不断提醒预测者:

  .预设立场或过度自信,对预测来说,是非常可怕的事。
  .预测不是在追求是与非,而是估算事情发展的「机率」。有精准的机率,才能做出有利的决策。
  .做预测时,最怕一看见「有相关」就解释成「因果关系」。(冰淇淋 vs. 森林大火)
  .预测时不能忽略「误差」,并要勇于承认有「不确定性」。 不然你会过度解释,变成不精准的预测。
  .根据预测出来的机率,做了最有利的选择,即使最后结果不好,仍然是好预测。
  .在很多情境中,不是一定要追求终极完美的预测,只要预测比竞争对手好,你就赢了。
  .当大家不免被杂讯迷惑时,问问自己,你有什么法宝,能让自己更接近真相?跟着法宝走,不要跟着群众走。
  .有新的重大资讯进来时,能保持客观,随时更新的预测,才有可能是精准的预测。

  ◎书中也有许多发人深省的预测思考训练:

  【情境1】在股市里,为什么赢的人反而输了?
  现在举办一场拍卖会,拍卖一个装有零钱的罐子,大家去猜测里面有多少钱,并决定你愿意用多少钱去标这一罐钱。出价最高的,可以把罐子带走。

  这是经济学里一个常见的实验,实验的结果,往往都是这位赢家所出的钱,大过罐子里的钱。没赢就算了,赢了反而赔钱,这就是所谓的「赢家的诅咒」。这件事的问题出在,赢的那个人,做出了很糟糕的预测。很多时候,是预测者过度自信了。

  这个实验,跟股市的特性是一样的。往往当许多投资人都「感觉现在是投资的好时机」时,同时期股价都会飙高。虽然这明明跟股票应该买低卖高的逻辑背道而驰,但是人总是会在这些时候特别乐观,大胆抢进。所以这些投资人,如果在股市里失利了,都是因为他们误将乐观气氛这个杂讯,当成可以抢进的讯息,做出了错误的预测的关系。

  【情境2】为何九一一攻击时,第二栋大楼被撞不用太惊讶?
  根据贝氏定理,做预测时,事前某件事的发生机率有多高,会很大程度影响后来的发生机率。

  九一一恐怖攻击那天早上,大多数美国人都会认为恐怖分子用飞机撞进曼哈顿高楼的机率趋近于零。那是第一架飞机还没撞进大楼前的数据。等到第一架飞机事故发生之后,第二栋楼被攻击的可能性就无庸置疑了。

  根据贝氏定理的公式计算,第一架飞机事故前,美国高楼被恐怖攻击的可能性根据历史纪录可是两万分之一,或者说0.005%。第一架飞机事故发生后,美国被恐怖攻击的机率当下被改写,提高到了38%。这时,当我们再预估第二架飞机撞上高楼发生的机率时,运用贝氏定理的公式计算之后,整体机率陡增到99.99%。(贝氏定理用一行简单的公式就能算出这个机率,详见第8章)

  然而,一般人「凭感觉」的预测却是:在艳阳高照的纽约,发生一次意愿已经够不可能了,第二次几乎是真的完全不可能!但使用贝氏定理,却能轻松预测第二起事故的发生。这就是为什么我们在做预测时,不能凭「感觉」,而要信赖客观工具的原因。

  【情境3】气象预报不准确,能不能怪罪预报员?
  依照基本原则来看,所有的预测,显示的结果应该都是机率,而且一定会有不确定性。气象的预测,也不例外。

  美国国家气象局经过长年来的努力,所取得的气象资料以及他们的预测,准确率已经大有进展。然而,为何大家仍觉得气象预报不准?

  这是因为商业气象频道,为了顾客服务的经济动机,有时会在资料的呈现上做些操弄。比如,当他们说降雨机率20%时,有时其实只有5%。因为民众对于这种帮助提高警觉的「假警报」不介意。相对的,若他们预期不会下雨时却下雨了,大家就会咒骂气象频道毁了他们的野餐。而且,气象预报时,更无法呈现出「不确定性」,诚实展现出预测中的不确定或者误差,也会有损预报的权威感。

  在这样的情况下,并不是预测技术无法精准,而是气象频道实在没有砥砺自己追求预报精准的动机。然而,这是个恶性循环。结果就是当真的发生卡崔娜这样的飓风时,很多已经把气象预报当成「狼来了」的民众,就可能会丧失性命。

  作者认为,一个预测的人,职责就是应该要尽力做出精准的预测与预报。这一点,气象的预报人员,没有做到。虽然本来也许有时是出于好意。

作者简介

奈特.席佛 (Nate Silver)

  他精通统计学,是美国当代知名的统计与预测鬼才。他从小就对数字与思考展现兴趣与天分,六岁便开始预测棒球赛事。高中时代曾拿过密西根州辩论冠军,后来进入芝加哥大学主修经济学,并在大三前往伦敦政经学院研修一年。大学毕业后,进入安侯建业事务所(KPMG)担任顾问。利用工作之余,研发出一套创新的棒球赛事预测系统PECOTA,因为精准至极,甚至吸引棒球界圣经 Baseball Prospectus 于2003年向他收购。席佛也将他统计与预测的天赋应用于德州扑克,曾经短期内就让他赢得上千万元财富。

  他在2008年美国总统大选之前成立了「五三八」网站,发表他的选情预测,获得广泛注意,随后他在这个网站公布预测,成功预测欧巴马胜选,而且是在50州的个别选举结果中,49州预测正确,35名参议员选举更完全命中。2012年的总统大选,他再度成功预测欧巴马胜选,这次50州全部命中。2009年《时代杂志》并将他列入「世界最有影响力的百大名人」。许多人对于他的统计模型与精准预测的技术都十分折服与好奇,本书是他首度公开自己的预测祕诀,以及他对各领域预测的研究与思考。

译者简介

苏子尧

  台湾师大翻译研究所硕士,台湾师大教育心理与辅导系学士,曾任国中教师、组长、主任。译有《焦点解决教育--一个更快乐的学校》、《爱我,就不要控制我》与《南瓜计画》等书。

好的,这是一本关于信息筛选与洞察力的图书简介,不涉及您提到的特定书名内容,力求详实并呈现出专业书籍的质感。 --- 书名待定:《信息洪流中的罗盘:驾驭数据噪音,提炼商业智慧》 副标题:一套系统化的认知框架,助你在信息爆炸时代做出清晰决策 导言:迷失在信息的“大航海时代” 我们正生活在一个前所未有的信息富足时代。从社交媒体的即时推送、海量的市场报告到无休止的行业新闻流,信息以前所未有的速度和广度涌入我们的视野。然而,这种“富足”常常等同于“瘫痪”。决策者和专业人士发现,他们花费了大量时间在处理噪音、过滤冗余信息上,而不是真正用于分析和洞察。我们被信息的“广度”所困,却失去了对“深度”的把握。 本书并非一本简单的“如何更有效阅读”指南,它是一部关于信息认知结构重塑的实战手册。它深入探讨了人类大脑处理信息时的内在偏差,剖析了现代信息生态系统的运作机制,并提供了一套严谨、可操作的分析框架,旨在帮助读者从海量、碎片化、甚至相互矛盾的信号中,精准锚定那些驱动未来走向的核心驱动力(Key Drivers)。 第一部分:噪音的解剖学——理解信息污染的本质 在开始过滤之前,我们必须理解我们正在面对的“敌人”是什么。本部分将信息噪音划分为多个层次,超越了简单的“垃圾邮件”概念,深入到认知和系统层面。 第一章:信息流的物理学与心理学 信息熵与认知负荷: 探讨信息量与我们大脑处理能力的冲突点。当我们面对的信息量超过了我们的短期工作记忆容量时,决策质量将不可避免地下降。 选择性感知与确认偏差的陷阱: 为什么我们总是更容易“看到”那些我们期望看到的信息?分析大脑如何利用过往经验构建信息过滤网,以及这种机制在快速变化的环境中如何成为致命的障碍。 “即时性”的误导: 讨论信息实时性与重要性之间的关系。大多数“突发新闻”的价值往往在24小时内迅速衰减,但它们如何劫持了我们的注意力资源。 第二章:结构性噪音的来源 指标的陷阱: 分析商业世界中常见的“虚荣指标”(Vanity Metrics)如何被设计出来,以及它们如何掩盖了组织或市场的真实健康状况。 叙事的力量与数据的情绪化: 研究媒体、公关和利益团体如何通过构建引人入胜的故事线,利用数据片段来支持预设的结论,从而操纵公众和投资者的认知。 信号衰减与失真: 追踪信息从原始事件发生地到最终决策者手中的层层传递过程,识别哪些环节导致了信息的稀释、扭曲或遗漏。 第二部分:构建洞察的过滤系统——从原始数据到可执行情报 本部分聚焦于构建一个主动的、基于需求的“信息捕获与提炼系统”。目标是将读者从被动接收者转变为主动的“信息猎人”。 第三章:确定“重要性”的基准线 目标驱动的信息需求定义: 强调在阅读任何信息前,必须清晰界定“我需要解决什么问题?”或“我需要验证哪个假设?”。没有清晰的目标,所有的信息都是噪音。 关键绩效要素(KPEs)的提炼: 不同于KPI,KPEs关注的是驱动未来绩效的关键变量。本章提供方法论,帮助读者识别行业内真正具有前瞻性的、少数几个驱动长期增长的因子。 逆向工程:寻找“缺失的环节”: 介绍如何通过观察一个既定结果,反向推导出支撑该结果所必需的、但目前尚未被广泛关注的关键信息点。 第四章:多源信息交叉验证的技术 “三角测量”方法论在信息筛选中的应用: 不依赖单一信息源的结论。学习如何通过对比不同类型、不同偏向的信源(例如,技术报告、财务报表、竞争者行动)来校准信息的可靠性。 时间序列分析的价值: 如何通过跟踪一个关键指标的长期演变趋势,来判断某个短期“热点”是真正的范式转变(Paradigm Shift)还是周期性波动。 弱信号的捕捉与培育: 识别那些尚未被主流市场重视,但具有指数级增长潜力的“微弱迹象”。这包括对边缘技术、小众用户群体行为或非传统竞争者的持续性关注策略。 第三部分:将洞察转化为决策力的实战模型 信息处理的终极目标是行动。本部分将提炼出的“重要信息”转化为清晰、可执行的商业或个人战略。 第五章:信息密度与决策时机的艺术 “临界点”判断模型: 识别何时信息量已足够支撑一个重大决策(信息收敛),以及何时必须在信息不完整的情况下果断行动(风险对冲)。 情景规划与信息压力测试: 利用已经识别出的关键信息,构建“最佳情况”、“最差情况”和“最可能情况”的三种情景,并评估当前决策在不同情景下的稳健性。 信息的“包装”与沟通: 如何将复杂的、经过筛选的洞察,转化为简洁、有说服力的叙述,以影响团队、领导层或合作伙伴。 第六章:持续优化你的信息生态系统 工具箱的精选与优化: 评估当前使用的信息获取工具(RSS、数据库、订阅服务),并根据“目标驱动”原则进行“去订阅化”和“重配置”。 建立个人反馈循环: 强调每一次决策后的复盘,不仅要分析结果,更要分析“我们当初获取和解读信息的过程是否有效?” 持续迭代过滤标准。 抵御认知疲劳的策略: 探讨如何设计信息摄入的节奏和深度,确保在长时间高强度信息处理后,依然能保持批判性思维的敏锐度。 结语:从被动接收到主动塑造 《信息洪流中的罗盘》致力于装备读者成为现代商业环境中的“信息架构师”。它提供的不是新的信息,而是新的处理能力——一种能够穿透表象、识别核心脉络、并将看似杂乱的片段重构为清晰战略的强大心智工具。掌握了这些方法,读者将不再是信息噪音的受害者,而是驾驭信息时代的领航员。 --- 目标读者: 高级管理者、战略规划师、市场研究人员、金融分析师、以及任何需要在复杂环境中进行高风险决策的专业人士。

著者信息

图书目录

前言
1. 惨烈的预测失误
2. 你比电视名嘴还聪明吗?
3. 我在乎的只有输赢
4. 多年来你一直告诉我们雨是绿的
5. 拚命找讯号
6. 要怎么淹死在一公尺深的水里
7. 模型的角色
8. 错误越来、越来越少
9. 对机器大发脾气
10. 扑克泡沫
11. 要是你赢不了他们
12. 有着健康怀疑态度的气氛
13. 你不知道的东西可能会伤害你结论

图书序言

推荐序1

巨量资料不是万灵丹,预测的模型更关键

  数千年前,古埃及人发现,尼罗河洪水抵达开罗的前一天,天狼星会与太阳同时从地平线升起;然而在地球的另一边,「神农氏作蜡祭,以赭鞭鞭草木,尝百草,始有医药。」看似无关的两个人类古文明的演进,其实是一体两面,都是在透过各种方式蒐集资料、分析资料,并且找出规律以作为日后决策使用。可以说人类的文明就是透过「分析与预测」一点一滴累积的。

  随着人类的世界越来越复杂,分析预测必须透过更有效率的方式执行,也因此资料採矿与巨量资料变成现代显学。本书有趣的地方在于,它并非一味地神话预测技术的无所不能,反倒是透过一连串的实例(金融海啸、美国总统大选、恐怖攻击……),来证明现代人类对于这世界预测模型的假设是多么脆弱与简化。但这并不是对预测技术的反动,反而是从过去案例中反省,告诫我们资料科学的发展除了要能协助人们从巨量资料中找出规则外,更重要的是要能够让人类辨别规则与杂讯间的差异,以及能够评估模型失准时的风险。

  若是说人类在预测的技术尚不够纯熟,这是不公平的,更多时候,是人类不愿相信预测出来的结果,或者明知道预测的事件即将发生,但是却恣意反其道而行(或是往对自己有利的方向进行)。然而「预测」已不仅是少数分析者个人的工作,而是一种集体的行为,决定了人类世界如何被推动、如何分配资源。至此,「预测力」俨然成为一种全新的资讯不对称的知识暴力。

  您也许不是一位资料科学家,看完本书也未必能让您从这种「预测」的知识暴力种解放出来,但希望您能如作者所期许的:「平静接受我们不能预测的事,勇敢预测我们能预测的事,睿智看出差异何在」。

尹相志
(本文作者为亚洲资採、亚洲决策资讯 技术长)

推荐序2

人类始终在追求对未来的精准预测

  丹麦物理学家尼尔斯.波耳(Niels Bohr)曾说:「预测很难,尤其对于未来」。在我教授统计学的过程当中,常常跟同学讨论到学习统计学的目的为何?统计学的精髓在于如何「以管窥天」,利用样本的资料来做分析,萃取出有用的资讯,做出「精准的预测」,而《精准预测》这本书正是告诉我们如何利用简单的数学运算达成目的。实际上,预测对我们的生活而言不可或缺。例如:乐透号码的选择、决定投资股票的标的,或职业生涯规画等,都是我们对未来的一种预测。由此可见,人类真正目的其实在于得到「精准预测」的结果。

  拜科技发达之赐,我们现在。庞大的数据固然提供我们强大的资料作为预测依据,然而数据不会说话,是资料分析师、统计学家,以及各种统计软体在为它说话,也就是大家常提到的资料採矿(Data Mining, DM)。学者佛罗利(William Frawley)等人认为,资料採矿是从资料库中挖掘出不明确、前所未知以及潜在有用的资讯过程。并从资料中提取出隐含过去未知且有价值的潜在讯息。因此透过资料採矿技术,从巨量资料库中挖掘出「黄金」(即有用的资讯与知识)做出预测,支援企业决策分析,提升企业的竞争优势。但以数据为导向的预测会成功也会失误。本书作者认为预测最难的部分在于:从巨量资料中分辨杂讯和真正的信号。在书中作者提到,人们通常只选择听见对自己有利的数据,错把杂讯当成信号,因而做出错误的判断,这就是为什么有些预测会失败,而有些预测却能与结果非常相近的主要原因。如果我们能学会分辨杂讯,准确判断出数据中的讯号,我们仍有机会能成功预测,如同作者在二○○八年美国总统大选,成功预测五十州当中四十九州的总统胜选者,及三十五席参议员的胜选者。

  在了解问题与造成错误的原因之后,知道如何解决该问题的方法,才是「精准预测」之关键所在。若只是分析问题成因却未提出解决之道,也将使其沦为空谈。本书最大的特色在于,作者将内容分成两部分:前面七章在判断预测的问题,后面六章在探讨与运用贝氏定理的解决之道。读者可以据此训练自己分辨杂讯和真正讯号的能力,从巨量杂讯中看出重要的讯号,不论读者涉略何种领域(自然科学、社会科学、学术研究、企业或是行政部门等),相信透过这本书都能使预测的能力更为「精准」,从巨量资料中取出「黄金」。

吴迪     
(本文作者为统计学补教名师)

推荐序3

揭开「预测」的神祕面纱

  在纽约大学史腾商学院攻读MBA(企管硕士学位)时,我的统计学教授送了一句我永生难忘的话,他说:「无论统计的结果如何,如果你没办法找到它背后的道理,那就代表这次的分析出了问题。」

  换句话说,统计是一种用来印证道理──也就是事物间因果关系──的工具。当事物之间有某种因果时,统计可以协助你发现并且验证这样的关系,进一步预测这个因果再次发生的机率。相反的,如果事物之间缺乏真实的因果,则无论统计之后得到任何结论,也只是数学上的巧合罢了。

  读奈特.席佛的这本《精准预测》,让我不断想起了教授的话。

  虽然一般公认,席佛是数据分析与统计模型的专家,但在这本书里他一路从统计原理讲到金融海啸、棒球、气象、地震、失业率、传染性疾病、运动赌盘、西洋棋、德州扑克、市场原理乃至于全球暖化,每一个领域除了关键的资料与图表,他几乎都能够明白阐述「为什么」这些资料有因果意义,甚至常常进一步去分析造成这些因果背后的人性。

  用奈特自己的方式形容,他在这本跨越多个时空,厚重且实在的分析报告大汇整里,充分展现了他的「狼性」,也就是跨学科、大胆找寻新方法、自我批判,并且以实征为主的思考与工作方式 (请参照第二章)。

  至于为什么我们该花时间学习奈特的工作方式,其中一个很重要的因素是网路与各式连网装置──包括你手中的智慧手机与平板电脑──的普及,正带来前所未有的数据供给成长──仅仅在过去两年内,我们所产生的资料量就佔据了人类史上所有资料量的 90%。

  因此,就像奈特说的一样,当你需要预测某个事件未来再次发生的机率,尤其当这件事会攸关国家安全、民众健康、经济发展,或是企业存亡等关键状况时,从茫茫资料海中抽丝剥茧,找到那些关键指标的能力,将显得越来越重要。

  在这样的一个时代,奈特.席佛这本《精准预测》更显得重要,这里面充满着现代知识工作者必须了解的种种数据分析观念与实务技巧,非常值得每个人用心体会、学习,并且实践。

林之晨
(本文作者为appWorks 之初创投合伙人)

推荐序4

从奈特.席佛看新公民媒体崛起

  奈特.席佛是一个统计学家、数学家,也是一位知名部落客,毕业于芝加哥大学经济系。毕业后在会计师事务所安侯建业(KPMG)服务,之后创办了 PECOTA系统,用统计数字追踪大联盟棒球员表现。随后他的兴趣转向政治,二○○七年他创办了FiveThirthyEight.com, 准确地预测了二○○八年的美国大选,二○○九年他更被《时代》杂志选为最有影响力百大人物之一。二○一二年奈特再度准确地预测了总统大选结果。他善长分析海量数据,并且准确预估出选举的结果。他经营的FiveThirtyEight.com网站在选举的时候拥有全美数一数二的流量,硬是超越大型新闻入口网站CNN、福斯新闻和民调机构盖洛普(Gallup)与AC尼尔森(ACNielsen)。他根据自己准备的民调数字,无误地预测了欧巴马的胜率。这位奉数字为上,不与说客、竞选助理、民嘴、公关公司打交道的数学天才,到底凭借什么能力让所有大型民调机构跌破眼镜,臣服于下?

  奈特的胜利背后涵义实为广大。

  第一,它代表了新公民媒体的崛起。过去的政治媒体圈被说客、名嘴、大型民调公司控制,这三个角色形成了利害共同体,用种种不透明的方式控制结果。然而,社群媒体 (social media) 的兴起让每一个人都变成了媒体,都有发声管道。当这些个人媒体 (individual media) 能够准确预测结果时,旧有的势力即将面临挑战,也在快速崩坏的过程中。这样的新公民媒体 (new citizen media) 崛起也将不断冲撞传统的新闻传播。   

  这也代表着,第二,开放数据有助于促进政策透明化。奈特的成功有绝大的因素在于开放数据的运用。过去这些数据取得困难,让选举操作上有机可乘,在社群媒体的年代,开放数据 (open data) 是一项施政透明度 (policy transparency) 的指标。欧巴马也大力提倡开放政府 (open government) 运动,而开放数据的取得也让更多个人民调分析师更能合理的汇整、分析、解读数据。未来,希望这些开放数据分析能让议题的讨论更趋向公评、公正,政策的透明化也将受到更多的监督。

  台湾长久以来受到媒体民嘴影响,许多议题、政策的讨论过于激情、非理性。一般民众取得资讯也过于片断、不完整,整个资讯流缺乏一个完整的过泸过程,结果也都不能纵观全局,常常在讨论一个议题,追一个新闻时,不断争辩,失去焦点。旧媒体为了收视率,制作出的新闻也仅是最低标准 (lowest common denominator)。然而在这个社群媒体崛起、新公民媒体出现的年代,奈特的《精准预测》更提供了我们在观察事件的另一种新思维模式。而这样个人新闻品牌 (individual journalism brand) 正是建立在信任、互动之上,而这也象征了新闻将走到下一个阶段。

许毓仁
(本文作者为TEDxTaipei策展人&共同创办人、TED 亚洲大使)

推荐序5

将海量资料转化为商业竞争的力量

  全球建立及复制的资料量连年翻倍成长,二○一二年已突破二.八ZB(Zetta Byte,十 的二十一次方,约为二百亿张蓝光光碟的存量),预计二○二○年将达到四十ZB。倍速成长的动能不仅仅来自网路,还有包含用户端设备如个人电脑及智慧型手机在内,形形色色的机器设备所产出的数据。

  「资料淘金」俨然成为一门新显学, 无论是成熟多元的商业智慧(Business Intelligence),或正蓄势待发的海量资料(Big Data,或称巨量资料),都展现了强劲的需求成长力道。Gartner调查公司估计,商业智慧软体的全球巿值在二○一二年达到一百二十五亿美元,七.二%的成长率傲视其他IT应用;IDC则预测,海量资料在亚太区(不含日本)的巿场规模将于二○一三年达到六.○三亿美元,相对于二○一二年年成长四二.六%。

  本书作者奈特.席佛善长分析海量数据,在二○○八年,他准确预测了美国总统欧巴马的胜选,二○一二年又再度预测成功,让民嘴、仰赖数据为生的市调公司啧啧称奇,他是怎么办到的呢?在分秒必争的商场竞赛之中,什么事情都需要直接切入核心,才能赢得市场先机。本书涵盖金融财经、自然科学、社会科学,以及运动和比赛的实例,从浅显的案例出发,让您去思考预测难题之下一些最基本的问题,该如何将我们的判断运用到资料上?该如何预见市场的变化?运用过去的经验当指引,又明白未来将有所不同,两者之间应该如何调解?

  IDC也分析:海量资料在亚太区快速成长的原因之一,在于区域内的企业力求寻找竞争优势,海量资料的应用正能投其所好;但要找到合适的应用方向、选择最佳平台,以及突破部署障碍,则是最需注意的课题。

  早在海量资料的概念成型且备受瞩目之前,微软就有深厚的海量资料应用经验,以微软的Bing搜寻服务为例,要分析超过一百PB(Peta Byte,十的十五次方)的资料,以提供高品质的搜寻结果。因此,更能解决企业对海量资料解决方案的期望。目前多家知名网路公司,利用微软的海量资料解决方案来提升服务的品质。Yahoo!每天以每小时超过三十五万亿笔广告曝光数处理重新整理的速度,借此改善宣传活动成效,提升广告收益。显然,企业能从大量的资料中,获得即时商业洞察力,应用在复杂的事件处理和分析,改善业务与流程, 再加上名列全球CIO头号要务的商业智慧分析,企业的资料淘金热势必将持续看涨, 协助企业发掘全新的成长契机与竞争优势。

  本书适合所有从事资讯、科学、数据分析的相关工作者,只要拥有这本武功祕笈,让您在最短的时间内了解预测背后的真相,引领您迈向未来。

蔡恩全
(本文作者为台湾微软总经理)

推荐序6

用机率思考,才能避免凭运气创造

  我在学统计的时候,毫无激情可言,贝式定理更是让我冷感到极点。

  当时贝式定理对正值青春的我来说,好比三岁的安心亚。我怀疑她以后会很正,但现在实在跟我无关。在思考工具上,贝式定理不大能派得上用场,不是因为这个定理本身没用,是因为这个定理需要的资料不是那么充足。但在资讯取得成本越来越低的时代,贝式定理越来越炙手可热。

  越多的资料,在一定的条件下,越能帮助我们预测,正如邱吉尔说过的:「你越回顾,就越前瞻。」在邱吉尔的决策逻辑里,他尽可能地保留所有想像上的可能性。看起来像极了使用贝式定理建立预测模型,然后才依据历史事实,从最不可能发生的剧本开始删去(或是给予一个期望值)。邱吉尔并不是以一种「历史总会重演」的角度来说明回顾与前瞻的因果逻辑。而是用统计资料锁定「不会」发生的事,并让可能发生的事留在既有「统计事实」之外。

  这种「out of sample」(样本外)的观念,正是贾伯斯在创新的时候「没有」说出的事实。他只说我们不可能依靠统计来发明新的产品,但更贴近事实的描述,是贾伯斯所创造的产品,是「Out of the Sample」的。在iPhone被创造出来后,才有iPhone的统计数据(市场)。

  这里是统计与创新的交界处。

  一方面,我越来越怀疑统计与机率会成为我们这个时代的新九九乘法,会变成我们这个时代的基础教育。但另一方面,这些跟数据、分析、预测相关的理论与工具,一次一次间接又无可避免地冲击我们的自由意志。我们到底是出于自由意志做出的选择,还是越来越落入自以为在选择的毫无选择。韩寒曾经有句名言:「世界上有两种逻辑,一种是逻辑,一种是中国逻辑。」在这里,选择也变成了两种。

  如果《快思慢想》确实地让我们成为一个心理准备好要理性的思考者,《精准预测》可能让我们在实务上真的更接近一名理性的思考者。直觉上,我认为我们必须(必须,就是一种毫无选择)快速提升统计与机率的理解,才能保有自由选择的权利。

  奈特.席佛更直接点明:「只要我们对资讯的理解程度跟不上资讯的成长速度,我们就会面临危险。」他直接用危险二字,描述我们正在迎接的世界,大概是因为知识就是力量。如果真的是因为这个力量的重新分配,造成这样的危险。那么我们面临的危险,可能不只有一种。

戴季全
(本文作者为Richi里斯特、TechOrange流线传媒创办人)

图书试读

前言

这本书谈的是资讯、科技,以及科学的进步。这本书谈的是竞争、自由市场,以及思想的演变。这本书谈的,是让我们比任何电脑都还要聪明的东西,也是本探讨人为错误的书。这本书谈的,是我们如何一步步学会掌握客观世界的知识,而我们为何有时又会倒退。

这本书谈的是预测(prediction),也就是上述这一切的交集。这本书研究的是为什么有些预测可以成功,为什么有些会失误。我希望,对于如何规划我们的未来,我们可以得到多一点的了解,比较不会去重蹈覆辙。

「巨量资料」的希望与困难

现在流行的词是「巨量资料」(big data)。IBM估计,我们每天会生产两百五十万兆位元的资料,有超过之九十的资料是在过去两年中制造出来的。

资讯指数性的增长,有时被视为万灵丹,就如一九七〇年代的电脑一样。《连线杂志》(Wired magazine)的编辑克里斯‧安德森(Chris Anderson)在二〇〇八年写道,光是资料的量就可以免去对理论的需求,甚至连科学方法都不必了。

这本书显然是在拥护科学和科技,而我也认为这是本非常乐观的书。但这本书的主张是:这些观点错得离谱。数字没办法为自己讲话。是我们在为它们说话。我们赋予它们意义。就如凯撒一样,我们可能会用对自己有利的方式来解释资料,让资料脱离客观的现实。

以数据为导向的预测会成功——也会失误。如果我们否定自己在这个过程中扮演的角色,失误的机率就会提高。在我们对资料做更多的要求之前,我们必须先多要求自己。

如果你知道我的背景,我这样的态度可能会让人吃惊。我处理资料和统计数据,用这些来成功预测,因而博得名声。二〇〇三年,我因为厌倦顾问的工作,所以设计了一个叫做PECOTA的系统,试图预测大联盟球员的统计数据。这个系统有一些创新之处——例如说,系统的预测是用概率的方法,为每位球员标出一个范围内的可能结果——我们比较各家系统的结果,发现我们的系统比对手的系统表现更好。二〇〇八年,我成立了五三八网站(FiveThiryEight),试图预测即将到来的大选。五十州之中,五三八网站正确预测了四十九州的总统大选获胜者,以及全部三十五席美国参议院议员选举的赢家。

大选后,有一些出版商跟我接触,他们想找《魔球》(Moneyball)和《苹果橘子经济学》(Freakonocomics)这样的书,从书的成功中获利,这种书讲的是书呆子征服世界的故事。他们认为这本书走的也是这样的路线——研究以数据为导向的预测,领域从棒球到财经到国家安全。

但我为了从事我的研究,在四年内和十几个领域、超过一百位的专家谈过,阅读数百篇期刊文章和书籍,到处旅行,从拉斯维加斯到哥本哈根,我逐渐明白,巨量资料时代的预测进展并不顺遂。在几个层次上,我一直很幸运:首先,虽然我犯了很多我后面要叙述的错误,但我还是获得了成功;而其次,我选对了战场。

例如说,棒球就是个特例。这种运动刚好是种丰富而有意义的例外,而本书就在探讨为何会如此——为什么在《魔球》出现十年后,统计怪才现在跟球探合作无间了。

用户评价

评分

《精准预测:如何从巨量杂讯中,看出重要的讯息?》这本书的出现,恰好填补了我近期在信息辨识上的一些困惑。我常常会思考,为什么有些人总能抓住重点,做出明智的判断,而有些人却容易被潮流牵着走,做出一些令人遗憾的决定。这本书会不会深入探讨“讯息价值”的衡量标准?什么是真正重要的?是稀缺性?是趋势性?还是与自身利益相关性?我更希望的是,它能够提供一些关于“排除干扰”的技巧。在社群媒体充斥着各种观点和情绪的时代,如何保持冷静,不被情绪化的言论所左右,是一个非常重要的课题。我想了解作者会如何引导读者去构建一个属于自己的信息过滤系统,或者说是认知过滤器。有没有可能,书里会教我们如何识别信息来源的可靠性,如何辨别数据背后隐藏的偏见,又或者是在面对众说纷纭时,如何找到那个最接近事实的声音。如果这本书能够帮助我建立起一套更有效的“信息辨识力”,那绝对是一笔宝贵的财富,对于生活和工作都会有很大的帮助。

评分

这本《精准预测:如何从巨量杂讯中,看出重要的讯息?》,光是书名就让我眼睛一亮!最近几年,资讯爆炸的程度简直让人喘不过气,每天打开手机、电脑,各种新闻、社群媒体、广告轰炸而来,感觉脑子里塞满了无用的东西,真正重要的讯息反而被淹没了。尤其是在工作上,常常需要从一大堆数据、报告里面抓出关键点,做决策。以前总觉得这是一种直觉、经验的累积,但总担心自己可能漏掉什么,或是被表面的现象误导。所以,看到这本书的标题,就觉得它简直是为我量身订做的。我非常好奇作者到底有什么独门秘诀,能够帮我们在这个信息洪流中,精准地辨识出真正有价值的部分。这本书会不会提供一些具体的方法论,像是如何设定筛选条件、如何识别讯息的可靠度、又或者是如何在看似杂乱的数据中找到隐藏的模式?我希望它不只是讲讲道理,而是能给我一些切实可用的工具和思维框架,让我下次面对大量讯息时,不再感到无所适从,而是能像个专业的猎人一样,从杂草丛生中找出那条通往真相的线索。

评分

对于《精准预测:如何从巨量杂讯中,看出重要的讯息?》这本书,我最期待的部分是它如何剖析“杂讯”的本质。我们都知道杂讯无处不在,可能是虚假信息、不相关的细节、或是被过度渲染的事件。但要能区分这些杂讯和真正重要的讯息,本身就是一项挑战。这本书会不会从心理学的角度,解释我们为什么容易被杂讯误导?例如,我们是否有某些认知偏差,让我们更容易相信那些夸张的说法,或是被片面的信息牵着鼻子走?我尤其好奇,作者对于“预测”的定义是什么。它指的是对未来的趋势做出判断,还是更侧重于在当下就掌握事物的核心要点,从而预见可能的后果?我希望这本书能提供一套系统性的思考流程,教我们如何冷静地分析信息,剥离那些不必要的干扰,从而看到事物更本质的规律。如果它能提供一些案例分析,让我们看到作者是如何实际运用这些方法,那就更棒了。我希望读完之后,能够提升自己解读信息的能力,不再轻易被表面的光鲜亮丽所迷惑,而是能深入探究,找出事情的真相。

评分

我最近常常觉得,我们生活在一个“意义的荒漠”中,资讯量巨大,但有价值的“意义”却越来越稀少。这本《精准预测:如何从巨量杂讯中,看出重要的讯息?》的标题,就像是一盏灯塔,指引着我寻找可能的出路。我特别好奇,这本书会不会触及“预测”的科学性与艺术性?所谓的“精准预测”,是否意味着作者提出了一种基于科学模型的方法,还是更偏向于一种基于经验和洞察的智慧?我期待的是,它能教会我们如何识别那些“信号”而非“噪音”。比如说,在观察一项新技术的兴起时,我们该关注它的普及率?它的创新点?还是它可能带来的颠覆性影响?这本书会不会提供一些工具,让我们能够量化信息的价值,或者说,能够更客观地评估不同讯息的优先级?我希望它能给我一套方法,让我能从海量的讯息中,提炼出那些能够指导我行动、做出更好决策的“珍珠”。尤其是在当今社会,瞬息万变的局势下,这种能力显得尤为重要。

评分

看到《精准预测:如何从巨量杂讯中,看出重要的讯息?》这个书名,我脑海里浮现的是一种“抽丝剥茧”的感觉。在资讯爆炸的时代,我们每天都被各种信息裹挟着前进,有时候甚至会怀疑,自己所接收到的信息,究竟有多少是真实的,又有多少是被刻意塑造或扭曲的。我非常希望这本书能够教我们一些“识破迷雾”的技巧。例如,当我们在网络上看到一条令人震惊的新闻时,我们该如何验证它的真实性?是否存在一些常见的“陷阱”是我们应该警惕的?这本书会不会提供一些“提问框架”,帮助我们更深入地思考信息的背后原因,以及信息传递者的意图?我期待的是,它能帮助我建立起一种批判性的思维模式,让我不再是被动地接收信息,而是能主动地去分析、去质疑、去求证。如果这本书能够让我成为一个更“清醒”的信息消费者,能够从看似混乱的世界中,找到那些真正具有指导意义的“脉络”,那就太好了。

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有