Big Data大数据的获利模式：图解．案例．策略．实战 pdf epub mobi txt 电子书下载 2025

简体网页||繁体网页

☆☆☆☆☆

原文作者： Makoto SHIROTA

图书标签:

大数据
商业模式
数据分析
数据挖掘
案例分析
策略
实战
图解
数字化转型
商业智能

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到小特书站

ttbooks.qciss.net

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

具体描述

分析现状还不够，预测未来更重要！

　　与其相信一个人的直觉，不如相信数千万人的资料——
　　从图解、案例，到策略与实战，
　　一本书，彻底解读大数据！

　　Facebook、Google、Amazon，
　　以及GREE、瑞可利（Recruit）等知名企业都在用的资料淘金术！

　　懂得找出资料的价值、萃取可用的资讯，
　　就能将大数据转化为商业智慧（BI）；
　　嗅出趋势、解决问题、创造商机，
　　进而创造「偶然的幸运」（serendipity），
　　正是大数据带领企业持续前进的动力！

　　连上Facebook页面，出现推荐「你可能认识的朋友……」的建议，妳因此而找到失联已久国中同学。

　　到amazon.com网站购书，你看到「买这本书的人也买了这些书……」的清单，也正好是自己想读的书。

　　只要打一个字，Google就出现「您是不是要查……」的资讯，正确预测到你想找的关键字。

　　事实上，这些「偶然的幸运」（Serendipity），都和善用大数据（Big Data，亦称巨量资料、海量资料）有关。

　　上述的企业提供你需要的资料、精准预测到你的下一步，其实并非魔法、也不是凭空而来。这些企业将大数据转化为商业智慧（BI，Business Intelligence），不仅分析现状，更懂得预测未来。

　　大数据是「二十一世纪的新石油」，也是继资料挖掘（data mining）、云端运算、社群网站之后，最受瞩目的趋势。如何将庞杂的巨量资料理出脉络、找到关联、发掘价值，找出商机，成为决胜关键。

　　本书作者城田真琴，是野村总合研究所（简称野村总研）高级研究员，也是大数据领域的权威专家。在日本，野村总研被称为最有影响力的民间智库，作者以野村总研独家调查的第一手资料为基础，介绍Zynga、Centrica、Catalina Marketing等欧美企业，以及小松（KOMATSU）、瑞可利（Recruit）、GREE等日本企业如何应用大数据的实际案例。

　　一本书，让你认清楚资料（data）、资讯（information）与情报（intelligence）的不同，不仅要看得到、看得懂，还要能用得出来，进而找到真正的商机所在！

作者简介

城田真琴（Makoto SHIROTA）

　　野村总合研究所（NRI，Nomura Research Institute）创新开发部高级研究员、IT分析师，日本政府「智慧云端运算研究会」智库成员。负责高端技术趋势调查研究、供应商战略分析、国内外企业IT应用调查，专业领域为云端运算、商务分析、M2M、IoT等。着作包括：《云端运算的冲击》、《你不可不知的云端运算常识与非常识》、《2012年版IT年鉴》等。

译者简介

钟慧真（前言、一至四章）

　　「上辈子」是软体工程师，国立清华大学电机工程研究所毕业，曾任职于飞利浦半导体与宏达电。目前是从事日翻中笔译的家庭主妇，定居于日本长野县。译作《不执着的生活工作术》（经济新潮社出版）。

　　部落格：【黛博拉看日本】deborahjong.wordpress.com/。

梁世英（五至八章、谢词）

　　日本一桥大学商学研究所硕士，专长财务金融，目前为专职日文译者。译作包括《这样图解就对了！》《锻鍊你的策略脑》《想像的力量》《Facilitation引导学》（以上均由经济新潮社出版）等。

好的，这是一份关于一本假设的、不同于《Big Data大数据的获利模式：图解．案例．策略．实战》的图书的详细简介。这份简介将侧重于探讨大数据领域之外的其他关键技术和商业战略，以确保内容完全独立。 --- 图书名称：《数字孪生与工业4.0：构建未来制造的智能基石》图书简介引言：超越数据采集，迈向物理世界的精准映射在当前的工业转型浪潮中，数据的重要性毋庸置疑，但真正的革命性进步正来自于如何利用这些数据在虚拟空间中构建出物理实体的精确、动态副本——即“数字孪生”（Digital Twin）。本书《数字孪生与工业4.0：构建未来制造的智能基石》并非聚焦于传统的大数据分析或商业盈利模式的构建，而是深入剖析了如何利用先进的建模仿真、物联网（IoT）和人工智能技术，在数字世界中重现、预测和优化物理世界的复杂系统。本书旨在为工程技术人员、系统架构师、精益生产管理者以及渴望推动企业实现真正意义上“智能制造”的决策者，提供一套清晰、可操作的蓝图，指导他们从概念到实施，成功部署和运维下一代的数字孪生系统。第一部分：数字孪生的理论基石与核心架构数字孪生并非简单的三维模型或静态仿真。本部分将详尽阐述数字孪生的五大核心要素：物理实体、虚拟模型、连接数据、反馈机制以及生命周期管理。 1.1 概念的辨析与进化：我们将区分数字孪生、数字模型、数字影子之间的关键差异，并追溯其从NASA阿波罗计划中衍生出的历史脉络，确立其在工业4.0中的核心地位。 1.2 建模技术的深度解析：本章将详细介绍支撑数字孪生的关键建模范式，包括基于物理的建模（Physics-Based Modeling, PBM）、基于数据驱动的建模（Data-Driven Modeling）以及混合建模（Hybrid Modeling）的融合策略。重点探讨如何利用多物理场耦合分析（如热、力、电磁场）来确保虚拟模型的精确性。 1.3 物联网（IoT）与边缘计算的集成：数字孪生的实时性依赖于高频、低延迟的数据流。本部分将深入探讨工业物联网（IIoT）的传感器选型、数据采集协议（如OPC UA, MQTT）的应用，以及边缘计算在数据预处理和反馈回路优化中的关键作用，确保虚拟模型能够实时同步物理状态。第二部分：构建与运行高保真数字孪生系统本部分是实践指南的核心，侧重于从零开始构建一个稳定、可扩展的数字孪生平台，并展示其在不同工业场景中的应用潜力。 2.1 虚拟环境的搭建与仿真引擎选择：介绍主流的仿真软件平台（如Ansys Twin Builder, Siemens Tecnomatix）的优劣势，并指导读者根据应用需求（如生产线优化、产品设计验证）选择合适的仿真求解器和可视化工具。 2.2 数据融合与状态估计：现实世界的数据往往存在噪声、缺失和延迟。本章重点介绍卡尔曼滤波、粒子滤波等先进状态估计技术，如何将传感器数据、历史记录和现有模型进行智能融合，从而生成最接近真实状态的虚拟模型输入。 2.3 双向闭环反馈机制的实现：真正的数字孪生能够“指导”物理世界。我们将详细设计和实施控制指令的生成流程，探讨如何通过虚拟环境中的“假设情景测试”（What-If Scenarios）来安全地验证优化方案，并通过安全网关将最优参数反馈给PLC或SCADA系统，实现自动或半自动的生产调优。第三部分：面向资产全生命周期的智能运维数字孪生最大的价值之一在于其对资产和系统的全生命周期管理能力，极大地超越了传统的预防性维护。 3.1 预测性维护的飞跃：探讨如何利用数字孪生模型进行“剩余使用寿命”（RUL）的精确预测。不同于基于阈值的简单报警，孪生模型可以模拟关键部件在不同负载下的疲劳累积过程，提前数月预警潜在故障。 3.2 产线柔性与工艺优化：在离散制造业中，快速调整生产布局是挑战。本章展示如何利用数字孪生对生产线进行虚拟调试（Virtual Commissioning），在不中断实际生产的情况下，模拟新产品导入、机器人路径规划和物流瓶颈的消除，确保新流程的零缺陷上线。 3.3 产品设计验证与迭代加速：对于复杂产品（如航空发动机、汽车底盘），数字孪生能够在物理样机制造前，对设计变更的性能影响进行全面评估。本节将介绍如何建立“设计孪生”与“制造孪生”的联动机制，显著缩短研发周期。第四部分：挑战、安全与未来展望技术部署必然伴随着新的挑战。本书的最后部分聚焦于实施过程中的非技术性障碍和未来的发展方向。 4.1 数据安全与模型完整性保护：工业控制系统（ICS）面临的网络威胁日益严峻。本章深入分析数字孪生系统在数据传输、云端存储和模型知识产权保护方面的安全风险，并提供基于零信任架构的网络隔离和加密策略。 4.2 跨部门协作与知识产权的重构：数字孪生要求IT、OT（运营技术）和工程部门的深度融合。我们将探讨组织结构调整的最佳实践，以及如何建立统一的知识管理框架，确保模型和数据标准的一致性。 4.3 人机协作与增强现实（AR）的融合：最后，我们展望数字孪生与现场操作的结合。如何通过AR眼镜将虚拟模型的实时状态信息、维护指导叠加到真实的设备上，赋能一线技术人员，实现“所见即所得”的智能工作流。结语：构建面向未来的工业操作系统《数字孪生与工业4.0：构建未来制造的智能基石》致力于提供一个全面的、侧重于工程实现和系统集成的视角。它将帮助读者理解，数字孪生不是一个终点，而是一个持续演进的、连接物理世界与数字世界的智能操作系统，是实现工业4.0愿景的决定性技术路径。本书提供了从理论框架到实际部署的详细方法论，是迈向下一代智能制造的必备参考书。

著者信息

图书目录

【导读】
　创造「偶然的幸运」（serendipity），正是巨量资料技术不断前进的动力（台湾野村总研谘询顾问股份有限公司副总经理　陈志仁）

【推荐序】
　当商业智慧隐藏在云深不知处（国立交通大学经营管理研究所教授　杨千）
　Big Data, Big Intelligence：从资料、资讯到情报（和沛科技股份有限公司总经理　翟本乔）
　当巨量资料与社会脉络交集（英国开放知识基金会地区大使　徐子涵 Schee）
　Data、Data、Data：我们活在广袤的资料流中（资深部落客　郑纬筌Vista）
　老大哥在看着你：Big Data□ Big Brother□（英商巴克莱银行台北分行董事总经理　刘奕成）

前言

★第一章　什么是巨量资料
　资料洪流（The Data deluge）
　巨量资料的3V特性
　广义的巨量资料
　为什么到现在巨量资料才受到众人的瞩目？（1）巨量资料的民主化
　为什么到现在巨量资料才受到众人的瞩目？（2）硬体性价比的提升与软体技术的进化
　为什么到现在巨量资料才受到众人的瞩目？（3）云端的普及
　从「分析过去」到「预测未来」　商业智慧与巨量资料的交会
　从点（交易资料）到线（互动资料）的分析
　巨量资料分析的起源
　本章重点整理

★第二章　支撑巨量资料的技术
　人才短缺
　什么是Hadoop
　与日俱增的套件
　众多套件版本并存的原因
　NoSQL资料库
　创投也对Hadoop、NoSQL开发企业投以热切的目光
　巨量资料时代的资料处理基础
　备受瞩目的分析资料库
　串流资料（即时资料）处理
　自行开发串流资料处理技术的网路公司
　机器学习、统计分析等
　自然语言处理、其它
　本章重点整理

★第三章　以巨量资料为核心竞争力的企业　欧美企业篇
　快速成长之网路公司的巨量资料运用技巧
　eBay：每天产生50 TB的资料
　 (1)远超乎想像的巨量资料产生速度
　　(2)eBay的资料分析基础
　Zynga：披着游戏开发商外皮的资料分析公司
　　(1)社群游戏经济的重要指标
(2)提升病毒系数的机制
(3)游戏其实是资料驱动营运
(4)三次点击原则
　Centrica：借由引进智慧电表分析能源消耗模式
　　(1)英国电费、瓦斯费收费的实际状况
　　(2)引进智慧电表后的影响
　卡特琳娜行销集团：以「收银台优待券」设计顾客的消费行为
　　(1)储存了超过一亿人份的消费纪录
　　(2)预测顾客的消费行为，带动门市买气
　本章重点整理

★第四章　以巨量资料为核心竞争力的企业　日本企业篇
　日本国内也开始运用巨量资料
　小松（KOMATSU）：日本运用巨量资料的先驱
　瑞可利（Recruit）：彻底运用Hadoop资料分析，成功改造企业文化
　　(1)几乎全公司上下都用Hadoop
　　(2)支撑瑞可利巨量资料分析的Hadoop基础
　　(3)成功的祕诀在于组织体制
　　(4)对于瑞可利而言，Hadoop的「真正价值」究竟是什么？
　GREE：资料驱动型营运方式是快速成长的原动力
　　(1)与其相信一人的判断，不如相信数千万人的资料
　　(2)资料驱动型营运方式的根基来自对于日志资料的执着
　　(3)具备多种技能的专业人士齐聚一堂
　　(4)将沟通不良减至最少的团队体制
　日本麦当劳：在现实世界实现一对一行销（One-To-One Marketing）
　　(1)划时代优待券背后的周全准备
　　(2)把焦点集中在做为集点卡的行动电话与智慧型手机
本章重点整理

★第五章　巨量资料的运用模式★
　巨量资料的运用案例
(1)精准推荐商品或服务
(2)行为定位广告
(3)运用地点资讯的行销
(4)纠出盗刷
(5)顾客流失分析
(6)预测设备故障
(7)验出异常
(8)改善服务
(9)预测路况
(10)预测电力需求
(11)预测感冒流行
(12)预测股市行情
(13)油资成本的最佳化
　巨量资料的运用模式分类
(1)个别优化×批次处理型
(2)个别优化×即时资讯型
(3)全体优化×批次处理型
(4)全体优化×即时资讯型
　巨量资料的运用深度
(1)掌握过去与现状
(2)发现行为模式
(3)预测
(4)优化
【专栏】动态定价
　巨量资料运用的真正价值
　本章重点整理

★第六章　巨量资料时代的隐私权问题★
　隐私权与创新的两难
　美国国会也表示关注
　制作网路个资档案的是与非
　请勿追踪（Do Not Track）
　消费者隐私权保护法案
　採用选择性参与方式的欧盟
　资料保护纲领也进行修正
(1)引进「抹掉过去」的权利
(2)使用者尚未明确表示同意前，不得使用其个人资料
(3)制定资料可携（Data Portability）的权利
(4)扩大说明责任
　日本的法令架构是《个人资讯保护法》加上分别针对各领域订定的指导原则
　部分指导原则在提供资讯予第三人上採用选择性参与方式
　日本政府的评估状况
　以「资讯大航海计画」为契机开始评估的经济产业省
　由生活纪录的角度进行议论的总务省
　线索就在与使用者的「对话」
　实体世界里的行为追踪
　本章重点整理

★第七章　开放资料时代的到来与资料市场的兴盛★
　「活用外部公开资料」的选项
　风起云涌的连结开放资料（LOD，Link Open Data）运动
　影响扩及开放式政府
　如雨后春笋般不断出现的新创企业
　透过比赛促进资料运用
　落后一步的日本
　日本国内因三一一大地震而略有进展的开放资料使用
　资料市场的兴盛
(1)Factual
(2)Windows Azure Marketplace
(3)Infochimps
(4)Public Data Sets on AWS
　商业模式各有不同
　热络的资料市场存在着不容忽视的课题
　本章重点整理

★第八章　面对巨量资料时代该有的准备★
　巨量资料时代的企业IT策略
　开始迈向资料分享的日本企业
(1)LAWSON×Yahoo
( 2)KDDI×乐天
(3)COOKPAD×ID’s
　拥有原创资料的好处
　供应商的新商机在提供「资料整合服务」
　谁能成为资料整合公司
　美国的支付服务业者明显朝「资料整合公司」发展
(1)VISA
(2)PayPal
(3)美国运通
　让原创资料摇身一变成为「贵重资料」的绝妙资料组合
　全世界对资料科学家的需求愈来愈高
　资料科学家需具备的技能
　资料科学家需具备的资质
(1)沟通能力
(2)创业家精神
(3)好奇心
　相关人才严重不足
　相关研究所开始设立
　鉅额资金流向巨量资料分析企业
　日本也开始对资料科学家展开抢人大战
　最后的一道关卡－－组织体制与企业文化
　朝向资料驱动型企业迈进
　本章重点整理

谢词
参考文献
图表索引

图书序言

推荐序

当商业智慧隐藏在云深不知处

　　巨量资料是个必然趋势。

　　巨量资料（亦称为海量资料、大数据）指的是在以往一般技术不容易管理但现在已能有效储存、分析的大量资料。

　　自从有了网际网路，资料的产生已不是各个组织的内部活动所产生的，而是包括了跨组织的各项活动记录，更包括了数以亿计的人类在网路上各自产生及互动的资料；在工具使用上除了传统电脑、平板、智慧型手机、以及各项道路监视器、环境监控数据设备。

　　从中国的历史上来看，资料的产生、储存、传递，讲的是「字」。我们的祖先结绳记事也好，用龟甲牛骨刻下所谓的甲骨文也好，都是费时费力的。到了用竹简记事，也记不了太多的字。以前的人说「学富五车」是形容书读很多的意思；然而，如果以尚未发明印刷术的眼光来看，「五车」的竹简，大概指的是《论语》已经读了好几篇，快要读《大学》《中庸》。

　　有了电脑之后，早年的资讯科技，不论是资料的产生、储存、传递，讲的是K （Kilo、仟、十的三次方10^3或2^(10)）。到了1990年代，讲的是M（Mega、Million、百万、十的六次方10^6 或2^(20) ）。进入二十一世纪，2000年左右，讲的是G （Giga、Billion、十亿、十的九次方10^9或2^(30)）。现在，我们讲的是T（Tera、Trillion、万亿、兆、十的十二次方10^(12)或2^(40)）。

　　由此可见，资料的产生、储存、传递真的进步太多了。

　　所以，我的博士班学生毕业的时候，只要一片光碟，就能把他们所有读过、写过的文章全部备份起来，非常轻便（却也很没成就感）。

　　鑑往知来，如果资讯科技进步继续下去，我们会从T（Tera）一路走到P（petra、 10^(15)）和 E（exa、10^(18)）的世界（TPE也刚好是台北在国际航空的代号桃园国际机场）。

　　英国Centrica电力公司可以每三十分钟透过网路读取用户智慧电表一次，每天抄电表四十八次，它能对用户的用电行为观察更多更了解，甚至分析之后能对客户行为有更精准的预测，可以调节不同用电需求的输配电电路。每天抄表四十八次，一年就产生1T的资料。

　　1970年代，10M的磁碟机要40万台币，可以买当时的豪宅一栋；2000年左右，2G随身碟（200个10M）约2万台币，可买当时的小吨数窗型冷气机一台；现在（2013年），128G（64个2G、12800个10M）的随身碟，新台币2,388元即可入手，这个价格可以让一对情侣到五星级饭店的自助餐厅用餐一次。

　　在资讯科技进步的轨迹上，我们不只已看到巨量资料的应用，我们更确信它的普及是个必然趋势。

　　在数学符号上就是一个国中生写下「10^(20)」不会有甚么感觉，它就是1的后面跟上20个零。但是，在实体世界里全地球所有海滩的沙粒总数大约就是这么多粒，是很多很多的，对我们个人来说就是无限大，在佛经中则称为「恆河沙数」。

　　小孩子不容易忘记，是因为他的记忆内容少，比较容易找到记得的事物；大人容易忘记，是因为记忆内容较多，却没有用心建立索引目录分类、缺少工具与方法，或是传输线老化接触不良，不容易找到曾经记忆过的事物。

　　如果资料少，当然容易找到过去的纪录；如果资料多，当然增加极大的困难；更何况，要分析巨量资料中的数不尽的关系与内涵，绝对不是单纯的正比关系。

　　如果在一家企业内部进行资料探勘应用，我们称之为商业智慧（BI，Business Intelligence），这是许多公司知识管理的范畴，也已经有二、三十年的历史；台湾资讯管理相关科系都有在资料库相关课程里探讨。许多像SAP、Oracle、IBM等公司都提供类似的软体工具。

　　但是，到了巨量资料一路往TPE走，许多智识都隐藏在云深不知处，确实是能够探勘出有价值的资讯，变成更有必要却更困难，因此需要更有竞争力。

　　本书提出许多实际成功应用的案例，列出相关互动隐私及安全的议题，是一本有相当广度的巨量资料相关读物，很适合关心未来的知识份子阅读。

文∕杨千
（本文作者为国立交通大学经营管理研究所教授）

推荐序

Big Data, Big Intelligence：从资料、资讯到情报

　　我在2006年任职于Google时，有一次，前往一所大学演讲Google的储存系统GFS。一位教授问我：「那资料要删除的时候怎么办？」我反问：「资料为什么要删除？」在场所有人都露出奇怪的表情。

　　Google的认知是：资料（data）里面会有资讯（information），「现在用不到」并不表示「以后用不到」。除非法律规定必须删除，不然一概保留。今天大家已经听到了「资料是新石油」（Data is the new oil.）这句话，也开始知道了资料中会有「看不见的价值」。

　　《孙子兵法》共有十三篇，最后一篇谈〈用间〉，也就是情报战。情报的价值，远高于其他战术或武器。今天所谓的精灵武器，就是能妥善运用地理定位（Geolocation）和图形识别（Pattern Recognition）等技术所取得的资讯和情报。由最近几年公布的许多资料可以看出，第二次世界大战的胜负，其实就是决定在情报。由美军破解日本海军密码而在中途岛（Midway Islands）洞烛机先，到英国破解德军潜艇的Enigma密码而歼灭狼群以保全横渡大西洋的生命线，都是任何战术和武器无法独自达成的。

　　情报如此重要，许多人把失败的责任归责于错误的情报，或是缺乏情报。事实上，我们的四周充满了大量的情报，只是一般人无法有效正确地辨识。例如珍珠港事件（Pearl Harbor Bombing）之前，已有一封紧急电报示警，但是这封电报遭人搁置，直到事件发生之后才译出。有能力正确并及时辨识这些情报的人，小者被称为福尔摩斯（Sherlock Holmes）或是柯南（名探侦□□□），大者就被称为诸葛亮。在商场不见硝烟的战争中，情报更突显出它的重要。今天我们开始拥有了处理这些大量资料的工具，更重要的是读懂这些资料，把它们转化成可用情报的智慧。正如我在 Facebook 上说过的（编按：全文详见作者网志〈IoT 和 Big Data 商机的迷思〉）：

　　想要做Big Data（巨量资料）的人请先认清楚：什么是Data（资料）？

　　．存得起来的，就是storage（储存）。
　　．看得到的，才是data（资料）。
　　．看得懂的，叫做information（资讯）。
　　．用得出来的，才能称为intelligence（情报、智慧）。

　　Big Data这个名字事实上是有点误导。真正赚钱的，是从big data中萃取出来的 big intelligence。为什么CIA叫作Central Intelligence Agency（中央情报局），而不是Central Information Agency（中央资讯局）或Central Data Agency（中央资料局）？而萃取information和intelligence的技术并不是现在才有的。随便问一个有水准的资讯资工系教授，就会告诉你data mining（资料探勘）、neural network（神经网路）、pattern recognition（图形识别）、statistical machine translation（统计型机器翻译）、information retrieval（资讯萃取）,...等等领域的历史。这些才是困难而需要投资开发的领域，而不是一个简单的大量储存和平行运算系统。

　　我在2003年进入Google的时候，正是MapReduce初启用之时。Google原本的Indexer是一套大程式，用了几百台伺服器，要一个多星期才能完成工作。而中间只要有一台机器当机一次，就要全部重来。Google因此设计了MapReduce这套系统，主要目的在于容错。将资料切成许多小块，分到独立的伺服器上处理。虽然机器数量增加到了两千台，但中间不管怎么当机都没关系了。后来在论文发表后引出了Hadoop这个Open Source的软体，给了想做大量资料分析的人一个很好的工具，也让Hadoop在很多人心中变成了Big Data的同义字。但事实上Hadoop只是一个平行分散式资料处理的工具，真正能为资料创造价值的是上层的智慧分析。这些工具是让资料分析师（以后是叫做「资料科学家」？）能把时间用在真正重要的工作「资讯萃取」上，而不只是打造所需的工具。想要靠 Big Data 做一番事业的人，绝不是只要学会了这些工具就可以了。

　　1994年，商用的Internet开始成型，因为modem的速度和价格开始达到一般人可用的范围。今天，储存和处理资料的速度和价格也开始达到一般公司可以负担得起初步的Big Data处理的程度。商用Internet起步的初期，业界很多人认为只要架个网站就会有生意上门。今天我们在Big Data这个领域也会有这么一段混乱期，需要借着更多好的介绍书籍和文章的引入，可以缩短这段过渡期。很高兴看到这本书并未落入坊间许多一窝蜂介绍工具的潮流，而能把主要的篇幅用在许多其他重要的面向。希望读者在看完本书之后，能对如何萃取周遭的资讯并加以运用有更深一层的认识，并从Big Data进步到Big Intelligence的层级。

　　共勉之。

文∕翟本乔
（本文作者为和沛科技股份有限公司总经理，曾任台达电子云端技术中心资深处长、Google Platforms Architect。）

导读

创造「偶然的幸运」（serendipity），正是巨量资料技术不断前进的动力

　　接到本书导读的邀稿时，刚好是我跟一家国内大型服务公司探讨他们公司海外发展议题之后的下午。

　　这让我想到，从2004年加入野村总合研究所台北分公司以来，转眼已经过了九年。常有企业主在面对全球新的议题与挑战时，谘询我们的看法；而我们的顾问专家群，难免也会私下讨论不同国家的企业主对于新事物的接受态度。

　　过去，我们总是以为台湾企业主很少愿意从逻辑思考的角度，看清所谓新事物的全貌，凡事好像只想要得到「引进这件新事物的时机是否已经成熟？」的答案，却没有深入思考「如何亲自将新事物引进企业，做为企业超越自我的契机？」。

　　读完这本书之后，我必须稍加修正以上的观点，或许该说，如果对于新事物的介绍，可以有办法解说得完完整整、面面俱到，那么，企业主怎么可能放过这些知识呢？

　　这本书是我在东京总公司的同事城田真琴的着作，在日本，这本书出版于2012 年7月，2013年陆续出版韩文版、简体中文版与繁体中文版，是巨量资料领域的重要着作。我认为，这本书内容能让台湾的读者有机会看见全球发展「巨量资料」的全貌。

　　本书的内容在第一及第二章介绍了「巨量资料」在资讯科技技术上出现的许多新名词，例如Hadoop、NoSQL、LOD 等；并且进一步解说企业在资料运用层面，从过去的「资料可视化」进展到「资料预测未来」的境界；因此，强调深层的资料调查以及准确度的预测，让企业因为採用巨量资料的「技术」而进展到更高的境界。

　　简言之，对于电脑技术名词没有兴趣的读者，可以想像，过去资料只能「知道交易已经完成」的阶段，当运用巨量资料以后，已经进化到可以「知道交易完成的原因」了。

　　对于想知道全球企业实际应用巨量资料个案的读者们，可以在第三章了解到四家欧美企业的成功案例，其中包含网拍公司eBay如何整合过去的资料仓储分析系统与巨量资料技术，让大家羡慕eBay员工拥有三个不同的资料分析基础来支持他们进行业务的拓展。此外，第三章也介绍游戏公司Zynga如何以5 %的付费客户缴出11亿美元营收的惊人业绩。英国瓦斯及电力公司Centrica的个案，让读者了解英国把150万颗机械电表改成数位电表后，巨量资料改变每个人生活的情境。第三章最后介绍的是大型零售业者卡特琳娜行销集团（Catalina Marketing），豪气地蒐集一亿人的消费资料，达成「能够以100 %的准确度，预测出像是会购买某个商品的潜在消费者」的行销新境界。

　　当读者沉浸于以上个案的激盪时，别忘了第四章还有四个日本企业运用巨量资料的成功案例——小松（KOMATSU）是日本主要建筑机械的供应商，其实在台湾的建筑工地也不难看见小松的推土机以及怪手；小松的商业模式是租赁这些机械设备给营建商或是工务机构，因此，透过全球机械所不断蒐集的相关巨量资料，已经可以用来推估设备维修的需求即将发生，以及给使用者燃料使用节省的建议做法等。瑞可利（RECRUIT）是家拥有各式各样网路专门服务的公司，有求职、结婚、购屋网等，他们採用Hadoop技术，加上名为MIT（Marketing & IT United）的新组织，跨部门整合公司内部各单位，让企业内部更有效地蒐集与分享利用巨量资料。此外，第四章也剖析日本游戏公司GREE急速成长的原动力，在于「与其相信一人的判断，不如相信数千万人的资料」，他们称为「资料驱动型营运方式」。第四章最后的日本麦当劳（McDonald’s Japan）案例，我在2009年就曾涉猎过，很佩服该公司仍持续发展个人化行销的相关巨量资料，要达成「在现实世界实现一对一行销」的愿景。

　　原本我以为这本书第三章与第四章完整介绍欧美日的八个企业案例之后，到此应该够了，但是，身为一位任职于全球知名智库的管理顾问专家，如果只是把资料说个够多，并没有满足提出「洞察力」（insight）这样的专业标准，可能无法满足读者追根究柢的渴望。因此，我们可以看见第五章有13个巨量资料的运用案例，进一步介绍「将巨量资料引进企业，做为企业自我超越的契机」的具体样貌。本书最令人赞叹的地方，在于作者将他研究企业应用巨量资料的成功案例，归纳成一张张浅显易懂的图表，其中，第五章【图表5-1】巨量资料的运用模式，是一张相当精采的图表，由个别最佳化、全体最佳化、批次处理与及时处理构成四种巨量资料运用的商业模式，满足想要对于巨量资料获利模式一探究竟的挑剔读者们。

　　接下来，第六章探讨美国欧盟以及日本主要国家对于巨量资料侵犯隐私的相关法律及对应的措施，针对许多服务业者关心台湾对于消费者隐私保护的议题而言，有具体的参考价值。

　　我们都知道，谈巨量资料一定避免不了政府的公开资料（Open Data）此一环节，作者选择在商业模式探讨完毕之后，再来说明美、英、日等国政府鼓励发展公开资料的具体做法，其实也确实符合我们的观察，单单政府资料公开无法成为获利模式的趋势；但是，如果没有政府的公开资料，肯定有些美好的巨量资料商业模式就无法成真。

　　事实上，本书结论让我非常震撼——我是一位1990年代投身职场的上班族，当年，资讯工程师（Information Engineer）这个新职业造就了一波产业的革命，也带动了台湾服务业的一波成长荣景。本书最后，作者告诉我们，身处巨量资料的年代，不仅仅企业在组织内需要一位资料长（Chief Data Officer）的新角色；而且未来十年，整个IT业界里最重要的人才将是资料科学家（Data Scientist）这个新人才。美国的大学已经开始开设主修分析学的研究所课程，展开人才的培养教育，他需要培养三种特质，容我卖个关子，把这个答案留给读者在本书里挖掘吧！

　　最后，很高兴出版单位给我有机会抢先读完本书，我也很喜欢作者在本书中提出的许多细微的观察，例如，在说明亚马逊（Amazon）电子商务的「协同过泸」（Collaborative Filtering）技术时，引经据典地介绍「偶然的幸运」（Serendipity）这个词，这是来自英国小说家霍雷斯．华尔波（Horace Walpole）在1754年的新创文字，描述消费者意外拥有幸运或是发现有价值事物的奇特心情，很传神地说明了给消费者不可预期的幸运，正是巨量资料技术不断前进的动力啊！

文∕陈志仁
（本文作者为台湾野村总研谘询顾问股份有限公司副总经理）

图书试读

★第四章　以巨量资料为核心竞争力的企业　日本企业篇

⊙日本国内也开始运用巨量资料⊙

巨量资料的运用，印象中似乎是欧美企业领先于日本企业，不过，日本企业中也有一些着善于运用巨量资料而收到显着成效，或正开始收割成果的公司。在本章，做为日本企业致力于巨量资料的事例，举出小松（KOMATSU）、瑞可利（Recruit）、GREE与日本麦当劳为对象进行说明。

⊙小松（KOMATSU）：日本运用巨量资料的先驱⊙

以巨量资料为核心竞争力的日本企业中首先要介绍的，是仅次于美国Caterpillar Inc.的世界第二大建筑机械制造商小松。早在「巨量资料」这个名词尚未成形前，小松就已经开始致力于现今所称之巨量资料的运用而收到显着成效，如果说「日本巨量资料运用的原点就在小松」也不为过。尤其是利用GPS和感测器资料之巨量资料运用的精髓均浓缩在小松的例子里，特别值得制造业参考。

对多数的日本企业来说，「全球化」是今后经营上最重要的课题。2010年度小松的合併营收为1兆8431亿日圆，除了是名列全球第二的建筑机械制造商外，从占了小松营收87.7%（1兆6156亿日圆）之建筑机械、车辆设备部门的地区别营收（请详见【图表4-1】）中，日本国内仅仅贡献了16%（其余皆来自海外）的事实来看，更应聚焦在小松是个非常早便实现全球化的企业这一点上。

小松全球化的原动力来自「KOMTRAX」，也就是能够远端监控建筑机械运转状况的系统。KOMTRAX透过装设在建筑机械上的GPS与各种感测器，蒐集机械的现在所在位置、运转时间、运转状况、燃料残留量、耗材的更换时期等资料，并利用卫星或手机通讯，最后经由网路将这些资料送回小松位于日本的伺服器，借由这样的机制世界各地的经销商与客户都能对小松的伺服器进行存取，并确认自己所在地区之资料。

KOMTRAX最早的版本于1999年首度问世，将GPS装设于小松旗下租赁公司的推土机和油压怪手等机械上，借此掌握个别车辆的位置资讯与运转时间，好处是除了能更有效率地进行车辆调度外，更不会再遭到偷窃，并降低了维修管理成本。

小松自2011年起将KOMTRAX列为日本国内市场所有建筑机械的标准配备，之后并扩大引进至欧美、中国等地，目前在菲律宾、越南、南非等全球约70个国家中，有超过26万部的设备参与运转（2012年3月底时）。刚开始只掌握了位置资讯与运转时间，但目前已能够蒐集如「什么时候补给了燃料」「什么时候在何种模式下使用了怪手」等各种资讯。

▲如何处理原始资料？▲

从小松KOMTRAX一连串致力于资料的运用方式中，我们想要学习的关键在于「从所蒐集之原始资料（raw data）获得什么样的洞察」。比方说，只要知道建筑机械的正确运转时间，便能事先锁定损耗率高的零件，在维修服务的效率化派上用场。只要知道燃料的使用量，便能借由对燃料使用量多的客户与使用量少的客户之间的差异进行分析，来釐清双方操作方式的不同，并给予燃料使用过多的客户节省能源的建议。具体来说像是「白天时车辆位置并无变化，但引擎仍维持发动。最好提醒客户不要怠速，记得关闭引擎」。

用户评价

评分☆☆☆☆☆

我是一名初创公司的技术合伙人，我们公司做的是一款面向年轻人的社交APP。现在流量获取越来越困难，成本也越来越高，我迫切需要找到更有效的方式来留住用户，并且通过数据分析来驱动产品迭代，最终实现商业化。这本书的“实战”部分，对我来说意义重大。我非常想了解，在实际操作中，如何从海量用户数据中挖掘出有价值的信息，如何建立数据分析的闭环，让数据驱动的决策能够快速落地。比如，用户为什么会流失？如何通过个性化推荐来提高用户粘性？又或者，如何设计付费功能，让用户愿意为服务买单？我希望能在这本书里找到具体的“操作手册”，而不是停留在概念层面。尤其是在“图解”部分，如果能有清晰的数据流程图、架构图，或者用户画像的示例，那将极大降低我的理解门槛。毕竟，作为技术人员，有时候对商业策略的理解会比较慢，直观的图解对我来说是最好的学习方式。我希望这本书能让我明白，如何将大数据技术转化为实际的商业价值，帮助我们的小公司在激烈的市场竞争中脱颖而出。

评分☆☆☆☆☆

最近常常听到“数据驱动决策”这个词，但有时候感觉有点悬。我们公司虽然也收集了不少数据，但并没有真正做到“驱动”起来。很多时候，还是凭经验做判断，导致一些决策的效果并不理想。这本《Big Data大数据的获利模式》恰恰切中了我的痛点。我特别想知道，这本书会怎么解释“获利模式”和“数据驱动”之间的联系。它会不会提供一些量化的指标，让我们知道什么时候真正实现了“大数据获利”？而且，我对于“策略”部分非常感兴趣。在大数据领域，有哪些已经被验证过的、有效的盈利策略？例如，通过数据洞察来优化定价，或者开发基于数据的增值服务。我希望这本书能提供一些“干货”，让我能够带着具体的问题去学习，而不是泛泛而谈。另外，作为一个非技术背景的管理者，我最怕的就是书里充斥着晦涩的技术术语。我更希望它能用简洁明了的语言，结合实际案例，来阐述复杂的概念，让我能够轻松地理解并应用到工作中。

评分☆☆☆☆☆

我是一名大学生，主修的是市场营销专业，目前正在写一篇关于大数据在市场营销中应用的毕业论文。我一直在寻找一本能够全面、深入地阐述大数据获利模式的书籍，而这本书的书名《Big Data大数据的获利模式：图解．案例．策略．实战》听起来就非常契合我的需求。我希望这本书能够为我提供扎实的理论基础，帮助我理解大数据是如何被用来创造商业价值的。尤其是我对“案例”部分非常期待，如果能有不同行业、不同规模的企业案例，并且能够详细分析它们的大数据获利策略和实施过程，那将为我的论文提供宝贵的素材和参考。同时，“策略”部分也至关重要，我希望能从中学习到系统性的、可操作的获利模型和方法论，并了解这些策略在实际应用中可能遇到的挑战和解决方案。我希望这本书能够帮助我构建一个清晰的框架，让我能够从宏观到微观地理解大数据获利的各个层面，最终能够将所学知识融会贯通，写出一篇高质量的学术论文。

评分☆☆☆☆☆

这本书的封面设计就很有意思，那种深邃的蓝色和数据流动的线条，一下子就抓住我的眼球。作为一名在台湾从事行销工作多年的从业者，我一直觉得大数据这东西很抽象，虽然知道它很重要，但到底怎么“玩”，怎么让它真的变成“钱”，一直是个模糊的概念。市面上很多书都是讲技术，讲算法，看得我头昏眼花。但这本书的副标题“图解．案例．策略．实战”，就让我看到一丝希望。我特别期待它能不能用我能理解的方式，比如图表、流程图之类的，把复杂的概念解释清楚。而且，我更关心的是那些“案例”和“策略”。台湾这边虽然也在谈大数据，但很多时候还是停留在概念层面，真正落地、有成效的案例不多，所以我很想看看，这本书里会不会有让我眼前一亮的，能够直接借鉴到我工作中的方法。毕竟，理论讲再多，不如一个成功的实战案例来得实在。如果它能告诉我，其他公司是怎么利用大数据赚到钱的，又用了什么样的方法，那对我来说就非常有价值了。总而言之，我希望这本书能让我从“只知道大数据很重要”变成“知道如何让大数据变现”的实操者。

评分☆☆☆☆☆

我最近在研究如何优化我们公司网站的用户体验，想看看怎么才能更精准地推送产品信息，增加转化率。之前读过一些关于用户行为分析的书，但总觉得不够深入，而且缺乏实操指导。这本《Big Data大数据的获利模式》的书名，尤其是“获利模式”这四个字，直接击中了我。我一直觉得，大数据最核心的价值就在于它能带来商业上的回报，如果不能产生利润，那再多的数据分析也只是空中楼阁。我特别好奇，这本书会不会深入探讨不同行业、不同商业模式下的大数据获利策略。比如，电商、内容平台、服务业，它们的大数据变现方式是不是截然不同？这本书里会不会提供一些模型或者框架，帮助我们梳理出适合自己业务的大数据盈利路径？我更想知道的是，在“策略”层面，除了常见的精准营销，还有没有更具颠覆性的获利方式？例如，利用大数据创造新的产品或服务，或者通过数据授权、数据交易来实现盈利。我期待这本书能够提供一些“不走寻常路”的思路，让我跳出固有的思维定式，看到大数据更广阔的商业前景。