本书主要目的是为了让学习者能够快速地对大数据的整体架构有初步的认识,内容完整兼顾原理与应用,协助学习者奠定大数据相关的知识与基础。内容包含大数据应用相关的演算法、NoSQL 资料库、文件系统、以及分析工具四大部份,并以附录介绍近年来颇受欢迎的 R 语言,并辅以「股价分析」案例说明,以 step by step的方式协助学习者快速上手。另外,每章均附习题,让学习者可以从中快速抓出课程重点,并检核自己学习的效果。
4.附录放入近年来受欢迎的R语言,辅以「股价分析」案例,以step by step的方式协助学习者快速上手
著者信息
图书目录
Chapter 01 简介 第一节 为什么Big Data 会受到重视 第二节 Big Data 的3V、4V 与5V 第三节 Big Data 的机会与挑战 第四节 Big Data 在业界的应用实例
Chapter 02 预备知识 第一节 CAP & BASE 理论 第二节 BASE vs. ACID 第三节 杂凑表与分散式杂凑表的应用 第四节 为什么关联式资料库在Big Data 的应用中会使不上力 第五节 分析Big Data 的方法 第六节 资料品质与知识发现模型 第七节 Big Data 应用的安全性与风险 第八节 分散式系统的设计要点
Chapter 03 演算法 第一节 Google MapReduce 第二节 Apache MapReduce 第三节 Apache Spark 第四节 Google Pregel 第五节 Apache Hama