本書主要目的是為瞭讓學習者能夠快速地對大數據的整體架構有初步的認識,內容完整兼顧原理與應用,協助學習者奠定大數據相關的知識與基礎。內容包含大數據應用相關的演算法、NoSQL 資料庫、文件係統、以及分析工具四大部份,並以附錄介紹近年來頗受歡迎的 R 語言,並輔以「股價分析」案例說明,以 step by step的方式協助學習者快速上手。另外,每章均附習題,讓學習者可以從中快速抓齣課程重點,並檢核自己學習的效果。
4.附錄放入近年來受歡迎的R語言,輔以「股價分析」案例,以step by step的方式協助學習者快速上手
著者信息
圖書目錄
Chapter 01 簡介 第一節 為什麼Big Data 會受到重視 第二節 Big Data 的3V、4V 與5V 第三節 Big Data 的機會與挑戰 第四節 Big Data 在業界的應用實例
Chapter 02 預備知識 第一節 CAP & BASE 理論 第二節 BASE vs. ACID 第三節 雜湊錶與分散式雜湊錶的應用 第四節 為什麼關聯式資料庫在Big Data 的應用中會使不上力 第五節 分析Big Data 的方法 第六節 資料品質與知識發現模型 第七節 Big Data 應用的安全性與風險 第八節 分散式係統的設計要點
Chapter 03 演算法 第一節 Google MapReduce 第二節 Apache MapReduce 第三節 Apache Spark 第四節 Google Pregel 第五節 Apache Hama