大数据的下一步:用Spark玩转活用(第2版) pdf epub mobi txt 电子书 下载 2024
图书介绍
☆☆☆☆☆
简体网页||
繁体网页
著者
出版者 出版社:佳魁资讯 订阅出版社新书快讯 新功能介绍
翻译者
出版日期 出版日期:2017/03/01
语言 语言:繁体中文
下载链接在页面底部
点击这里下载
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
发表于2024-11-20
类似图书 点击查看全场最低价
图书描述
适用:从事安防监控领域的应用开发和工程施工的技术人员。
名人推荐
随着大数据时代的到来,企业资料每天都在急剧快速膨胀,如何发掘这些资料的价值,需要一种高效而稳定的分散式运算框架和模型。Spark恰逢其时,应运而生。本书对Spark进行详细的阐述,包括核心模组和各个子系统,能让Spark初学者快速了解和上手,是学习Spark的敲门砖,希望此书能让更多的读者去深入发掘Spark之美。~~淘宝技术部资料採撷与计算团队负责人 黄明(明风)
Apache Spark由于其基于记忆体的高性能计算模式以及丰富灵活的程式设计介面,得到广泛的支援和应用,大有逐渐取代Hadoop MapReduce成为新一代大数据计算引擎的趋势。本书从原始程式码角度深入浅出地分析了Apache Spark及相关大数据技术的设计及实现,包含很多实战经验和使用心得。相信本书对于进行大数据、记忆体计算及分散式系统研究,Apache Spark的深入理解以及实际应用,都有很好的参考价值。~~英特尔亚太研发有限公司技术总监 段建刚
著者信息
作者简介
夏俊鸾
现任阿里巴巴资料平台部高级技术专家,Apache Spark项目Committer,曾就职于英特尔亚太研发中心,微博帐号@Andrew-Xia。
刘旭晖
现任蘑菇街资料平台资深架构师(花名天火),曾就职于英特尔亚太研发中心大资料软体部,Spark/Hadoop/Hbase/Phoenix 等众多大资料相关开源专案的积极贡献者。
邵赛赛
英特尔亚太研发有限公司开发工程师,专注于大资料领域,现从事Spark相关工作,Spark代码贡献者。
程浩
英特尔大资料技术团队软体工程师,Shark和Spark SQL活跃开发者,致力于SQL on Big Data的性能最佳化。
史鸣飞
英特尔亚太研发有限公司大资料软体部工程师,专注于大资料领域,现在主要投身于Tachyon项目的开发。
黄洁
目前就职于英特尔亚太研发中心大资料技术中心,担任高级软体工程师,是Apache Chukwa专案的PMC成员和Committer。
大数据的下一步:用Spark玩转活用(第2版) pdf epub mobi txt 电子书 下载
图书目录
前言
Chapter 01 Spark 系统概述
1.1 大数据处理架构
1.2 Spark 大数据处理架构
1.3 小结
Chapter 02 Spark RDD 及程式设计介面
2.1 Spark 程式"Hello World"
2.2 Spark RDD
2.3 建立操作
2.4 转换操作
2.5 控制操作(control operation)
2.6 行动操作(action operation)
2.7 小结
Chapter 03 Spark 执行模式及原理
3.1 Spark 执行模式概述
3.2 Local 模式
3.3 Standalone 模式
3.4 Local cluster 模式
3.5 Mesos 模式
3.6 YARN standalone / YARN cluster 模式
3.7 YARN client 模式
3.8 各种模式的实现细节比较
3.9 Spark 1.0 版本之后的变化
3.10 小结
Chapter 04 Spark 排程管理原理
4.1 Spark 作业排程管理概述
4.2 Spark 排程相关基本概念
4.3 作业排程模组顶层逻辑概述
4.4 作业排程实际工作流程
4.5 工作集管理模组详解
4.6 排程池和排程模式分析
4.7 其他排程相关内容
4.8 小结
Chapter 05 Spark 的储存管理
5.1 储存管理模组整体架构
5.2 RDD 持久化
5.3 Shuffle 资料持久化
5.4 广播(Broadcast)变数持久化
5.5 小结
Chapter 06 Spark 监控管理
6.1 UI 管理
6.2 Metrics 管理
6.3 小结
Chapter 07 Shark 架构与安装设定
7.1 Shark 架构浅析
7.2 Hive/Shark 各功能元件比较
7.3 Shark 安装设定与使用
7.4 Shark SQL 命令列工具(CLI)
7.5 使用Shark Shell 指令
7.6 启动SharkServer
7.7 Shark Server2 设定与启动
7.8 快取资料表
7.9 常见问题分析
7.10 小结
Chapter 08 SQL 程式扩充
8.1 程式扩充平行执行模式
8.2 Evaluator 和ObjectInspector
8.3 自订函数扩充
8.4 自订资料存取格式
8.5 小结
Chapter 09 Spark SQL
9.1 Spark SQL 逻辑架构
9.2 Catalyst 上下文(Context)
9.3 SQL DSL API
9.4 Java API
9.5 Python API
9.6 Spark SQL CLI
9.7 Thrift 服务
9.8 小结
Chapter10 Spark Streaming 串流资料处理架构
10.1 快速入门
10.2 Spark Streaming 基本概念
10.3 效能最佳化
10.4 容错处理
10.5 DStream 作业的产生和排程
10.6 DStream 与RDD 关系
10.7 资料接收原理
10.8 自订资料登录源
10.9 自订监控介面(StreamingListener)
10.10 Spark Streaming 案例分析
10.11 小结
Chapter 11 GraphX 计算架构
11.1 图型平行计算
11.2 GraphX 模型设计
11.3 GraphX 模型实现
11.4 GraphX 应用
11.5 小结
Chapter 12 Tachyon 储存系统
12.1 设计原理
12.2 架构设计
12.3 Tachyon 的部署
12.4 Tachyon 应用
12.5 相关专案讨论
12.6 小结
图书序言
图书试读
None
大数据的下一步:用Spark玩转活用(第2版) epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2024
大数据的下一步:用Spark玩转活用(第2版) epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2024
大数据的下一步:用Spark玩转活用(第2版) pdf epub mobi txt 电子书 下载 2024
用户评价
类似图书 点击查看全场最低价
大数据的下一步:用Spark玩转活用(第2版) pdf epub mobi txt 电子书 下载