大数据时代的资料库处理:Spark SQL亲自动手做(热销版) pdf epub mobi txt 电子书 下载 2025
图书介绍
☆☆☆☆☆
简体网页||
繁体网页
著者
出版者 出版社:佳魁资讯 订阅出版社新书快讯 新功能介绍
翻译者
出版日期 出版日期:2019/10/04
语言 语言:繁体中文
下载链接在页面底部
点击这里下载
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
发表于2025-01-25
类似图书 点击查看全场最低价
图书描述
全书分为4篇,共9章,第一篇讲解Spark SQL 发展历史和开发环境搭建。第二篇讲解Spark SQL 实例,帮助读者掌握Spark SQL的入门操作,了解Spark RDD、DataFrame和DataSet,并熟悉 DataFrame 各种操作。第三篇讲解基于WiFi探针的商业大数据分析专案,实例中包含资料获取、预处理、存储、利用Spark SQL 挖掘资料,一步步带领读者学习Spark SQL强大的资料採撷功能。第四篇讲解Spark SQL 最佳化的知识。
适用:Spark初学者、Spark资料分析人员以及Spark程式开发人员,也可作为大专院校和培训机构等相关专业的师生教学参考。
本书特色
Spark SQL是 Spark大数据框架的一部分,支援使用标准SQL查询和HiveQL来读写资料,可用于结构化资料处理,并可以执行类似SQL的Spark资料查询,有助于开发人员更快地建置和执行Spark程式。
著者信息
作者简介
纪涵
资料採撷、云计算爱好者,曾负责多个中小型网站的开发维护工作,参与开发设计多款面向校园服务的App,与多个基于Hadoop、Spark平台的大数据应用,现主要研究方向为机器学习、资料採撷。
大数据时代的资料库处理:Spark SQL亲自动手做(热销版) pdf epub mobi txt 电子书 下载
图书目录
第一部分 入门篇
1初识Spark SQL
1.1 Spark SQL的前世今生
1.2 Spark SQL能做什么
2 Spark安装、程式设计环境架设以及包装传送
2.1 Spark的简易安装
2.2 准备撰写Spark应用程式的IDEA环境
2.3 将撰写好的Spark应用程式套件装成jar传送到Spark上
第二部分 基础篇
3 Spark上的RDD程式设计
3.1 RDD基础
3.2 RDD简单实例—wordcount
3.3 建立RDD
3.4 RDD操作
3.5 向Spark传递函数
3.6 常见的转化操作和行动操作
3.7 深入了解RDD
3.8 RDD 快取、持久化
3.9 RDD checkpoint容错机制
4 Spark SQL程式设计入门
4.1 Spark SQL概述
4.2 Spark SQL程式设计入门范例
5 Spark SQL的DataFrame操作大全
5.1 由JSON档案产生所需的DataFrame物件
5.2 DataFrame上的行动操作
5.3 DataFrame上的转化操作
6 Spark SQL支援的多种资料来源
6.1 概述
6.2 典型结构化资料来源
第三部分 实作篇
7 Spark SQL 工程实战之以WiFi探针为基础的商业大数据分析技术
7.1 功能需求
7.2 系统架构
7.3 功能设计
7.4 资料库结构
7.5 本章小结
8 第一个Spark SQL应用程式
8.1 完全分散式环境架设
8.2 资料清洗
8.3 资料处理流程
8.4 Spark程式远端侦错
8.5 Spark的Web介面
8.6 本章小结
第四部分 最佳化篇
9 让Spark程式再快一点
9.1 Spark执行流程
9.2 Spark记忆体简介
9.3 Spark的一些概念
9.4 Spark程式设计四大守则
9.5 Spark最佳化七式
9.6 解决资料倾斜问题
9.7 Spark 执行引擎Tungsten 简介
9.8 Spark SQL解析引擎Catalyst 简介
9.9 本章小结
图书序言
图书试读
None
大数据时代的资料库处理:Spark SQL亲自动手做(热销版) epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2025
大数据时代的资料库处理:Spark SQL亲自动手做(热销版) epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2025
大数据时代的资料库处理:Spark SQL亲自动手做(热销版) pdf epub mobi txt 电子书 下载 2025
用户评价
类似图书 点击查看全场最低价
大数据时代的资料库处理:Spark SQL亲自动手做(热销版) pdf epub mobi txt 电子书 下载