随着大数据时代的到来,企业资料每天都在急剧快速膨胀,如何发掘这些资料的价值,需要一种高效而稳定的分散式运算框架和模型。Spark恰逢其时,应运而生。本书对Spark进行详细的阐述,包括核心模组和各个子系统,能让Spark初学者快速了解和上手,是学习Spark的敲门砖,希望此书能让更多的读者去深入发掘Spark之美。
-淘宝技术部资料採撷与计算团队负责人 黄明(明风)
Apache Spark由于其基于记忆体的高性能计算模式以及丰富灵活的程式设计介面,得到广泛的支援和应用,大有逐渐取代Hadoop MapReduce成为新一代大数据计算引擎的趋势。本书从原始程式码角度深入浅出地分析了Apache Spark及相关大数据技术的设计及实现,包含很多实战经验和使用心得。相信本书对于进行大数据、记忆体计算及分散式系统研究,Apache Spark的深入理解以及实际应用,都有很好的参考价值。
-英特尔亚太研发有限公司技术总监 段建刚