巨量资料时代来临,
你需要最新、最实用、功能最强的资料分析工具─R语言
R是一套自由免费的软体,具有入门容易、使用简单之特色,目前多应用于机器学习、资料探勘、文字探勘、统计分析及巨量资料分析等领域。
本书第1至5章先介绍R的基本操作及应用,包括认识R语言特性、资料读取及写入方式,接着介绍R的绘图功能及相关套件之运用;第6至9章介绍各类学习演算法,如:决策树、K平均算法、基因演算法等,每一章节都加入范例供读者即时练习;第10至12章介绍关联性规则、社群网路分析、文字探勘及图形化资料分析工具等内容,将R软体在资料分析上的使用作更完整的补充,对于没有程式设计经验的读者来说,本书是入门的最佳选择;第13章及14章加入巨量资料分析介绍,读者可先了解Hadoop基本原理并充分结合R与Hadoop之功能;读者亦可了解Spark基本原理并充分学习SparkR之功能,进而导引读者进入巨量资料分析的殿堂;第15章加入SparkR应用,读者可了解如何应用SparkR。
本书特色 1. 各章节皆附范例实作,帮助初学者从做中学,增加练习机会,同时培养自行撰写程式之能力。
2. 附录加入R、RStudio、Hadoop及Spark软体的下载及安装步骤,指令清楚、操作容易,让读者轻松完成安装。