资料汇入、整理、变换、视觉化与模型建立
「Hadley Wickham是资料科学领域的传奇,发明了一种从来没人想过的全新方式来进行资料分析。他与Garrett Grolemund合着的这本新书详细介绍了这种创新做法,它将会成为当代资料分析师的圣经。」 ─Roger D. Peng, 生物统计学教授 Johns Hopkins大学Bloomberg公共卫生学院
学习如何使用R将原始资料转化为洞见、知识和理解。本书为你介绍R、RStudio,还有tidyverse这个R套件集合,你将学会运用其中相辅相成的套件,使资料科学变得快速,流畅和有趣。《R 资料科学》是为了让你能够尽快开始实作资料科学而设计,适合以前没有程式设计经验的读者。
作者Hadley Wickham和Garrett Grolemund将引导你走过资料的汇入、整理、探索,以及建立模型和传达结果这些步骤。你将全面理解资料科学的运作週期,并获得管理其中细节所需的基本工具。
你会学到如何 ■ Wrangle:将你的资料集转为方便分析的形式
■ Program:使用强大的R工具以更清楚且轻松的方式解决资料问题
■ Explore:审查你的资料,产生假设,并快速地测试它们
■ Model:提供低维摘要,捕捉你资料集所含的真实「讯号」
■ Communicate:使用R Markdown来整合说明文字、程式码以及结果