具体描述
运用各种资料分析套件和统计模型, 解决大数据时代所会遇到的各种难题
R 语言是公认处理大数据的最佳利器, 不只免费、语法简单、直觉, 还具备数千个功能强大的延伸套件, 更让 R 语言深入各种不同的应用领域。本书由国际知名的资料分析专家执笔, 作者具备丰富的 R 语言教学经验, 从中筛选出 R 的基本功能和最新、最好用的套件, 并以各种资料集案例, 具体展现资料分析成果。
对于有心跨足资料科学、数据分析、量化交易、人工智慧、机器学习等领域的读者, 只会 R 语言的语法自然是不够的。我们将带您运用各种资料分析套件和统计模型, 解决大数据时代所会遇到的各种难题, 包括:向量运算、文字探勘、资料视觉化、趋势预测、资料建模, 以及各种分析结果的输出、引用与动态呈现等, 全面掌握 R 语言的各种技巧。
本书特色
●向量运算:全向量化的资料结构, 包括:vector、factor vector、data.frame、list、matrix、array 等
●文字探勘:各类资料汇入读取、抽取字串、表格转换与合併、资料聚合、资料正规化、网路爬虫
●资料视觉化:最吸睛的 ggplot2 套件图表绘制技巧, 并利用 Shiny 套件产生网页互动展示仪表板
●机率统计:快速领略统计学核心应用, 抽样分佈、假设检定、变异数分析、资料分群
●趋势预测:展现大数据威力的强力工具, 线性回归、广义线性模型、非线性模型、时间序列与自相关性
●资料建模:机器学习的基础, 利用 Caret 评断资料模型配适度, 建立资料测试与训练机制, 透过交叉验证和参数挑选建立最佳模式
●进阶应用:资料分析师必学的套件包装与发佈、报表/投影片制作、制式化文件输出等