具体描述
从事资料科学方面的工作时,活用各种相关函式库、软体框架、模组、工具包是很好的做法,但如果原本完全不懂资料科学,从头开始也是一种不错的做法。本书将採取土法炼钢从头学起的方式,带领读者认识与资料科学相关的许多工具与演算法。
你只要具备基本的数学能力,以及程式设计的基础,本书就可以帮你在遇到相关的数学与统计知识时,不至于感到害怕,而且还能让你学会一个资料科学家所需具备的相关骇客技术。如今到处充斥着各种杂乱的数据资料,其中包含许多问题的解答,但也有很多微妙之处,甚至连问题本身都还没被提出来过。如果你真心想要挖掘问题的解答,本书将可以提供你一些相关的知识。
.首先来一堂Python速成班
.学习线性代数、统计、机率的基础知识——并学会何时、如何在资料科学领域中灵活运用这些知识
.搜集、探索、清理、转换、处理各种数据资料
.深入理解机器学习的基础
.灵活运用像是k最近邻、单纯贝氏、线性与逻辑回归、决策树、神经网路、集群等种种模型
.探讨推荐系统、自然语言处理、网路分析、MapReduce与资料库的相关知识
好评推荐
「Joel带领我们领略探索资料科学,让我们从一般的好奇心,进入到更深入的理解,并学会所有资料科学家都应该知道的各种实用演算法。」 —— Rohit Sivaprasad, Soylent公司资料科学家
「对于想要了解机器学习的工程师而言,这是一本奠定基础的最佳入门书。」 -- Tom Marthaler, Amazon专案经理
「要将资料科学的概念转换为程式码并不容易,这本书让它变简单了。」 -- William Cox, Grubhub机器学习工程师