什么是坏资料?有些人认为它是一个技术性的现象,如遗失值或是格式不对的记录,但坏资料其实不只如此。资料专家Q. Ethan McCallum邀请了资料领域中,具有不同身分,包含公司执行长、政府官员、科学家、大学教授、程式设计师的19位专家,分享他们处理坏资料问题的方法与心得。
从有问题的储存、贫乏的表述到错误的政策,造成坏资料有许多的可能。总结来说,坏资料就是会阻碍你的资料。本书提供一些有效的解决方法。
本书涵盖许多主题,包括:
.测试你的资料,来看它是否准备好被用作分析
.将电子试算表转换为可被使用的表格
.处理在文字资料中隐藏的编码问题
.开发一个成功的网页抓取机制
.使用NLP工具来揭露线上评论的真实情绪
.提出可能会影响你的分析的云端运算议题
.防止会阻碍资料分析的政策
.使用系统性的方法来分析资料品质
作者简介:
Q. Ethan McCallum
Q. Ethan McCallum是一位顾问、作家以及科技狂热者。他的文章出现在The O’Reilly Network以及Java.net的网站上,着有《C/C++ Users Journal》、《Doctor Dobb’s Journal》等书。他主要的工作,是帮助公司作出对资料以及技术的明智决策。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有