Bad Data技术手册

Bad Data技术手册 pdf epub mobi txt 电子书 下载 2025

想要找书就要到 小特书站
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

  什么是坏资料?有些人认为它是一个技术性的现象,如遗失值或是格式不对的记录,但坏资料其实不只如此。资料专家Q. Ethan McCallum邀请了资料领域中,具有不同身分,包含公司执行长、政府官员、科学家、大学教授、程式设计师的19位专家,分享他们处理坏资料问题的方法与心得。

  从有问题的储存、贫乏的表述到错误的政策,造成坏资料有许多的可能。总结来说,坏资料就是会阻碍你的资料。本书提供一些有效的解决方法。

  本书涵盖许多主题,包括:

  .测试你的资料,来看它是否准备好被用作分析
  .将电子试算表转换为可被使用的表格
  .处理在文字资料中隐藏的编码问题
  .开发一个成功的网页抓取机制
  .使用NLP工具来揭露线上评论的真实情绪
  .提出可能会影响你的分析的云端运算议题
  .防止会阻碍资料分析的政策
  .使用系统性的方法来分析资料品质

作者简介:

Q. Ethan McCallum

  Q. Ethan McCallum是一位顾问、作家以及科技狂热者。他的文章出现在The O’Reilly Network以及Java.net的网站上,着有《C/C++ Users Journal》、《Doctor Dobb’s Journal》等书。他主要的工作,是帮助公司作出对资料以及技术的明智决策。

著者信息

图书目录

chapter 01 调整步伐:什么是坏资料?
chapter 02 是只有我这样,还是这个资料本身令人感到有趣?
chapter 03 资料是要给人类使用,而非给机器使用
chapter 04 隐藏在纯文字中的坏资料
chapter 05 (重新)组织网站的资料
chapter 06 在矛盾的线上评论中侦测谎言以及混乱的状况
chapter 07 可否请坏资料站出来?
chapter 08 血、汗与尿
chapter 09 当资料与现实并不相符时
chapter 10 偏颇与错误的微妙来源
chapter 11 别让「完美」成为「好」的敌人:坏资料真的坏吗?
chapter 12 当资料库攻击时:何时要坚持使用档案的导引
chapter 13 卧库表,藏网路
chapter 14 云端运算的迷思
chapter 15 资料科学的黑暗面
chapter 16 要如何餵养以及照护你的机器学习专家
chapter 17 资料可追踪性
chapter 18 社群媒体:可抹除式墨水?
chapter 19 揭开资料品质分析的神秘面纱:了解何时你的资料已经够好了
索引

图书序言

图书试读

None

用户评价

相关图书

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 ttbooks.qciss.net All Rights Reserved. 小特书站 版权所有