Pandas资料分析实战:使用Python进行高效能资料处理及分析 pdf epub mobi txt 电子书 下载 2025
图书介绍
☆☆☆☆☆
简体网页||
繁体网页
著者
出版者 出版社:博硕 订阅出版社新书快讯 新功能介绍
翻译者 译者: 陈建宏
出版日期 出版日期:2019/08/22
语言 语言:繁体中文
下载链接在页面底部
点击这里下载
立刻按 ctrl+D收藏本页
你会得到大惊喜!!
发表于2025-01-21
类似图书 点击查看全场最低价
图书描述
掌握大数据资料处理与分析的必备套件:PANDAS
全方位了解Pandas程式库的特性,进行高效能资料处理及分析
Pandas是Python底下、用于实际资料分析上很受欢迎的一个套件。它提供有效率、快速、高效能的资料结构,使得资料探索及分析非常简易。本书将引导读者熟悉Pandas程式库提供的各项完整功能,以进行资料的操控及分析。你将学到在Python底下如何用
Pandas进行资料分析。我们从资料分析的概观开始,接着反覆地进行资料建模、从远端来源存取资料、利用索引进行数值及统计分析、执行聚合分析,最后把统计资料视觉化,并且应用到金融领域。
从本书获取这些知识后,不但可快速认识Pandas,也具备了将其应用到资料操作、资料分析、资料科学等领域的能力。
【适用读者】
本书适合资料科学家、资料分析师、想用Pandas进行资料分析的Python程式设计师以及任何对资料分析感兴趣的人阅读。如果你具有一些统计及程式设计知识,则对于学习本书内容将会更有帮助,但是即使没有统计及程式设计知识,或者没有接触过Pandas的经验,也没有关系。
【你能够从本书学习到】
◎了解资料分析师及资料科学家对于蒐集、解读资料的看法。
◎了解Pandas如何支援全程的资料分析程序。
◎善用Pandas序列及资料框物件来表示单变数及多变数资料。
◎利用Pandas切割资料,以及从多个来源进行资料的结合、分组、聚合等操作。
◎学习如何从外部来源,如档案、资料库以及网站服务存取资料。
◎表示及操控时间序列资料,以及了解与此类资料相关的许多复杂之处。
◎学习如何将统计资料视觉化。
◎学习如何利用Pandas解决金融领域常见的几个资料表示及分析方面的问题。
著者信息
作者简介
Michael Heydt
Michael Heydt是技术专家、企业家、也是教育家,拥有几十年的软体发展、金融及商品交易经验。他在华尔街专精发展分散式、基于参与者、高效能、高可用性的交易系统这方面有广泛的经验。他是Micro Trading Services公司的创办人(一家为金融及商品交易来打造云端及微型服务软体解决方案的公司)。他拥有Drexel大学的数学及电脑科学硕士学位,以及宾州大学应用科学院及华顿商学院的在职科技管理硕士学位。
Pandas资料分析实战:使用Python进行高效能资料处理及分析 pdf epub mobi txt 电子书 下载
图书目录
Chapter 1:pandas及资料分析
1.1 pandas介绍
1.2 资料操控、分析、科学以及pandas
1.3 资料分析程序
1.4 本书章节与程序的关联性
1.5 pandas旅程中必须具备的资料及分析观念
1.6 pandas用到的其他Python程式库
1.7 小结
Chapter 2:启动并运行pandas
2.1 安装Anaconda
2.2 IPython及Jupyter笔记本
2.3 介绍pandas序列及资料框
2.4 视觉化
2.5 小结
Chapter 3:用序列表示单变数资料
3.1 设定pandas
3.2 建立序列
3.3 .index及.values属性
3.4 序列的大小及形状
3.5 在序列建立时指定索引
3.6 头、尾、选取
3.7 以索引标签或位置提取序列值
3.8 把序列切割成子集合
3.9 利用索引标签实现对齐
3.10 执行布林选择
3.11 将序列重新索引
3.12 原地修改序列
3.13 小结
Chapter 4:用资料框表示表格及多变数资料
4.1 设定pandas
4.2 建立资料框物件
4.3 存取资料框的资料
4.4 利用布林选择选取列
4.5 跨越行与列进行选取
4.6 小结
Chapter 5:操控资料框结构
5.1 设定pandas
5.2 重新命名行
5.3 利用[]及.insert()增加新行
5.4 利用扩展增加新行
5.5 利用串连增加新行
5.6 改变行的顺序
5.7 取代行的内容
5.8 删除行
5.9 附加新列
5.10 列的串连
5.11 经由扩展增加及取代列
5.12 使用.drop()移除列
5.13 利用布林选择移除列
5.14 使用切割移除列
5.15 小结
Chapter 6:索引资料
6.1 设定pandas
6.2 索引的重要性
6.3 pandas 的索引型别
6.4 使用索引
6.5 阶层式索引
6.6 小结
Chapter 7:类别资料
7.1 设定pandas
7.2 建立类别物件
7.3 重新命名类别
7.4 附加新类别
7.5 移除类别
7.6 移除未使用的类别
7.7 设定类别
7.8 类别物件的叙述性资讯
7.9 学校成绩转换
7.10 小结
Chapter 8:数值与统计方法
8.1 设定pandas
8.2 对pandas物件执行算术运算
8.3 在pandas物件上执行统计程序
8.4 小结
Chapter 9:存取资料
9.1 设定pandas
9.2 处理CSV及文字/表格格式的资料
9.3 读写Excel格式资料
9.4 读写JSON档案
9.5 从网站读取HTML资料
9.6 读写HDF5格式档案
9.7 存取网站上的CSV资料
9.8 读写SQL资料库
9.9 从远端资料服务读取资料
9.10 小结
Chapter 10:整理资料
10.1 设定pandas
10.2 资料整理的意涵
10.3 如何处理资料遗漏
10.4 处理重复资料
10.5 资料转换
10.6 小结
Chapter 11:结合、关联以及重塑资料
11.1 设定pandas
11.2 串连几个物件的资料
11.3 合併与连结资料
11.4 资料值与索引的枢纽操作
11.5 堆叠与解堆叠
11.6 堆叠资料带来的效能好处
11.7 小结
Chapter 12:资料聚合
12.1 设定pandas
12.2 拆开、套用、结合(SAC)模式
12.3 范例资料
12.4 拆开资料
12.5 套用聚合函数、转换以及过泸
12.6 转换分组资料
12.7 过泸分组资料
12.8 小结
Chapter 13:时间序列建模
13.1 设定IPython笔记本
13.2 日期、时间、区间的表示方法
13.3 时间序列资料简介
13.4 使用偏移值计算新日期
13.5 利用Period表示持续时间
13.6 处理日历中的假日
13.7 利用时区正规化时间戳记
13.8 操控时间序列资料
13.9 时间序列的移动视窗运算
13.10 小结
Chapter 14:视觉化
14.1 设定pandas
14.2 Pandas的基本绘图
14.3 建立时间序列图表
14.4 统计分析常见的绘图
14.5 在单一图表中手动显示多张绘图
14.6 小结
Chapter 15:历史股价分析
15.1 设定IPython笔记本
15.2 从Google取得与组织股票资料
15.3 绘制股价时间序列的图
15.4 绘制成交量序列的图
15.5 计算简易的每日收盘价变化百分比
15.6 计算简易的股票每日累积报酬率
15.7 将每日报酬率重新取样为每月报酬率
15.8 分析报酬率分布
15.9 移动平均计算
15.10 比较股票之间的平均每日报酬率
15.11 依每日收盘价的变化百分比找出股票相关性
15.12 计算股票波动率
15.13 决定风险相对于期望报酬率的关系
15.14 小结
图书序言
图书试读
None
Pandas资料分析实战:使用Python进行高效能资料处理及分析 epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2025
Pandas资料分析实战:使用Python进行高效能资料处理及分析 epub 下载 mobi 下载 pdf 下载 txt 电子书 下载 2025
Pandas资料分析实战:使用Python进行高效能资料处理及分析 pdf epub mobi txt 电子书 下载 2025
用户评价
类似图书 点击查看全场最低价
Pandas资料分析实战:使用Python进行高效能资料处理及分析 pdf epub mobi txt 电子书 下载