Pandas資料分析實戰:使用Python進行高效能資料處理及分析 pdf epub mobi txt 電子書 下載 2024
圖書介紹
☆☆☆☆☆
簡體網頁||
繁體網頁
作者
出版者 齣版社:博碩 訂閱齣版社新書快訊 新功能介紹
翻譯者 譯者: 陳建宏
出版日期 齣版日期:2019/08/22
語言 語言:繁體中文
下載鏈接在頁面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
發表於2024-11-26
類似圖書 點擊查看全場最低價
圖書描述
掌握大數據資料處理與分析的必備套件:PANDAS
全方位瞭解Pandas程式庫的特性,進行高效能資料處理及分析
Pandas是Python底下、用於實際資料分析上很受歡迎的一個套件。它提供有效率、快速、高效能的資料結構,使得資料探索及分析非常簡易。本書將引導讀者熟悉Pandas程式庫提供的各項完整功能,以進行資料的操控及分析。你將學到在Python底下如何用
Pandas進行資料分析。我們從資料分析的概觀開始,接著反覆地進行資料建模、從遠端來源存取資料、利用索引進行數值及統計分析、執行聚閤分析,最後把統計資料視覺化,並且應用到金融領域。
從本書獲取這些知識後,不但可快速認識Pandas,也具備瞭將其應用到資料操作、資料分析、資料科學等領域的能力。
【適用讀者】
本書適閤資料科學傢、資料分析師、想用Pandas進行資料分析的Python程式設計師以及任何對資料分析感興趣的人閱讀。如果你具有一些統計及程式設計知識,則對於學習本書內容將會更有幫助,但是即使沒有統計及程式設計知識,或者沒有接觸過Pandas的經驗,也沒有關係。
【你能夠從本書學習到】
◎瞭解資料分析師及資料科學傢對於蒐集、解讀資料的看法。
◎瞭解Pandas如何支援全程的資料分析程序。
◎善用Pandas序列及資料框物件來錶示單變數及多變數資料。
◎利用Pandas切割資料,以及從多個來源進行資料的結閤、分組、聚閤等操作。
◎學習如何從外部來源,如檔案、資料庫以及網站服務存取資料。
◎錶示及操控時間序列資料,以及瞭解與此類資料相關的許多復雜之處。
◎學習如何將統計資料視覺化。
◎學習如何利用Pandas解決金融領域常見的幾個資料錶示及分析方麵的問題。
著者信息
作者簡介
Michael Heydt
Michael Heydt是技術專傢、企業傢、也是教育傢,擁有幾十年的軟體發展、金融及商品交易經驗。他在華爾街專精發展分散式、基於參與者、高效能、高可用性的交易係統這方麵有廣泛的經驗。他是Micro Trading Services公司的創辦人(一傢為金融及商品交易來打造雲端及微型服務軟體解決方案的公司)。他擁有Drexel大學的數學及電腦科學碩士學位,以及賓州大學應用科學院及華頓商學院的在職科技管理碩士學位。
Pandas資料分析實戰:使用Python進行高效能資料處理及分析 pdf epub mobi txt 電子書 下載
圖書目錄
Chapter 1:pandas及資料分析
1.1 pandas介紹
1.2 資料操控、分析、科學以及pandas
1.3 資料分析程序
1.4 本書章節與程序的關聯性
1.5 pandas旅程中必須具備的資料及分析觀念
1.6 pandas用到的其他Python程式庫
1.7 小結
Chapter 2:啓動並運行pandas
2.1 安裝Anaconda
2.2 IPython及Jupyter筆記本
2.3 介紹pandas序列及資料框
2.4 視覺化
2.5 小結
Chapter 3:用序列錶示單變數資料
3.1 設定pandas
3.2 建立序列
3.3 .index及.values屬性
3.4 序列的大小及形狀
3.5 在序列建立時指定索引
3.6 頭、尾、選取
3.7 以索引標簽或位置提取序列值
3.8 把序列切割成子集閤
3.9 利用索引標簽實現對齊
3.10 執行布林選擇
3.11 將序列重新索引
3.12 原地修改序列
3.13 小結
Chapter 4:用資料框錶示錶格及多變數資料
4.1 設定pandas
4.2 建立資料框物件
4.3 存取資料框的資料
4.4 利用布林選擇選取列
4.5 跨越行與列進行選取
4.6 小結
Chapter 5:操控資料框結構
5.1 設定pandas
5.2 重新命名行
5.3 利用[]及.insert()增加新行
5.4 利用擴展增加新行
5.5 利用串連增加新行
5.6 改變行的順序
5.7 取代行的內容
5.8 刪除行
5.9 附加新列
5.10 列的串連
5.11 經由擴展增加及取代列
5.12 使用.drop()移除列
5.13 利用布林選擇移除列
5.14 使用切割移除列
5.15 小結
Chapter 6:索引資料
6.1 設定pandas
6.2 索引的重要性
6.3 pandas 的索引型彆
6.4 使用索引
6.5 階層式索引
6.6 小結
Chapter 7:類彆資料
7.1 設定pandas
7.2 建立類彆物件
7.3 重新命名類彆
7.4 附加新類彆
7.5 移除類彆
7.6 移除未使用的類彆
7.7 設定類彆
7.8 類彆物件的敘述性資訊
7.9 學校成績轉換
7.10 小結
Chapter 8:數值與統計方法
8.1 設定pandas
8.2 對pandas物件執行算術運算
8.3 在pandas物件上執行統計程序
8.4 小結
Chapter 9:存取資料
9.1 設定pandas
9.2 處理CSV及文字/錶格格式的資料
9.3 讀寫Excel格式資料
9.4 讀寫JSON檔案
9.5 從網站讀取HTML資料
9.6 讀寫HDF5格式檔案
9.7 存取網站上的CSV資料
9.8 讀寫SQL資料庫
9.9 從遠端資料服務讀取資料
9.10 小結
Chapter 10:整理資料
10.1 設定pandas
10.2 資料整理的意涵
10.3 如何處理資料遺漏
10.4 處理重復資料
10.5 資料轉換
10.6 小結
Chapter 11:結閤、關聯以及重塑資料
11.1 設定pandas
11.2 串連幾個物件的資料
11.3 閤併與連結資料
11.4 資料值與索引的樞紐操作
11.5 堆疊與解堆疊
11.6 堆疊資料帶來的效能好處
11.7 小結
Chapter 12:資料聚閤
12.1 設定pandas
12.2 拆開、套用、結閤(SAC)模式
12.3 範例資料
12.4 拆開資料
12.5 套用聚閤函數、轉換以及過濾
12.6 轉換分組資料
12.7 過濾分組資料
12.8 小結
Chapter 13:時間序列建模
13.1 設定IPython筆記本
13.2 日期、時間、區間的錶示方法
13.3 時間序列資料簡介
13.4 使用偏移值計算新日期
13.5 利用Period錶示持續時間
13.6 處理日曆中的假日
13.7 利用時區正規化時間戳記
13.8 操控時間序列資料
13.9 時間序列的移動視窗運算
13.10 小結
Chapter 14:視覺化
14.1 設定pandas
14.2 Pandas的基本繪圖
14.3 建立時間序列圖錶
14.4 統計分析常見的繪圖
14.5 在單一圖錶中手動顯示多張繪圖
14.6 小結
Chapter 15:曆史股價分析
15.1 設定IPython筆記本
15.2 從Google取得與組織股票資料
15.3 繪製股價時間序列的圖
15.4 繪製成交量序列的圖
15.5 計算簡易的每日收盤價變化百分比
15.6 計算簡易的股票每日纍積報酬率
15.7 將每日報酬率重新取樣為每月報酬率
15.8 分析報酬率分布
15.9 移動平均計算
15.10 比較股票之間的平均每日報酬率
15.11 依每日收盤價的變化百分比找齣股票相關性
15.12 計算股票波動率
15.13 決定風險相對於期望報酬率的關係
15.14 小結
圖書序言
圖書試讀
None
Pandas資料分析實戰:使用Python進行高效能資料處理及分析 epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
Pandas資料分析實戰:使用Python進行高效能資料處理及分析 epub 下載 mobi 下載 pdf 下載 txt 電子書 下載 2024
Pandas資料分析實戰:使用Python進行高效能資料處理及分析 pdf epub mobi txt 電子書 下載 2024
用戶評價
類似圖書 點擊查看全場最低價
Pandas資料分析實戰:使用Python進行高效能資料處理及分析 pdf epub mobi txt 電子書 下載