1. 程式人生 > >pandas創始人手把手教你利用Python進行資料分析(思維導圖)

pandas創始人手把手教你利用Python進行資料分析(思維導圖)

640?wx_fmt=gif

導讀:Python是目前資料科學領域的王者語言,眾多科學家、工程師、分析師都使用它來完成資料相關的工作。由於Python具有簡單易學、語法靈活的特點,很多需要處理資料的人士想要學習,主要有兩大類:

  • 財經類、統計類背景人員,他們的日常工作有大量資料需要處理、分析,但對於學習使用計算機領域的程式語言Python又感到無從下手。

  • 一些想要學習Python的計算機人員,他們工作較忙,沒有太多時間通過網際網路去系統學習Python資料技術

針對這兩類人員的需求,近期出版上市的《利用Python進行資料分析》第2版是很好的選擇。下面我們結合本書內容,大致介紹下如何利用Python進行資料分析。

640?wx_fmt=png

01 Python資料分析流程及學習路徑

資料分析的流程概括起來主要是:讀寫處理計算分析建模視覺化四個部分。在不同的步驟中會用到不同的Python工具。每一步的主題也包含眾多內容。

640?wx_fmt=png

根據每個部分需要用到的工具,Python資料分析的學習路徑如下:

640?wx_fmt=png

02 利用Python讀寫資料

Python讀寫資料,主要包括以下內容:

640?wx_fmt=png

我們以一小段程式碼來看:

640?wx_fmt=png

可見,僅需簡短的兩三行程式碼即可實現Python讀入EXCEL檔案。

03 利用Python處理和計算資料

640?wx_fmt=png

在第一步和第二步,我們主要使用的是Python的工具庫NumPy和pandas。其中,NumPy主要用於向量化的科學計算,pandas主要用於表型資料處理。

640?wx_fmt=png

▲NumPy

640?wx_fmt=png

▲pandas

04 利用Python分析建模

640?wx_fmt=png

在分析和建模方面,本書主要介紹了Statsmdels和Scikit-learn兩個庫。

.Statsmodels允許使用者瀏覽資料,估計統計模型和執行統計測試。可以為不同型別的資料和每個估算器提供廣泛的描述性統計,統計測試,繪圖函式和結果統計列表。

640?wx_fmt=png

.Statsmodels

Scikit-leran則是著名的機器學習庫,可以迅速使用各類機器學習演算法。

640?wx_fmt=png

▲Scikit-leran

05 利用Python資料視覺化

640?wx_fmt=png

資料視覺化是資料工作中的一項重要內容,它可以輔助分析也可以展示結果。本書主要介紹了Python眾多視覺化庫中最為主流的Matplotlib:

640?wx_fmt=png

06 總結:為什麼要選這本書

《利用Python進行資料分析》第2版原作者是美國的資料科學家Wes McKinney,他畢業於麻省理工學院,是大名鼎鼎的Python資料技術類庫pandas的創始人,在多家投資銀行從事過資料科學類的工作。本書第一版由Wes McKinney寫於2010年,經過7年的技術發展,第一版中的部分技術已不再適用,因此他於2017年發表了本書的第二版,對書中的大量技術、程式碼、示例進行了更新。由於本書大受好評,國內旋即引進。

關於作者:徐敬一,是《利用Python進行資料分析》第2版的譯者,中國工商銀行的資料分析師,他在工作中大量使用各類Python資料技術,對於Python的數學科學技術棧十分了解,同時英語水平良好,使本書的翻譯質量得以保證。

延伸閱讀《利用Python進行資料分析

轉載請聯絡微信:togo-maruko

點選文末右下角“寫留言”發表你的觀點

推薦語:適合剛學Python的資料分析師或剛學資料科學以及科學計算的Python程式設計者。閱讀本書可以獲得一份關於在Python下操作、處理、清洗、規整資料集的完整說明。

640?wx_fmt=gif

更多精彩

在公眾號後臺對話方塊輸入以下關鍵詞

檢視更多優質內容!

PPT|報告|讀書|書單| 乾貨

Python | 機器學習 | 深度學習 | 神經網路

區塊鏈 | 揭祕 | 高考 | 福利

推薦閱讀

Q: 你都在用Python做什麼

歡迎留言與大家分享

覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:[email protected]

更多精彩,請在後臺點選“歷史文章”檢視

640?wx_fmt=jpeg

相關推薦

利用 Python 進行資料分析十二pandas資料合併

原文地址 pandas 提供了三種主要方法可以對資料進行合併: pandas.merge()方法:資料庫風格的合併;pandas.concat()方法:軸向連線,即沿著一條軸將多個物件堆疊到一起;例項方法combine_first()方法:合併重疊資料。 pandas

利用python進行資料分析第二版 pdf下載

適讀人群 :適合剛學Python的資料分析師或剛學資料科學以及科學計算的Python程式設計者。 閱讀本書可以獲得一份關於在Python下操作、處理、清洗、規整資料集的完整說明。本書第二版針對Python 3.6進行了更新,並增加實際案例向你展示如何高效地解決一系列資料分析問題。你將在閱讀

獨家 | 手把手Python進行Web抓取附程式碼

作為一名資料科學家,我在工作中所做的第一件事就是網路資料採集。使用程式碼從網站收集資料,當時對我來說是一個完全陌生的概念,但它是最合理、最容易獲取的資料來源之一。經過幾次嘗試,網路抓取已經成為我的第二天性,也是我幾乎每天使用的技能之一。 在本教程中,我將介紹一個簡單的例子,說明如何抓取一個網站,

資料基礎---《利用Python進行資料分析·第2版》第12章 pandas高階應用

之前自己對於numpy和pandas是要用的時候東學一點西一點,直到看到《利用Python進行資料分析·第2版》,覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。 前面的章節關注於不同型別的資料規整流程和NumPy、pandas與其它庫的特點。隨著時間的發展,pandas發展出了更多適

資料基礎---《利用Python進行資料分析·第2版》第5章 pandas入門

之前自己對於numpy和pandas是要用的時候東學一點西一點,直到看到《利用Python進行資料分析·第2版》,覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。 pandas是本書後續內容的首選庫。它含有使資料清洗和分析工作變得更快更簡單的資料結構和操作工具。pandas經常和其它工

手把手Python金融財務分析

內容來自:微信公眾號:python金融量化 關注可瞭解更多的金融與Python乾貨。 內容目錄 貨幣時間價值 年金計算 實際利率 專案投資分析 單利與複利增長 關於CuteHand 1. 貨幣時間價值 實際上numpy和scipy很強大,

Python量化】手把手python做股票分析入門

內容來自:微信公眾號:python金融量化 關注可瞭解更多的金融與Python乾貨。 目前,獲取股票資料的渠道有很多,而且基本上是免費的,比如,行情軟體有同花順、東方財富等,入口網站有新浪財經、騰訊財經、和訊網等。Python也有不少免費的開源api可以獲取交易行情資料,如pandas自

利用python進行資料分析-pandas入門2

1.索引物件 pandas的索引物件負責管理軸標籤和其它元資料。構建Series或DataFrame時,所用到的任何陣列或其它序列的標籤都會被轉換成一個Index obj=Series(range(3

利用Python進行資料分析(15) pandas基礎: 字串操作

字串物件方法 split()方法拆分字串: strip()方法去掉空白符和換行符: split()結合strip()使用: "+"符號可以將多個字串連線起來: join()方法也是連線字串,比較它和"+"符號的區別: in關鍵字判斷一個字串是否包含在另一個字串中: index()方法

大神手把手:(Python)序列資料的One Hot編碼

原文連結 機器學習演算法無法直接用於資料分類。資料分類必須轉換為數字才能進一步進行。 在本教程中,你將發現如何將輸入或輸出的序列資料轉換為一種熱編碼,以便於你在Python中深度學習的序列分類問題中使用。 看完本教程後,你將會了解: · 1.什麼是整

利用python進行資料分析學習筆記-Pandas

無論如何,堅持啊! pandas的資料結構 Series obj = Series([]) #產生一個Series obj = Series({})#可以通過引入一個dict來建立一個Series 包括values和index兩個屬性,而valu

手把手python第十三講MRO詳解和神奇的魔法方法

如果圖片刷不出來,轉到https://www.bilibili.com/read/cv286207MRO重製關於MRO和C3演算法,我又去看了一些文章,然後發現了講的很清楚的文章http://kaiyuan.me/2016/04/27/C3_linearization/。裡面

利用Python進行資料分析》第五章 pandas的基本功能

介紹操作Series和DataFrame中的資料的基本功能 重新索引 pandas物件的一個重要方法是reindex,其作用是建立一個適應新索引的新物件。以之前的一個簡單示例來說 In [1]: from pandas import Series,Da

利用python進行資料分析-pandas入門3

1.函式應用和對映 NumPy的ufuncs(元素級陣列方法)也可用於操作pandas物件 frame=DataFrame(np.random.randn(4,3),columns=list('bde

利用Python進行資料分析》第五章-pandas資料結構介紹

pandas的資料結構介紹 要使用pandas,你首先就得熟悉它的兩個主要資料結構:Series和DataFrame。雖然它們並不能解決所有問題,但它們為大多數應用提供了一種可靠的、易於使用的基礎。 In [1]: from pandas import

spark | 手把手用spark進行資料預處理

本文始發於個人公眾號:**TechFlow**,原創不易,求個關注 今天是spark專題的第七篇文章,我們一起看看spark的資料分析和處理。 過濾去重 在機器學習和資料分析當中,對於資料的瞭解和熟悉都是最基礎的。所謂巧婦難為無米之炊,如果說把用資料構建一個模型或者是支撐一個複雜的上層業務比喻成做飯的話

【震驚】手把手python做繪圖工具

在這篇部落格裡將為你介紹如何通過numpy和cv2進行結和去建立畫布,包括空白畫布、白色畫布和彩色畫布。建立畫布是製作繪圖工具的前提,有了畫布我們就可以在畫布上盡情的揮灑自己的藝術細胞。 還在為如何去繪圖煩惱的小夥伴趕緊看過來,這裡手把手教你解決問題~~~~ 當然還是講究一下規則:先點贊再看,尊重一下作者

利用Python進行資料分析》學習記錄

第8章249頁 原語句:party_counts = pd.crosstab(tips.day, tips.size) 現在的pandas似乎有個size屬性,就是計算資料的大小,而不會返回那一列具體的資料,比如這裡tips這個csv資料,其裡面包含一列size資料,現在來執行這句語句的話,

資料基礎---《利用Python進行資料分析·第2版》第6章 資料載入、儲存與檔案格式

之前自己對於numpy和pandas是要用的時候東學一點西一點,直到看到《利用Python進行資料分析·第2版》,覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。 訪問資料是使用本書所介紹的這些工具的第一步。我會著重介紹pandas的資料輸入與輸出,雖然別的庫中也有不少以此為目的的工具