1. 程式人生 > >重要的Python庫(利用Python進行資料分析筆記)

重要的Python庫(利用Python進行資料分析筆記)

NumPy(Numerical Python)

  1. 快速高效的多維陣列物件ndarray
  2. 用於對陣列執行元素級計算以及直接對陣列執行數學運算的函式
  3. 線性代數運算、傅立葉變換,以及隨機數生成
  4. 用於將C、C++,Fortran程式碼整合到Python的工具

pandas

兼具NumPy高效能的陣列計算功能以及電子表格和關係型資料庫靈活的資料處理功能。他提供了複雜精細的索引功能,以便更為便捷地完成重塑、切片和切塊,聚合以及選取資料子集等操作。

matplotlib

用於繪製資料圖表的python庫,非常是和創建出版物上用的圖表。它跟ipython結合的很好,提供了一種互動式資料繪圖環境,繪製的圖表也是互動式的,可以利用繪圖視窗中的工具欄放大圖表中的某個區域或對整個圖表進行平移瀏覽

IPython

它是一個增強的Python shell,目的是提高編寫,測試,除錯python程式碼的速度。除了標註的基於終端的ipython shell外,該專案還提供了:
1.一個HTML筆記本
2.一個基於Qt框架的GUI控制檯,其中含有繪圖,多行編輯以及語法高亮顯示等功能
3.用於互動式並行和分散式計算的基礎架構

Scipy

一組專門解決科學計算中各種標準問題域的包的集合,主要包括下面:
1.scipy.integrate:數值積分例程和微分方程求解器
2.scipy.linalg:擴充套件了由numpy.linalg提供的線性代數例程和矩陣分解功能
3.scipy.optimize:函式優化器以及根查詢演算法
4.scipy.signal:訊號處理工具
5.scipy.sparse:稀疏矩陣和稀疏線性系統求解器
6.scipy.special:SPECFUN用於實現許多常用數學函式(如伽馬函式)的的fortran的包裝器
7.scipy.stats:標準連續和離散概率分佈(如密度函式,取樣器,連續分佈函式),各種統計檢驗方法,和更好的描述統計法
8.scipy.weave:利用內聯C++程式碼加速陣列計算的工具

相關推薦

重要Python利用Python進行資料分析筆記

NumPy(Numerical Python) 快速高效的多維陣列物件ndarray 用於對陣列執行元素級計算以及直接對陣列執行數學運算的函式 線性代數運算、傅立葉變換,以及隨機數生成 用於將C、C++,Fortran程式碼整合到Python的工具

利用python對2012美國大選進行資料分析(四,時間處理)

1,str轉datetime 我們可以使用pd.to_datetime(series,format='%Y%m%d')將字元轉化為日期,格式為年月日。 data_vs['time'] = pd.to_datetime(data_vs['contb_receipt_dt']

利用Python進行資料分析筆記-時間序列(轉換、索引、偏移)

時間序列指能在任何能在時間上觀測到的資料。很多時間序列是有固定頻率(fixed frequency)的,意思是資料點會遵照某種規律定期出現,比如每15秒,每5分鐘,或每個月。時間序列也可能是不規律的(irregular),沒有一個固定的時間規律。如何參照時間序列

利用Python進行資料分析——筆記2

用純Python程式碼對時區進行計數 (注:原來使用pylab輸入程式碼,不太方便,就換成了Pycharm編輯器) 假設我們想要知道該資料集中最常出現的是哪個時區(即tz欄位),得到答案的辦法有很多。 import json path ='G:/python/pydata-

Python程式設計】對excel進行資料分析 (mark)

Python對excel進行分析   目前有一個excel表,其中裡面有一個工作薄的名稱為:btc,在這個工作薄中有2013年–2018年的所有交易資料,本文主要實現,將不同的年份的資料儲存至新的工作薄並起名成為:2013,2014等等。   如

python機器學習----利用sklearn進行情感分析

import jieba from collections import defaultdict import os from sklearn.feature_extraction.text import TfidfTransformer from sklear

使用Vue開發網站之路2-多元件通訊2利用Vuex進行資料傳遞

這裡還是非父子元件間的通訊 其實我也不喜歡看別人的大段程式碼,但這是最完整的,以後肯定有用(完整程式碼貼在最後面,自己看) 主要實現是使用vuex的公共空間存放資料,這個時候要問,那為什麼不之間用一個物件啊,其他也是可以的,但是vuex可以檢測你資料的變化,這個後期有用。

利用Pandas進行資料分析3——統計、處理缺失值、層次化索引

注:此係列參考了樑斌老師的課件和《利用Python進行資料分析》一書。 import numpy as np import pandas as pd from pandas import DataFrame,Series df_obj

利用進行數組排序-堆排序

exce display stream led for column private main 移動 將隨意填充的數組排序成堆的形式,然後進行刪除堆的操作,因為堆刪除的永遠是當前堆中最大的,根據這個特性,可以獲取有序的數組(排成堆)從最後一個父節點開始向下調整,一直到最上面

利用Pandas進行資料分析

原文:https://www.dataquest.io/blog/pandas-python-tutorial/   作者:Vik Paruchuri   譯者:linkcheng Python 是進行資料分析的絕佳語言,主要原因是以資料為中心的 Python 包的奇妙生態系統。Pandas 就是其

基於Metronic的Bootstrap開發框架經驗總結13--頁面連結收藏夾功能的實現2利用Sortable進行拖動排序

在上篇隨筆《基於Metronic的Bootstrap開發框架經驗總結(12)--頁面連結收藏夾功能的實現》上,我介紹了連結收藏夾功能的實現,以及對收藏記錄的排序處理。該篇隨筆主要使用功能按鈕的方式移動收藏記錄,功能雖然實現的還算不錯,不過文章出來後,有讀者同行指出可以利用直接拖動的方式實現排序更方便,因此對其

中秋福利 | 10本技術圖書程式語言、資料分析免費送

中秋將至,技術宅們有福利了,網易雲社群聯合博文視點為大家送來一大波技術圖書,內容涉及Kubernetes、Go語言、OpenResty、Python程式設計、Spark SQL、PyTorch等,話不多說,“十仁”乾貨陪你過中秋。參與規則:在知乎帖子評論回覆以下你最想看的一本

android hardware 簡述Android系統原始碼情景分析 筆記

轉自 https://blog.csdn.net/u013377887/article/details/52965988   1.Android原始碼開發的C可執行原始檔一般存在external目錄下  2  Android的幾層框架.  &n

利用Python進行資料分析——第一章:重要Python安裝配置

一. NumPyNumPy全稱為Numerical Python,是Python科學計算的基礎包。提供功能有: 快速高效的多維陣列物件ndarray;用於對陣列執行元素級計算及直接執行數學運算的函式;用於讀寫硬碟上基於陣列的資料集工具;線性代數運算、傅立葉變換與隨機數

利用python進行資料分析第二版 pdf下載

適讀人群 :適合剛學Python的資料分析師或剛學資料科學以及科學計算的Python程式設計者。 閱讀本書可以獲得一份關於在Python下操作、處理、清洗、規整資料集的完整說明。本書第二版針對Python 3.6進行了更新,並增加實際案例向你展示如何高效地解決一系列資料分析問題。你將在閱讀

利用Python進行資料分析閱讀筆記

資料規整化:清理,轉換,合併,重塑 轉置(transpose)     實現的幾種方式:  import numpy as np arr = np.arange(15).reshape((3,5)) print(arr) print(arr.T) pri

➢《利用Python進行資料分析原書第2版|書籍分享

《利用Python進行資料分析》(原書第2版) 英: Python for Data Analysis: Data Wrangling with Pand 適讀人群 :適合剛學Python的資料分析師或剛學資料科學以及科學計算的Python程式設計者。 閱

Python--學習筆記2 常用 <利用Python進行資料分析>

numpy   科學計算包:多維陣列物件;數學運算函式;隨機數;傅立葉變換   可以作為演算法之間傳遞資料的容器。 pandas   快速處理結構化資料和函式。   dataframe, 面向列的二維表結構,含有行標和列標。 matplotliba &nb

利用python進行資料分析】準備與例項

我已經分享了本書的ipynb,所以跟著我一起來實驗吧。如果你不懂怎麼開啟ipynb格式的檔案,那也沒關係,anaconda3讓一切變得更簡單(我像是打廣告的)。安裝玩anaconda之後,我們在開始裡就可以找到它的資料夾,裡面有一個Jupyter Notebook,就是它了。

利用 Python 進行資料分析十二pandas:資料合併

原文地址 pandas 提供了三種主要方法可以對資料進行合併: pandas.merge()方法:資料庫風格的合併;pandas.concat()方法:軸向連線,即沿著一條軸將多個物件堆疊到一起;例項方法combine_first()方法:合併重疊資料。 pandas