1. 程式人生 > >Python優秀函式庫集錦(一)

Python優秀函式庫集錦(一)

資料分析函式庫

Numpy:Python的一種開源的數值計算擴充套件。這種工具可用來儲存和處理大型矩陣,比Python自身的巢狀列表(nested list structure)結構要高效的多(該結構也可以用來表示矩陣(matrix))。
Pandas:它是基於NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。你很快就會發現,它是使Python成為強大而高效的資料分析環境的重要因素之一。
Ipython:ipython 是一個 python 的互動式 shell,比預設的python shell 好用得多,支援變數自動補全,自動縮排,支援 bash shell 命令,內建了許多很有用的功能和函式。

Scipy:SciPy是一款方便、易於使用、專為科學和工程設計的Python工具包.它包括統計,優化,整合,線性代數模組,傅立葉變換,訊號和影象處理,常微分方程求解器等等。

影象處理函式庫

Matplotlib:matplotlib 是python最著名的繪相簿,它提供了一整套和matlab相似的命令API,十分適合互動式地進行製圖。而且也可以方便地將它作為繪圖控制元件,嵌入GUI應用程式中。
Python Imaging Library(PIL):它是一個開源的函式庫,它為python增加了影象生產和處理能力,支援各種影象繪製操作和檔案格式。

網頁處理分析庫

Urllib2

:python自帶的標準函式庫,一個獲取URLs(Uniform Resource Locators)的元件。他以urlopen函式的形式提供了一個非常簡單的介面,這是具有利用不同協議獲取URLs的能力,他同樣提供了一個比較複雜的介面來處理一般情況,例如:基礎驗證,cookies,代理等。
BeautifulSoup:Beautiful Soup是一個用來解析HTML和XML的第三方python庫,它可以按照你喜歡的方式去解析檔案,查詢並修改解析樹。它可以很好的處理不規範標記並生成剖析樹(parse tree). 它提供簡單又常用的導航(navigating),搜尋以及修改剖析樹的操作。
Universal Feed parser
:它是一個第三方python庫,可以用來分析RSS和Atom訂閱源,可以利用該函式庫從線上的新聞站點下載部落格帖子和文章。
pysqlite:它是嵌入式資料庫sqllite的python介面,可以將整個資料庫儲存在單獨的檔案中,不過,在2.7版的python中含有sqlite3這個模組實現,不必安裝。

日期時間標準函式

datetime:datetime是python內建標準函式庫,專門用於處理日期及時間等,該模組下主要包含了兩個常量(datetime.MINYEAR和datetime.MAXYEAR)和5個類(datetime.date,datetime.time,datetime.datetime,datetime.timedelta,datetime.tzinfo)。
time:time是python內建的標準函式庫,專門用來處理時間,提供各種操作時間的函式。

Web APIs

此處列出一系列提供的開放API的WEB站點
delicious:一個社會型書籤應用系統,其開放的API允許你根據標籤或特定的使用者來下載連結;
Kayak:一個提供API的旅遊網站,你可以利用API在自己的程式中整合針對航班和旅館的搜尋;
eBay:一個提供API的線上交易站點,允許你查詢當前正在出售的貨品;
Hot or not:一個評分與交友的網站,提供的API對人員進行搜尋,並獲取其評分及個人資料;
Akismet:一種用於對協作性垃圾資訊過濾的API;
更多的API可參考 http://www.programmableweb.com/
資料探勘包可參考 http://www.cnblogs.com/wentingtu/p/3513979.html

更多優秀函式包可參加:http://python.jobbole.com/84464/
PS:整合開發環境canopy中使用ipython notebook進入網頁版python互動介面,之後再介面中輸入%pylab inline可展示圖片