Python優秀函式庫集錦(一)
資料分析函式庫
Numpy:Python的一種開源的數值計算擴充套件。這種工具可用來儲存和處理大型矩陣,比Python自身的巢狀列表(nested list structure)結構要高效的多(該結構也可以用來表示矩陣(matrix))。
Pandas:它是基於NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。你很快就會發現,它是使Python成為強大而高效的資料分析環境的重要因素之一。
Ipython:ipython 是一個 python 的互動式 shell,比預設的python shell 好用得多,支援變數自動補全,自動縮排,支援 bash shell 命令,內建了許多很有用的功能和函式。
影象處理函式庫
Matplotlib:matplotlib 是python最著名的繪相簿,它提供了一整套和matlab相似的命令API,十分適合互動式地進行製圖。而且也可以方便地將它作為繪圖控制元件,嵌入GUI應用程式中。
Python Imaging Library(PIL):它是一個開源的函式庫,它為python增加了影象生產和處理能力,支援各種影象繪製操作和檔案格式。
網頁處理分析庫
BeautifulSoup:Beautiful Soup是一個用來解析HTML和XML的第三方python庫,它可以按照你喜歡的方式去解析檔案,查詢並修改解析樹。它可以很好的處理不規範標記並生成剖析樹(parse tree). 它提供簡單又常用的導航(navigating),搜尋以及修改剖析樹的操作。
pysqlite:它是嵌入式資料庫sqllite的python介面,可以將整個資料庫儲存在單獨的檔案中,不過,在2.7版的python中含有sqlite3這個模組實現,不必安裝。
日期時間標準函式
datetime:datetime是python內建標準函式庫,專門用於處理日期及時間等,該模組下主要包含了兩個常量(datetime.MINYEAR和datetime.MAXYEAR)和5個類(datetime.date,datetime.time,datetime.datetime,datetime.timedelta,datetime.tzinfo)。
time:time是python內建的標準函式庫,專門用來處理時間,提供各種操作時間的函式。
Web APIs
此處列出一系列提供的開放API的WEB站點
delicious:一個社會型書籤應用系統,其開放的API允許你根據標籤或特定的使用者來下載連結;
Kayak:一個提供API的旅遊網站,你可以利用API在自己的程式中整合針對航班和旅館的搜尋;
eBay:一個提供API的線上交易站點,允許你查詢當前正在出售的貨品;
Hot or not:一個評分與交友的網站,提供的API對人員進行搜尋,並獲取其評分及個人資料;
Akismet:一種用於對協作性垃圾資訊過濾的API;
更多的API可參考 http://www.programmableweb.com/
資料探勘包可參考 http://www.cnblogs.com/wentingtu/p/3513979.html
更多優秀函式包可參加:http://python.jobbole.com/84464/
PS:整合開發環境canopy中使用ipython notebook進入網頁版python互動介面,之後再介面中輸入%pylab inline可展示圖片