1. 程式人生 > >想要快速完成一個Python專案,離不開這些開源庫

想要快速完成一個Python專案,離不開這些開源庫

在Python / Django世界中有一句話:我們為語言而來,為社群而留。對我們大多數人來說,這是事實,但讓我們置身於Python世界的另一個原因是,我們很容易就有了一個想法,並且可以幾個小時內讓這個想法快速實現。



本文我們將深入研究我們喜歡使用的Python庫:



1、要動態儲存資料庫中的資料:Dataset


python中非常好用的資料庫管理工具dataset,當我們想要快速地收集資料並將其儲存到資料庫中,而不知道最終的資料庫表是什麼樣子時,Dataset就是我們的首選庫。Dataset有一個簡單而強大的API,可以輕鬆地將資料放入其中,並在稍後對其進行排序。


Dataset構建在SQLAlchemy之上,因此擴充套件它不會讓你感覺到陌生。使用Django的內建inspectdb管理命令將底層資料庫模型輕鬆匯入Django。這使得使用現有資料庫變得非常輕鬆。(官方文件:http://dataset.readthedocs.io/en/latest/



2、從網頁中提取資料:Beautiful Soup


Beautiful Soup使從HTML頁面中提取資訊變得很容易。當我們需要將非結構化或鬆散結構的HTML轉換為結構化資料時,它就是是我們的首選。它還非常適合處理XML資料,否則這些資料可能無法讀取。(專案地址:

https://github.com/icodeu/BeautifulSoup



3、處理HTTP內容:Requests


Requests是一個 Python 的 HTTP 客戶端庫,可以說是處理HTTP內容的黃金標準庫之一。每當我們需要使用HTML頁面甚至API時,Requests就會出現。它也有很好的記錄。(專案地址:https://github.com/requests/requests



4、編寫命令列:Click


Python中強大的命令列庫,在我們需要編寫本機Python指令碼時,Click是我們最喜歡的用於編寫命令列實用程式的庫。這個API很簡單,只需要記住一些模式就行,文件很好用,它使得查詢高階特性變得很容易。(官網映象地址:

http://click.uoota.com/6/



5、Python Slugify


眾所周知,給事物命名是很困難的。Python Slugify是一個很有用的庫,可以將標題或描述轉換為唯一的(ish)識別符號。如果你正在處理一個web專案,並且希望使用seo友好的url, Python Slugify將會給你極大的幫助。(專案地址:https://github.com/un33k/python-slugify



6、Pluggy


Pluggy相對較新,但它也是向現有應用程式新增外掛系統中最好和最簡單的方法之一。(專案地址:https://github.com/pytest-dev/pluggy




7、要將CSV檔案轉換為API:Datasette


Datasette是一個神奇的工具,可以輕鬆地將CSV檔案轉換為功能齊全的只讀REST JSON api。Datasette有很多功能,包括圖表和地理位置(用於建立互動式地圖),通過容器或第三方web主機很容易部署。(專案地址:https://github.com/simonw/datasette



8、處理環境變數:Envparse


如果因為不想在原始碼中儲存API鍵、資料庫憑證或其他敏感資訊而需要解析環境變數,那麼envparse就是最好的選擇之一。Envparse處理環境變數、ENV檔案、變數型別,甚至前處理器和後處理器(例如你希望確保變數總是大寫或小寫)。(專案地址:https://github.com/rconradharris/envparse


你最喜歡的庫有在這個列表裡面麼?留言分享給大家。