1. 程式人生 > >(資料科學學習手札91)在Python中妥善使用進度條

(資料科學學習手札91)在Python中妥善使用進度條

> 本文示例程式碼已上傳至我的`Github`倉庫[https://github.com/CNFeffery/DataScienceStudyNotes](https://github.com/CNFeffery/DataScienceStudyNotes) # 1 簡介   在日常執行程式的過程中常常涉及到**迴圈迭代**過程,對於執行時間很短的程式來說倒無所謂,但對於執行過程有明顯耗時的涉及**迴圈迭代**的程式,為其加上**進度條**(*progress bar*),是幫助我們監測程式碼執行進度以及處理中間異常錯誤非常實用的技巧。
圖1
  本文就將為大家介紹`Python`中非常實用又風格迥異的兩個進度條相關庫——`tqdm`與`alive-progress`的主要用法。 # 2 tqdm常用方法   `tqdm`是`Python`中所有進度條相關庫中最出名的,既然是最出名的,自然有它獨到之處。   `tqdm`不僅可以生成基礎的可在終端中顯示的進度條,還可以配合`jupyter notebook`和`jupyter lab`生成更加美觀的網頁**互動**部件形式的進度條,更是和`pandas`強強聯手,為`pandas`中的一些操作提供專有的進度條功能。   下面我們來對`tqdm`的主要功能進行介紹。 ## 2.1 基礎用法   因為是第三方庫,首先需要利用`pip install tqdm`或 `conda install -c conda-forge tqdm`對其進行安裝,安裝完成後先來看看它最基本的用法:
圖2
  利用`tqdm.tqdm`,將`for`迴圈過程中進行迭代的物件簡單包裹,就實現了為迴圈過程新增進度條以及列印執行速度、已執行時間與預估剩餘執行時間等實用資訊的功能,同樣也可用於**列表推導**:
圖3
  而針對迭代物件是`range()`的情況,`tqdm`還提供了簡化版的`trange()`來代替`tqdm(range())`:
圖4
  其附帶的引數`desc`還可以幫助我們設定進度條的說明文字:
圖5
  而如果想要在迭代過程中變更說明文字,還可以預先例項化進度條物件,在需要重新整理說明文字的時候執行相應的程式:
圖6
  但當迭代的物件長度一開始未知時,譬如對`pandas`中的`DataFrame.itertuples()`進行迭代,我們就只能對其執行速度等資訊進行估計,但無法看到進度條遞增情況,因為`tqdm`不清楚迭代的終點如何:
圖7
## 2.2 配合jupyter notebook/jupyter lab的美觀進度條   `tqdm`對`jupyter notebook`和`jupyter lab`有著特殊的支援,且使用方法非常簡單,只需要將原有的`from tqdm import XXX`的相應功能匯入格式修改為`from tqdm.notebook import XXX`就可以了,以`trange`為例:
圖8
## 2.3 配合pandas中的apply   `tqdm`對`pandas`中的`apply()`過程提供了特殊的支援,因為`pandas`中的`apply()`本質上就是序列迴圈運算,你可以將`pandas`中的任何`apply`操作替換為`progress_apply`,並且記住每個單獨的`progress_apply`前要先執行`tqdm.pandas()`,就像下面的例子一樣:
圖9
# 3 alive-progress常用方法   雖然與`tqdm`一樣都是為了給迴圈過程加上進度條而誕生的庫,但`alive-progress`相比`tqdm`增加了更多花樣繁多的動態效果,我們通過呼叫其專門提供的`showtime()`函式可以檢視所有可用的動態進度條樣式:
圖10
  同樣類似地可以檢視所有進度條樣式:
圖11
  使用起來也是非常簡單,但與`tqdm`用法區別很大,需要配合`with`關鍵詞,譬如下面我們使用到`alive_progress`中的`alive_bar`來生成動態進度條:
圖12
  通過修改`bar`引數來改變進度條的樣式:
圖13
  更多關於`alive-progress`的內容感興趣的朋友可以檢視官方說明:(https://github.com/rsalmei/alive-progress),但比較遺憾的是目前的`alive-progress`只能在終端中執行,還沒有為`jupyter`開發更美觀的互動式部件,但你可以在譬如網路爬蟲等任務中使用它,效果也是很不錯的。 ---   以上就是本文的全部內容,如有疑問歡迎在評論區與