1. 程式人生 > >python中的輕量級定時任務排程庫:schedule

python中的輕量級定時任務排程庫:schedule

提到定時任務排程的時候,相信很多人會想到芹菜celery,要麼就寫個指令碼塞到crontab中。不過,一個小的定時指令碼,要用celery的話太“重”了。所以,我找到了一個輕量級的定時任務排程的庫:schedule。

庫的安裝還是最簡單的pip install schedule,使用起來也是很容易理解的。我們從最簡單的栗子看起:

import schedule
import time
 
def job():
    print("I'm working...")
 
schedule.every(10).minutes.do(job)
schedule.every().hour.do(job)
schedule.every().day.at("10:30").do(job)
schedule.every(5).to(10).days.do(job)
schedule.every().monday.do(job)
schedule.every().wednesday.at("13:15").do(job)
 
while True:
    schedule.run_pending()
    time.sleep(1)

這是在pypi上面給出的示例。這個栗子簡單到我不需要怎麼解釋。而且,通過這個栗子,我們也可以知道,schedule其實就只是個定時器。在while True死迴圈中,schedule.run_pending()是保持schedule一直執行,去查詢上面那一堆的任務,在任務中,就可以設定不同的時間去執行。跟crontab是類似的。

但是,如果是多個任務執行的話,實際上它們是按照順序從上往下挨個執行的。如果上面的任務比較複雜,會影響到下面任務的執行時間。比如我們這樣:

import datetime
import schedule
import time
 
def job1():
    print("I'm working for job1")
    time.sleep(2)
    print("job1:", datetime.datetime.now())
 
def job2():
    print("I'm working for job2")
    time.sleep(2)
    print("job2:", datetime.datetime.now())
 
def run():
    schedule.every(10).seconds.do(job1)
    schedule.every(10).seconds.do(job2)
 
    while True:
        schedule.run_pending()
        time.sleep(1)

接下來你就會發現,兩個定時任務並不是10秒執行一次,而是12秒。是的。由於job1和job2本身的執行時間,導致任務延遲了。

其實解決方法也很簡單:用多執行緒/多程序。不要幼稚地問我“python中的多執行緒不是沒有用嗎?”這是兩碼事。開了一條執行緒,就把job獨立出去運行了,不會佔主程序的cpu時間,schedule並沒有花掉執行一個任務的時間,它的開銷只是開啟一條執行緒的時間,所以,下一次執行就變成了10秒後而不是12秒後。

import datetime
import schedule
import threading
import time
 
def job1():
    print("I'm working for job1")
    time.sleep(2)
    print("job1:", datetime.datetime.now())
 
def job2():
    print("I'm working for job2")
    time.sleep(2)
    print("job2:", datetime.datetime.now())
 
def job1_task():
    threading.Thread(target=job1).start()
 
def job2_task():
    threading.Thread(target=job2).start()
 
def run():
    schedule.every(10).seconds.do(job1_task)
    schedule.every(10).seconds.do(job2_task)
 
    while True:
        schedule.run_pending()
        time.sleep(1)

就是這麼簡單。

唯一要注意的是,這裡面job不應當是死迴圈型別的,也就是說,這個執行緒應該有一個執行完畢的出口。一是因為執行緒萬一僵死,會是非常棘手的問題;二是下一次定時任務還會開啟一個新的執行緒,執行次數多了就會演變成災難。如果schedule的時間間隔設定得比job執行的時間短,一樣會執行緒堆積形成災難,所以,還是需要注意一下的。