1. 程式人生 > >Django框架 之 querySet詳解

Django框架 之 querySet詳解

int 框架 子句 cell cts syn 重復執行 span pytho

瀏覽目錄

  • 可切片

  • 可叠代

  • 惰性查詢

  • 緩存機制

  • exists()與iterator()方法

QuerySet

可切片

使用Python 的切片語法來限制查詢集記錄的數目 。它等同於SQL 的LIMITOFFSET 子句。

1 >>> Entry.objects.all()[:5] # (LIMIT 5)

1 Entry.objects.all()[5:10] # (OFFSET 5 LIMIT 5)

不支持負的索引(例如Entry.objects.all()[-1]

)。通常,查詢集 的切片返回一個新的查詢集 —— 它不會執行查詢。   

可叠代

1 2 3 4 articleList=models.Article.objects.all() for article in articleList: print(article.title)  

惰性查詢

查詢集 是惰性執行的 —— 創建查詢集不會帶來任何數據庫的訪問。你可以將過濾器保持一整天,直到查詢集 需要求值時,Django 才會真正運行這個查詢。

1 2 3 4 5 6 queryResult=models.Article.objects.
all() # not hits database print(queryResult) # hits database for article in queryResult: print(article.title) # hits database

一般來說,只有在“請求”查詢集 的結果時才會到數據庫中去獲取它們。當你確實需要結果時,查詢集 通過訪問數據庫來求值關於求值發生的準確時間,參見何時計算查詢集。  

緩存機制

每個查詢集都包含一個緩存來最小化對數據庫的訪問。理解它是如何工作的將讓你編寫最高效的代碼。

在一個新創建的查詢集中,緩存為空。首次對查詢集

進行求值 —— 同時發生數據庫查詢 ——Django 將保存查詢的結果到查詢集的緩存中並返回明確請求的結果(例如,如果正在叠代查詢集,則返回下一個結果)。接下來對該查詢集 的求值將重用緩存的結果。

請牢記這個緩存行為,因為對查詢集使用不當的話,它會坑你的。例如,下面的語句創建兩個查詢集,對它們求值,然後扔掉它們:

1 2 print([a.title for a in models.Article.objects.all()]) print([a.create_time for a in models.Article.objects.all()])

這意味著相同的數據庫查詢將執行兩次,顯然倍增了你的數據庫負載。同時,還有可能兩個結果列表並不包含相同的數據庫記錄,因為在兩次請求期間有可能有Article被添加進來或刪除掉。為了避免這個問題,只需保存查詢集並重新使用它: 

1 2 3 queryResult=models.Article.objects.all() print([a.title for a in queryResult]) print([a.create_time for a in queryResult])

何時查詢集不會被緩存?

查詢集不會永遠緩存它們的結果。當只對查詢集的部分進行求值時會檢查緩存, 如果這個部分不在緩存中,那麽接下來查詢返回的記錄都將不會被緩存。所以,這意味著使用切片或索引來限制查詢集將不會填充緩存。

例如,重復獲取查詢集對象中一個特定的索引將每次都查詢數據庫:

1 2 3 >>> queryset = Entry.objects.all() >>> print queryset[5] # Queries the database >>> print queryset[5] # Queries the database again

然而,如果已經對全部查詢集求值過,則將檢查緩存:  

1 2 3 4 >>> queryset = Entry.objects.all() >>> [entry for entry in queryset] # Queries the database >>> print queryset[5] # Uses cache >>> print queryset[5] # Uses cache

下面是一些其它例子,它們會使得全部的查詢集被求值並填充到緩存中:

1 2 3 4 >>> [entry for entry in queryset] >>> bool(queryset) >>> entry in queryset >>> list(queryset)

註:簡單地打印查詢集不會填充緩存。  

1 2 3 queryResult=models.Article.objects.all() print(queryResult) # hits database print(queryResult) # hits database 

exists()與iterator()方法

exists:

簡單的使用if語句進行判斷也會完全執行整個queryset並且把數據放入cache,雖然你並不需要這些 數據!為了避免這個,可以用exists()方法來檢查是否有數據:

1 2 3 if queryResult.exists(): #SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=() print("exists...")

iterator:

當queryset非常巨大時,cache會成為問題。

處理成千上萬的記錄時,將它們一次裝入內存是很浪費的。更糟糕的是,巨大的queryset可能會鎖住系統 進程,讓你的程序瀕臨崩潰。要避免在遍歷數據的同時產生queryset cache,可以使用iterator()方法 來獲取數據,處理完數據就將其丟棄。

1 2 3 4 5 6 7 objs = Book.objects.all().iterator() # iterator()可以一次只從數據庫獲取少量數據,這樣可以節省內存 for obj in objs: print(obj.title) #BUT,再次遍歷沒有打印,因為叠代器已經在上一次遍歷(next)到最後一次了,沒得遍歷了 for obj in objs: print(obj.title)

當然,使用iterator()方法來防止生成cache,意味著遍歷同一個queryset時會重復執行查詢。所以使 #用iterator()的時候要當心,確保你的代碼在操作一個大的queryset時沒有重復執行查詢。

總結:

queryset的cache是用於減少程序對數據庫的查詢,在通常的使用下會保證只有在需要的時候才會查詢數據庫。 使用exists()和iterator()方法可以優化程序對內存的使用。不過,由於它們並不會生成queryset cache,可能 會造成額外的數據庫查詢。 

Django框架 之 querySet詳解