1. 程式人生 > >程式設計中的冪等性(一):http冪等性

程式設計中的冪等性(一):http冪等性

一、什麼是冪等性?什麼是冪等操作?冪等:是一個數學概念,表示N次變換和1次變換的結果相同。冪等操作:其特點是任意多次執行所產生的影響均與一次執行的影響相同(不會改變資源狀態,對資料沒有副作用)。冪等性:一系列操作都是冪等操作。冪等介面:冪等介面認為,外部呼叫者會存在多次呼叫的場景,為了防止重試對資料狀態的改變,需要將介面的設計為冪等的HTTP方法的冪等性是指一次和多次請求某一個資源應該具有同樣的副作用。說白了就是,同一個請求,傳送一次和傳送N次效果是一樣的!冪等性是分散式系統設計中十分重要的概念,而HTTP的分散式本質也決定了它在HTTP中具有重要地位。下面將以HTTP中的冪等性做例子加以介紹。
##簡單場景舉例假設有一個從賬戶取錢的遠端API(可以是HTTP的,也可以不是),我們暫時用類函式的方式記為:
1bool withdraw(account_id, amount)
withdraw的語義是從account_id對應的賬戶中扣除amount數額的錢;如果扣除成功則返回true,賬戶餘額減少amount;如果扣除失敗則返回false,賬戶餘額不變。值得注意的是:和本地環境相比,我們不能輕易假設分散式環境的可靠性所以問題來了,一種典型的情況是withdraw請求已經被伺服器端正確處理,但伺服器端的返回結果由於網路等原因被掉丟了,導致客戶端無法得知處理結果。如果是在網頁上,一些不恰當的設計可能會使使用者認為上一次操作失敗了,然後重新整理頁面,這就導致了withdraw被呼叫兩次,賬戶也被多扣了一次錢。如圖所示:
解決方案一:採用分散式事務,通過引入支援分散式事務的中介軟體來保證withdraw功能的事務性。分散式事務的優點是對於呼叫者很簡單,複雜性都交給了中介軟體來管理。缺點則是一方面架構太重量級,容易被綁在特定的中介軟體上,不利於異構系統的整合(個人理解:中介軟體容易形成瓶頸)另一方面分散式事務雖然能保證事務的ACID性質,而但卻無法提供效能和可用性的保證(個人理解:影響系統的併發效能及工作效率)解決方案二:冪等設計。我們可以通過一些技巧把withdraw變成冪等的,比如:
123int create_ticket()bool idempotent_withdraw(ticket_id, account_id
, amount)
create_ticket的語義是獲取一個伺服器端生成的唯一的處理號ticket_id,它將用於標識後續的操作。idempotent_withdraw和withdraw的區別在於關聯了一個ticket_id,一個ticket_id表示的操作至多隻會被處理一次,每次呼叫都將返回第一次呼叫時的處理結果。這樣,idempotent_withdraw就符合冪等性了,客戶端就可以放心地多次呼叫。基於冪等性的解決方案中一個完整的取錢流程被分解成了兩個步驟:1.呼叫create_ticket()獲取ticket_id;2.呼叫idempotent_withdraw(ticket_id, account_id, amount)。雖然create_ticket不是冪等的,但在這種設計下,它對系統狀態的影響可以忽略,加上idempotent_withdraw是冪等的,所以任何一步由於網路等原因失敗或超時,客戶端都可以重試,直到獲得結果。如圖所示:和分散式事務相比,冪等設計的優勢在於它的輕量級,容易適應異構環境,以及效能和可用性方面。在某些效能要求比較高的應用,冪等設計往往是唯一的選擇。HTTP的冪等性介紹本文主要以HTTP GET、DELETE、PUT、POST四種方法為主進行語義和冪等性的介紹。對前文示例進行改進(取款冪等性設計)利用Web API的形式實現前面所提到的取款功能。1、用POST /tickets來實現create_ticket;2、用PUT /accounts/account_id/ticket_id&amount=xxx來實現idempotent_withdraw。值得注意的是嚴格來講amount引數不應該作為URI的一部分,真正的URI應該是/accounts/account_id/ticket_id,而amount應該放在請求的body中。這種模式可以應用於很多場合,比如:論壇網站中防止意外的重複發帖。電商中遇到的問題如何防範 POST 重複提交HTTP POST 操作既不是安全的,也不是冪等的(至少在HTTP規範裡沒有保證)。當我們因為反覆重新整理瀏覽器導致多次提交表單,多次發出同樣的POST請求,導致遠端伺服器重複創建出了資源。所以,對於電商應用來說,第一對應的後端 WebService 一定要做到冪等性,第二伺服器端收到 POST 請求,在操作成功後必須302跳轉到另外一個頁面,這樣即使使用者重新整理頁面,也不會重複提交表單。把分散式事務分解為具有冪等性的非同步訊息處理電商的很多業務,考慮更多的是 BASE(即Basically Available、Soft state、和Eventually consistent),而不是 ACID(Atomicity、Consistency、Isolation和 Durability)。即為了滿足高負載的使用者訪問,我們可以容忍短暫的資料不一致。那怎麼做呢?第一,不做分散式事務,代價太大。第二,不一定需要實時一致性,只需要保證最終的一致性即可。第三,“通過狀態機和嚴格的有序操作,來最大限度地降低不一致性”。第四,最終一致性(Eventually Consistent)通過非同步事件做到。如果訊息具有操作冪等性,也就是一個訊息被應用多次與應用一次產生的效果是一樣的話,那麼把不需要同步執行的事務交給非同步訊息推送和訂閱者叢集來處理即可。假如訊息處理失敗,那麼就訊息重播,由於冪等性,應用多次也能產生正確的結果。實際情況下,訊息很難具有冪等性,解決方法是使用另一個表記錄已經被成功應用的訊息,即訊息佇列和訊息應用狀態表一起來解決問題。總結上面簡單介紹了冪等性的概念,用冪等設計取代分散式事務的方法,以及HTTP主要方法的語義和冪等性特徵。其實,如果要追根溯源,冪等性是數學中的一個概念,表達的是N次變換與1次變換的結果相同,有興趣的讀者可以從Wikipedia上進一步瞭解。