1. 程式人生 > >電商專案架構

電商專案架構

1 電商案例原因

分散式大型網站,目前看主要有幾類1.大型門戶,比如網易,新浪等;2.SNS網站,比如校內,開心網等;3.電商網站:比如阿里巴巴,京東商城,國美線上,汽車之家等。大型門戶一般是新聞類資訊,可以使用CDN,靜態化等方式優化開心網等互動性比較多,可能會引入更多的NOSQL,分散式快取,使用高效能的通訊框架等。電商網站具備以上兩類的特點,比如產品詳情可以採用CDN,靜態化,互動性高的需要採用NOSQL等技術。因此,我們採用電商網站作為案例,進行分析。

2 電商網站需求

客戶需求:

  • 建立一個全品類的電子商務網站(B2C),使用者可以線上購買商品,可以線上支付,也可以貨到付款;

  • 使用者購買時可以線上與客服溝通;

  • 使用者收到商品後,可以給商品打分,評價;

  • 目前有成熟的進銷存系統;需要與網站對接;

  • 希望能夠支援3~5年,業務的發展;

  • 預計3~5年使用者數達到1000萬;

  • 定期舉辦雙11,雙12,三八男人節等活動;

  • 其他的功能參考京東或國美線上等網站。

客戶就是客戶,不會告訴你具體要什麼,只會告訴你他想要什麼,我們很多時候要引導,挖掘客戶的需求。好在提供了明確的參考網站。因此,下一步要進行大量的分析,結合行業,以及參考網站,給客戶提供方案。

需求管理傳統的做法,會使用用例圖或模組圖(需求列表)進行需求的描述。這樣做常常忽視掉一個很重要的需求(非功能需求),因此推薦大家使用需求功能矩陣,進行需求描述

本電商網站的需求矩陣如下:

輸入圖片說明

輸入圖片說明

以上是對電商網站需求的簡單舉例,目的是說明(1)需求分析的時候,要全面,大型分散式系統重點考慮非功能需求;(2)描述一個簡單的電商需求場景,使大家對下一步的分析設計有個依據。

3 網站初級架構

一般網站,剛開始的做法,是三臺伺服器,一臺部署應用,一臺部署資料庫,一臺部署NFS檔案系統。這是前幾年比較傳統的做法,之前見到一個網站10萬多會員,垂直服裝設計門戶,N多圖片。使用了一臺伺服器部署了應用,資料庫以及圖片儲存。出現了很多效能問題。如下圖:

輸入圖片說明

但是,目前主流的網站架構已經發生了翻天覆地的變化。一般都會採用叢集的方式,進行高可用設計。至少是下面這個樣子。

輸入圖片說明

  • (1)使用叢集對應用伺服器進行冗餘,實現高可用;(負載均衡裝置可與應用一塊部署)

  • (2)使用資料庫主備模式,實現資料備份和高可用;

4 系統容量預估

  1. 預估步驟:

    • 註冊使用者數-日均UV量-每日的PV量-每天的併發量;

    • 峰值預估:平常量的2~3倍;

    • 根據併發量(併發,事務數),儲存容量計算系統容量;

客戶需求:3~5年使用者數達到1000萬註冊使用者;

  1. 每秒併發數預估:

    • 每天的UV為200萬(二八原則);

    • 每日每天點選瀏覽30次;

    • PV量:200*30=6000萬;

    • 集中訪問量:240.2=4.8小時會有6000萬0.8=4800萬(二八原則);

    • 每分併發量:4.8*60=288分鐘,每分鐘訪問4800/288=16.7萬(約等於);

    • 每秒併發量:16.7萬/60=2780(約等於);

    • 假設:高峰期為平常值的三倍,則每秒的併發數可以達到8340次。

    • 1毫秒=1.3次訪問;

  2. 伺服器預估:(以tomcat伺服器舉例)

    • 按一臺web伺服器,支援每秒300個併發計算。平常需要10臺伺服器(約等於);[tomcat預設配置是150]

    • 高峰期:需要30臺伺服器;

  3. 容量預估:70/90原則

    • 系統CPU一般維持在70%左右的水平,高峰期達到90%的水平,是不浪費資源,並比較穩定的。記憶體,IO類似。

以上預估僅供參考,因為伺服器配置,業務邏輯複雜度等都有影響。在此CPU,硬碟,網路等不再進行評估。

5 網站架構分析

根據以上預估,有幾個問題:

  • 需要部署大量的伺服器,高峰期計算,可能要部署30臺Web伺服器。並且這三十臺伺服器,只有秒殺,活動時才會用到,存在大量的浪費。

  • 所有的應用部署在同一臺伺服器,應用之間耦合嚴重。需要進行垂直切分和水平切分。

  • 大量應用存在冗餘程式碼。

  • 伺服器SESSION同步耗費大量記憶體和網路頻寬。

  • 資料需要頻繁訪問資料庫,資料庫訪問壓力巨大。

大型網站一般需要做以下架構優化(優化是架構設計時,就要考慮的,一般從架構/程式碼級別解決,調優主要是簡單引數的調整,比如JVM調優;如果調優涉及大量程式碼改造,就不是調優了,屬於重構):

  • 業務拆分

  • 應用叢集部署(分散式部署,叢集部署和負載均衡)

  • 多級快取

  • 單點登入(分散式Session)

  • 資料庫叢集(讀寫分離,分庫分表)

  • 服務化

  • 訊息佇列

  • 其他技術

6 網站架構優化

6.1 業務拆分

根據業務屬性進行垂直切分,劃分為產品子系統,購物子系統,支付子系統,評論子系統,客服子系統,介面子系統(對接如進銷存,簡訊等外部系統)。

根據業務子系統進行等級定義,可分為核心系統和非核心繫統。核心系統:產品子系統,購物子系統,支付子系統;非核心:評論子系統,客服子系統,介面子系統。

業務拆分作用:提升為子系統可由專門的團隊和部門負責,專業的人做專業的事,解決模組之間耦合以及擴充套件性問題;每個子系統單獨部署,避免集中部署導致一個應用掛了,全部應用不可用的問題。

等級定義作用:用於流量突發時,對關鍵應用進行保護,實現優雅降級;保護關鍵應用不受到影響。

拆分後的架構圖:

輸入圖片說明

參考部署方案2:

輸入圖片說明

(1)如上圖每個應用單獨部署;

(2)核心系統和非核心繫統組合部署;

6.2 應用叢集部署(分散式,叢集,負載均衡)

分散式部署:將業務拆分後的應用單獨部署,應用直接通過RPC進行遠端通訊;

叢集部署:電商網站的高可用要求,每個應用至少部署兩臺伺服器進行叢集部署;

負載均衡:是高可用系統必須的,一般應用通過負載均衡實現高可用,分散式服務通過內建的負載均衡實現高可用,關係型資料庫通過主備方式實現高可用。

叢集部署後架構圖:

輸入圖片說明

6.3 多級快取

快取按照存放的位置一般可分為兩類本地快取和分散式快取。本案例採用二級快取的方式,進行快取的設計。一級快取為本地快取,二級快取為分散式快取。(還有頁面快取,片段快取等,那是更細粒度的劃分)

一級快取,快取資料字典,和常用熱點資料等基本不可變/有規則變化的資訊,二級快取快取需要的所有快取。當一級快取過期或不可用時,訪問二級快取的資料。如果二級快取也沒有,則訪問資料庫。

快取的比例,一般1:4,即可考慮使用快取。(理論上是1:2即可)。

輸入圖片說明

根據業務特性可使用以下快取過期策略:

(1)快取自動過期;

(2)快取觸發過期;

6.4 單點登入(分散式Session)

系統分割為多個子系統,獨立部署後,不可避免的會遇到會話管理的問題。一般可採用Session同步,Cookies,分散式Session方式。電商網站一般採用分散式Session實現。

再進一步可以根據分散式Session,建立完善的單點登入或賬戶管理系統。

輸入圖片說明

流程說明:

(1)使用者第一次登入時,將會話資訊(使用者Id和使用者資訊),比如以使用者Id為Key,寫入分散式Session;

(2)使用者再次登入時,獲取分散式Session,是否有會話資訊,如果沒有則調到登入頁;

(3)一般採用Cache中介軟體實現,建議使用Redis,因此它有持久化功能,方便分散式Session宕機後,可以從持久化儲存中載入會話資訊;

(4)存入會話時,可以設定會話保持的時間,比如15分鐘,超過後自動超時;

結合Cache中介軟體,實現的分散式Session,可以很好的模擬Session會話。

6.5 資料庫叢集(讀寫分離,分庫分表)

大型網站需要儲存海量的資料,為達到海量資料儲存,高可用,高效能一般採用冗餘的方式進行系統設計一般有兩種方式讀寫分離和分庫分表

讀寫分離:一般解決讀比例遠大於寫比例的場景,可採用一主一備,一主多備或多主多備方式。

本案例在業務拆分的基礎上,結合分庫分表和讀寫分離。如下圖:

輸入圖片說明

(1)業務拆分後:每個子系統需要單獨的庫;

(2)如果單獨的庫太大,可以根據業務特性,進行再次分庫,比如商品分類庫,產品庫;

(3)分庫後,如果表中有資料量很大的,則進行分表,一般可以按照Id,時間等進行分表;(高階的用法是一致性Hash)

(4)在分庫,分表的基礎上,進行讀寫分離;

相關中介軟體可參考Cobar(阿里,目前已不在維護),TDDL(阿里),Atlas(奇虎360),MyCat(在Cobar基礎上,國內很多牛人,號稱國內第一開源專案)。

分庫分表後序列的問題,JOIN,事務的問題,會在分庫分表主題分享中,介紹。

6.6 服務化

將多個子系統公用的功能/模組,進行抽取,作為公用服務使用。比如本案例的會員子系統就可以抽取為公用的服務。

輸入圖片說明

6.7 訊息佇列

訊息佇列可以解決子系統/模組之間的耦合,實現非同步,高可用,高效能的系統。是分散式系統的標準配置。本案例中,訊息佇列主要應用在購物,配送環節。

(1)使用者下單後,寫入訊息佇列,後直接返回客戶端;

(2)庫存子系統:讀取訊息佇列資訊,完成減庫存;

(3)配送子系統:讀取訊息佇列資訊,進行配送;

輸入圖片說明

目前使用較多的MQ有Active MQ,Rabbit MQ,Zero MQ,MS MQ等,需要根據具體的業務場景進行選擇。建議可以研究下Rabbit MQ

6.8 其他架構(技術)

除了以上介紹的業務拆分,應用叢集,多級快取,單點登入,資料庫叢集,服務化,訊息佇列外。還有CDN,反向代理,分散式檔案系統,大資料處理等系統。

此處不詳細介紹,大家可以問度娘/Google,有機會的話也可以分享給大家。

7 架構總結

輸入圖片說明