1. 程式人生 > >最常用的分散式ID解決方案,你知道幾個

最常用的分散式ID解決方案,你知道幾個

# 一、分散式ID概念 說起ID,特性就是唯一,在人的世界裡,ID就是身份證,是每個人的唯一的身份標識。在複雜的分散式系統中,往往也需要對大量的資料和訊息進行唯一標識。舉個例子,資料庫的ID欄位在單體的情況下可以使用自增來作為ID,但是對資料分庫分表後一定需要一個唯一的ID來標識一條資料,這個ID就是分散式ID。對於分散式ID而言,也需要具備分散式系統的特點:高併發,高可用,高效能等特點。 # 二、分散式ID實現方案 下表為一些常用方案對比: | | 描述 | 優點 | 缺點 | | ---- | ---- | ---- | ---- | | UUID | UUID是通用唯一標識碼的縮寫,其目的是上分散式系統中的所有元素都有唯一的辨識資訊,而不需要通過中央控制器來指定唯一標識。 | 1. 降低全域性節點的壓力,使得主鍵生成速度更快;2. 生成的主鍵全域性唯一;3. 跨伺服器合併資料方便 | 1. UUID佔用16個字元,空間佔用較多;2. 不是遞增有序的數字,資料寫入IO隨機性很大,且索引效率下降 | | 資料庫主鍵自增 | MySQL資料庫設定主鍵且主鍵自動增長 | 1. INT和BIGINT型別佔用空間較小;2. 主鍵自動增長,IO寫入連續性好;3. 數字型別查詢速度優於字串 | 1. 併發效能不高,受限於資料庫效能;2. 分庫分表,需要改造,複雜;3. 自增:資料量洩露 | | Redis自增 | Redis計數器,原子性自增 | 使用記憶體,併發效能好 | 1. 資料丟失;2. 自增:資料量洩露 | | 雪花演算法(snowflake) | 大名鼎鼎的雪花演算法,分散式ID的經典解決方案 | 1. 不依賴外部元件;2. 效能好 | 時鐘回撥 | 目前流行的分散式ID解決方案有兩種:**號段模式**和**雪花演算法**。 **號段模式**依賴於資料庫,但是區別於資料庫主鍵自增的模式。假設100為一個號段100,200,300,每取一次可以獲得100個ID,效能顯著提高。 **雪花演算法**是由符號位+時間戳+工作機器id+序列號組成的,如圖所示: ![](https://img2020.cnblogs.com/blog/1538609/202012/1538609-20201206214701214-124661203.png) 符號位為0,0表示正數,ID為正數。 時間戳位不用多說,用來存放時間戳,單位是ms。 工作機器id位用來存放機器的id,通常分為5個區域位+5個伺服器標識位。 序號位是自增。 * 雪花演算法能存放多少資料? 時間範圍:2^41 / (365*24*60*60*1000) = 69年 工作程序範圍:2^10 = 1024 序列號範圍:2^12 = 4096,表示1ms可以生成4096個ID。 根據這個演算法的邏輯,只需要將這個演算法用Java語言實現出來,封裝為一個工具方法,那麼各個業務應用可以直接使用該工具方法來獲取分散式ID,只需保證每個業務應用有自己的工作機器id即可,而不需要單獨去搭建一個獲取分散式ID的應用。下面是推特版的Snowflake演算法: ``` public class SnowFlake { /** * 起始的時間戳 */ private final static long START_STMP = 1480166465631L; /** * 每一部分佔用的位數 */ private final static long SEQUENCE_BIT = 12; //序列號佔用的位數 private final static long MACHINE_BIT = 5; //機器標識佔用的位數 private final static long DATACENTER_BIT = 5;//資料中心佔用的位數 /** * 每一部分的最大值 */ private final static long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT); private final static long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT); private final static long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT); /** * 每一部分向左的位移 */ private final static long MACHINE_LEFT = SEQUENCE_BIT; private final static long DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT; private final static long TIMESTMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT; private long datacenterId; //資料中心 private long machineId; //機器標識 private long sequence = 0L; //序列號 private long lastStmp = -1L;//上一次時間戳 public SnowFlake(long datacenterId, long machineId) { if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) { throw new IllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0"); } if (machineId > MAX_MACHINE_NUM || machineId < 0) { throw new IllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0"); } this.datacenterId = datacenterId; this.machineId = machineId; } /** * 產生下一個ID * * @return */ public synchronized long nextId() { long currStmp = getNewstmp(); if (currStmp < lastStmp) { throw new RuntimeException("Clock moved backwards. Refusing to generate id"); } if (currStmp == lastStmp) { //相同毫秒內,序列號自增 sequence = (sequence + 1) & MAX_SEQUENCE; //同一毫秒的序列數已經達到最大 if (sequence == 0L) { currStmp = getNextMill(); } } else { //不同毫秒內,序列號置為0 sequence = 0L; } lastStmp = currStmp; return (currStmp - START_STMP) << TIMESTMP_LEFT //時間戳部分 | datacenterId << DATACENTER_LEFT //資料中心部分 | machineId << MACHINE_LEFT //機器標識部分 | sequence; //序列號部分 } private long getNextMill() { long mill = getNewstmp(); while (mill <= lastStmp) { mill = getNewstmp(); } return mill; } private long getNewstmp() { return System.currentTimeMillis(); } public static void main(String[] args) { SnowFlake snowFlake = new SnowFlake(2, 3); for (int i = 0; i < (1 << 12); i++) { System.out.println(snowFlake.nextId()); } } } ``` # 三、分散式ID開源元件 ## 3.1 如何選擇開源元件 選擇開源元件首先需要看軟體特性是否滿足需求,主要包括相容性和擴充套件性。 其次需要看目前的技術能力,根據目前自己或者團隊的技術棧和技術能力,能否可以平滑的使用。 第三,要看開源元件的社群,主要關注更新是否頻繁、專案是否有人維護、遇到坑的時候可以取得聯絡尋求幫助、是否在業內被廣泛使用等。 ## 3.2 美團Leaf Leaf是美團基礎研發平臺推出的一個分散式ID生成服務,名字取自德國哲學家、數學家萊布尼茨的一句話:“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全域性唯一等特點。目前已經廣泛應用於美團金融、美團外賣、美團酒旅等多個部門。具體的技術細節,可參考美團技術部落格的一篇文章:《Leaf美團分散式ID生成服務》。目前,Leaf專案已經在Github上開源:https://github.com/Meituan-Dianping/Leaf。Leaf在特性如下: 1. 全域性唯一,絕對不會出現重複的ID,且ID整體趨勢遞增。 2. 高可用,服務完全基於分散式架構,即使MySQL宕機,也能容忍一段時間的資料庫不可用。 3. 高併發低延時,在CentOS 4C8G的虛擬機器上,遠端呼叫QPS可達5W+,TP99在1ms內。 4. 接入簡單,直接通過公司RPC服務或者HTTP呼叫即可接入。 ## 3.3 百度UidGenerator UidGenerator百度開源的一款基於Snowflake演算法的分散式高效能唯一ID生成器。採用官網的一段描述:UidGenerator以元件形式工作在應用專案中, 支援自定義workerId位數和初始化策略, 從而適用於docker等虛擬化環境下例項自動重啟、漂移等場景。 在實現上, UidGenerator通過借用未來時間來解決sequence天然存在的併發限制; 採用RingBuffer來快取已生成的UID, 並行化UID的生產和消費, 同時對CacheLine補齊,避免了由RingBuffer帶來的硬體級「偽共享」問題. 最終單機QPS可達600萬。UidGenerator的GitHub地址:https://github.com/baidu/uid-generator ## 3.4 開源元件對比 百度UidGenerator是Java語言的;最近一次提交記錄是兩年前,基本無人維護;只支援雪花演算法。 美團Leaf也是Java語言的;最近維護為2020年;支援號段模式和雪花演算法。 綜上理論和兩款開源元件的對比,還是美團Leaf稍勝一籌。 你還知道哪些常用的分散式ID解決方