1. 程式人生 > >數據庫對表的三種分割技術

數據庫對表的三種分割技術

一個表 復雜 算法 block 成本 更多 案例 優點 bsp

  一.水平分割
  
  水平分割根據某些條件將數據放到兩個或多個獨立的表中。即按記錄進分分割,不同的記錄可以分開保存,每個子表的列數相同。水平切割將表分為多個表。每個表包含的列數相同,但是數據行更少。例如,可以將一個包含十億行的表水平分區成 12 個表,每個小表表示特定年份內一個月的數據。任何需要特定月份數據的查詢只需引用相應月份的表。 通常用來水平分割表的條件有:日期時間維度、地區維度等,當然還有更多的業務維度。下面我舉幾個例子來解說一下 案例1:某個公司銷售記錄數據量太大了,我們可以對它按月進行水平分割,每個月的銷售記錄單獨成一張表。 案例2:某個集團在各個地區都有分公司,該集團的訂單數據表太大了,我們可以按分公司所在的地區進行水平切割。 案例3:某電信公司的話單按日期、地市水平切割後,發現數據量太大,然後他們又按品牌、號碼段進行水平切割 水平分割通常在下面的情況下使用:
  
  (1)表數據量很大,分割後可以降低在查詢時需要讀的數據和索引的頁數,同時也降低了索引的層數,加快了查詢速度。
  
  (2)表中的數據本來就有獨立性,例如表中分別記錄各個地區的數據或不同時期的數據,特別是有些數據常用,而另外一些數據不常用。
  
  (3)需要把數據存放到多個介質上。
  
  (4)需要把歷史數據和當前的數據拆分開。
  
   優點:
  
  1:降低在查詢時需要讀的數據和索引的頁數,同時也降低了索引的層數,加快了查詢速度。
  
   缺點:
  
  1:水平分割會給應用增加復雜度,它通常在查詢時需要多個表名,查詢所有數據需要union操作。在許多數據庫應用中,這種復雜性會超過它帶來的優點,因為只要索引關鍵字不大,則在索引用於查詢時,表中增加兩到三倍數據量,查詢時也就增加讀一個索引層的磁盤次數。
  
   二.垂直分割
  
  垂直分割表(不破壞第三範式),把主碼(主鍵)和一些列放到一個表,然後把主碼(主鍵)和另外的一些列放到另一個表中。將原始表分成多個只包含較少列的表。如果一個表中某些列常用,而另外一些列不常用,則可以采用垂直分割。
  
   優點:
  
  1:垂直分割可以使得行數據變小,一個數據塊(Block)就能存放更多的數據,在查詢時就會減少I/O次數(每次查詢時讀取的Block 就少)。   2:垂直分割表可以達到最大化利用Cache的目的。
  
   缺點:
  
  1:表垂直分割後,主碼(主鍵)出現冗余,需要管理冗余列
  
  2:會引起表連接JOIN操作(增加CPU開銷)需要從業務上規避
  
  三. 庫表散列
  
  表散列與水平分割相似,但沒有水平分割那樣的明顯分割界限,采用Hash算法把數據分散到各個分表中, 這樣IO更加均衡。一般來說,我們會按照業務或者功能模塊將數據庫進行分離,不同的模塊對應不同的數據庫或者表,再按照一定的策略對某個頁面或者功能進行更小的數據庫散列,比如用戶表,按照用戶ID進行表散列,散列128張表,則應就能夠低成本的提升系統的性能並且有很好的擴展性
  
  ---------------------
  
  摘自:奔跑著的國風 的CSDN 博客:https://blog.csdn.net/baidu_21578557/article/details/52384876

數據庫對表的三種分割技術