1. 程式人生 > >SQL中char、varchar、nvarchar、text 的區別

SQL中char、varchar、nvarchar、text 的區別

utf 包含 索引 區別 了解 byte 地方 安全 字符集

char

char是定長的,也就是當你輸入的字符小於你指定的數目時,char(8),你輸入的字符小於8時,它會再後面補空值。當你輸入的字符大於指定的數時,它會截取超出的字符。

nvarchar(n) 中間的 n 代表字符的個數,不是字節的個數

包含 n 個字符的可變長度 Unicode 字符數據。n 的值必須介於 1 與 4,000 之間。字節的存儲大小是所輸入字符個數的兩倍。所輸入的數據字符長度可以為零。

varchar(n)

長度為 n 個字節的可變長度且非 Unicode 的字符數據。n 必須是一個介於 1 和 8,000 之間的數值。存儲大小為輸入數據的字節的實際長度,而不是 n 個字節。所輸入的數據字符長度可以為零。

text

按照字符數量來占用空間,用2字節記錄存儲數據大小,這2字節不占用text數據的空間。沒有空間浪費。速度慢,尤其創建臨時表的時候會異常悲劇。

比如:

char(10),保存’ab’要占用10byte,因為存的是’ab ’,後面8個空格。

varchar(10),保存’ab’要占用3byte,數據占2個字符,另外一個字節記錄數據大小

速度

1、char,定長,基本沒有碎片,索引速度極快。

2、varchar,不定長,索引速度沒有char快。理論上可以添加全部索引,但是數據長度太大時索引也會截取數據前面的一部分。

3、text,不定長,速度慢,索引只能是前綴索引。

存儲限制

1、char(n),n最大255。

2、varchar(n),n最大65535,另外,按照字符集,不能超過65525字節。這65535字節不能全用來存數據,因為有1-2字節要用來存占用長度,255字節以下用1字節存儲長度,255字節以上用2字節存儲長度。

3、text,上限65535字節,再多也能存,因為還有mediumtext上限2^24-3字節大概16m,longtext上限2^32-4字節大概4G。

自動去掉尾部空格

1、char(n),會去掉結尾的空格

2、varchar(n),不會去掉結尾空格

3、text,不會去掉結尾空格

比如:

1、char(10),保存字符串’ab ’(一個空格),存到數據庫就是’ab ’(有8個空格),查詢出來就是’ab’(沒有空格),占10byte。

2、varchar(10),保存字符串’ab ’ (有一個空格),存到數據庫就是’ab ’(有1個空格),查詢出來也是’ab ’(一個空格),占3byte。

記錄數據的大小

1、varchar(n),按字符長度占用空間,但會有1-2字節來記錄數據大小。

2、text,也按字符長度占用空間,但是記錄在數據之外,不占用數據的空間。

註意

1、存儲定長字符串,盡量用char,索引速度極快。

2、長度255以上字符串,只能用varchar和text。

3、能用varchar就不要用text。

4、text不能設置默認值。

5、和char或者varchar之類的字段不同,text中存儲的內容不會和行數據存在一起,而是數據庫另外找地方存儲的,數據庫自己記了指針。據說varchar(255+)也是這麽存的。

6、text上限比較高,安全性上需要註意,在異常狀態下可能會存儲非常大的數據,造成很多問題,哪怕用varchar(10000)都能給截斷一下呢。

7、理論上varchar的長度最大65535字符,但能不能這麽設置也得看字符集,因為mysql有規定,除了text和blob之類的類型外,單字段長度不能超過65535字節,所以,如果字符集是最基礎的latin1,一個字符一個字節,那就可以定義varchar(65535),但如果設置為utf8,一個字符3個字節,那就只能定義varchar(21485)。

總結

1、CHAR:CHAR存儲定長數據很方便,CHAR字段上的索引效率級高,比如定義char(10),那麽不論你存儲的數據是否達到了10個字節,都要占去10個字節的空間。

2、VARCHAR:存儲變長數據,但存儲效率沒有CHAR高。如果一個字段可能的值是不固定長度的,我們只知道它不可能超過10個字符,把它定義為 VARCHAR(10)是最合算的。VARCHAR類型的實際長度是它的值的實際長度+1。為什麽“+1”呢?這一個字節用於保存實際使用了多大的長度。 從空間上考慮,用varchar合適;從效率上考慮,用char合適,關鍵是根據實際情況找到權衡點。

3、TEXT:text存儲可變長度的非Unicode數據,最大長度為2^31-1(2,147,483,647)個字符。

4、NCHAR、NVARCHAR、NTEXT。這三種從名字上看比前面三種多了個“N”。它表示存儲的是Unicode數據類型的字符。我們知道字符中,英文字符只需要一個字節存儲就足夠了,但漢字眾多,需要兩個字節存儲,英文與漢字同時存在時容易造成混亂,Unicode字符集就是為了解決字符集這種不兼容的問題而產生的,它所有的字符都用兩個字節表示,即英文字符也是用兩個字節表示。nchar、nvarchar的長度是在1到4000之間。和char、varchar比較起來,nchar、nvarchar則最多存儲4000個字符,不論是英文還是漢字;而char、varchar最多能存儲8000個英文,4000個漢字。可以看出使用nchar、nvarchar數據類型時不用擔心輸入的字符是英文還是漢字,較為方便,但在存儲英文時數量上有些損失。
所以一般來說,如果含有中文字符,用nchar/nvarchar,如果純英文和數字,用char/varchar。

SQL中char、varchar、nvarchar、text 的區別