1. 程式人生 > >mysql中char與varchar的區別

mysql中char與varchar的區別

區別:char:定長,效率高,一般用於固定長度的表單提交資料儲存 ;例如:身份證號,手機號,電話,密碼等

varchar:不定長,效率偏低
1、varchar型別的變化
MySQL 資料庫的varchar型別在4.1以下的版本中的最大長度限制為255,其資料範圍可以是0255或1255(根據不同版本資料庫來定)。在 MySQL5.0以上的版本中,varchar資料型別的長度支援到了65535,也就是說可以存放65532個位元組的資料,起始位和結束位佔去了3個字 節,也就是說,在4.1或以下版本中需要使用固定的TEXT或BLOB格式存放的資料可以使用可變長的varchar來存放,這樣就能有效的減少資料庫文 件的大小。

MySQL 資料庫的varchar型別在4.1以下的版本中,nvarchar(儲存的是Unicode資料型別的字元)不管是一個字元還是一個漢字,都存為2個字 節 ,一般用作中文或者其他語言輸入,這樣不容易亂碼 ;varchar: 漢字是2個位元組,其他字元存為1個位元組 ,varchar適合輸入英文和數字。

4.0版本以下,varchar(20),指的是20位元組,如果存放UTF8漢字時,只能存6個(每個漢字3位元組) ;5.0版本以上,varchar(20),指的是20字元,無論存放的是數字、字母還是UTF8漢字(每個漢字3位元組),都可以存放20個,最大大小是 65532位元組 ;varchar(20)在Mysql4中最大也不過是20個位元組,但是Mysql5根據編碼不同,儲存大小也不同,具體有以下規則:

a) 儲存限制

varchar 欄位是將實際內容單獨儲存在聚簇索引之外,內容開頭用1到2個位元組表示實際長度(長度超過255時需要2個位元組),因此最大長度不能超過65535。

b) 編碼長度限制

字元型別若為gbk,每個字元最多佔2個位元組,最大長度不能超過32766;

字元型別若為utf8,每個字元最多佔3個位元組,最大長度不能超過21845。

若定義的時候超過上述限制,則varchar欄位會被強行轉為text型別,併產生warning。

c) 行長度限制

導致實際應用中varchar長度限制的是一個行定義的長度。 MySQL要求一個行的定義長度不能超過65535。若定義的表長度超過這個值,則提示

ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TEXT or BLOBs。

2、CHAR(M), VARCHAR(M)不同之處
CHAR(M)定義的列的長度為固定的,M取值可以為0~255之間,當儲存CHAR值時,在它們的右邊填充空格以達到指定的長度。當檢 索到CHAR值時,尾部的空格被刪除掉。在儲存或檢索過程中不進行大小寫轉換。CHAR儲存定長資料很方便,CHAR欄位上的索引效率級高,比如定義 char(10),那麼不論你儲存的資料是否達到了10個位元組,都要佔去10個位元組的空間,不足的自動用空格填充。

VARCHAR(M)定義的列的長度為可變長字串,M取值可以為0~65535之間,(VARCHAR的最大有效長度由最大行大小和使用 的字符集確定。整體最大長度是65,532位元組)。VARCHAR值儲存時只儲存需要的字元數,另加一個位元組來記錄長度(如果列宣告的長度超過255,則 使用兩個位元組)。VARCHAR值儲存時不進行填充。當值儲存和檢索時尾部的空格仍保留,符合標準SQL。varchar儲存變長資料,但儲存效率沒有 CHAR高。如果一個欄位可能的值是不固定長度的,我們只知道它不可能超過10個字元,把它定義為 VARCHAR(10)是最合算的。VARCHAR型別的實際長度是它的值的實際長度+1。為什麼”+1″呢?這一個位元組用於儲存實際使用了多大的長度。 從空間上考慮,用varchar合適;從效率上考慮,用char合適,關鍵是根據實際情況找到權衡點。

CHAR和VARCHAR最大的不同就是一個是固定長度,一個是可變長度。由於是可變長度,因此實際儲存的時候是實際字串再加上一個記錄 字串長度的位元組(如果超過255則需要兩個位元組)。如果分配給CHAR或VARCHAR列的值超過列的最大長度,則對值進行裁剪以使其適合。如果被裁掉 的字元不是空格,則會產生一條警告。如果裁剪非空格字元,則會造成錯誤(而不是警告)並通過使用嚴格SQL模式禁用值的插入。

3、VARCHAR和TEXT、BlOB型別的區別
VARCHAR,BLOB和TEXT型別是變長型別,對於其儲存需求取決於列值的實際長度(在前面的表格中用L表示),而不是取決於型別 的最大可能尺寸。例如,一個VARCHAR(10)列能儲存最大長度為10個字元的一個字串,實際的儲存需要是字串的長度 ,加上1個位元組以記錄字串的長度。對於字串’abcd’,L是4而儲存要求是5個位元組。

BLOB和TEXT型別需要1,2,3或4個位元組來記錄列值的長度,這取決於型別的最大可能長度。VARCHAR需要定義大小,有65535位元組的最大限制;TEXT則不需要。如果你把一個超過列型別最大長度的值賦給一個BLOB或TEXT列,值被截斷以適合它。

一個BLOB是一個能儲存可變數量的資料的二進位制的大物件。4個BLOB型別TINYBLOB、BLOB、MEDIUMBLOB和LONGBLOB僅僅在他們能儲存值的最大長度方面有所不同。

BLOB 可以儲存圖片,TEXT不行,TEXT只能儲存純文字檔案。4個TEXT型別TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT對應於 4個BLOB型別,並且有同樣的最大長度和儲存需求。在BLOB和TEXT型別之間的唯一差別是對BLOB值的排序和比較以大小寫敏感方式執行,而對 TEXT值是大小寫不敏感的。換句話說,一個TEXT是一個大小寫不敏感的BLOB。

4、總結char,varchar和text的區別
長度的區別,char範圍是0~255,varchar最長是64k,但是注意這裡的64k是整個row的長度,要考慮到其它的 column,還有如果存在not null的時候也會佔用一位,對不同的字符集,有效長度還不一樣,比如utf8的,最多21845,還要除去別的column,但是varchar在一般 情況下儲存都夠用了。如果遇到了大文字,考慮使用text,最大能到4G。

效率來說基本是char>varchar>text,但是如果使用的是Innodb引擎的話,推薦使用varchar代替char。

char和varchar可以有預設值,text不能指定預設值。

資料庫選擇合適的資料型別儲存還是很有必要的,對效能有一定影響。這裡在零碎記錄兩筆,對於int型別的,如果不需要存取負值,最好加上unsigned;對於經常出現在where語句中的欄位,考慮加索引,整形的尤其適合加索引。