1. 程式人生 > >MYSQL中資料型別介紹

MYSQL中資料型別介紹

一、MySQL的資料型別

主要包括以下五大類:

整數型別:BIT、BOOL、TINY INT、SMALL INT、MEDIUM INT、 INT、 BIG INT

浮點數型別:FLOAT、DOUBLE、DECIMAL

字串型別:CHAR、VARCHAR、TINY TEXT、TEXT、MEDIUM TEXT、LONGTEXT、TINY BLOB、BLOB、MEDIUM BLOB、LONG BLOB

日期型別:Date、DateTime、TimeStamp、Time、Year

其他資料型別:BINARY、VARBINARY、ENUM、SET、Geometry、Point、MultiPoint、LineString、MultiLineString、Polygon、GeometryCollection等

1、整型

MySQL資料型別 含義(有符號)
tinyint(m) 1個位元組  範圍(-128~127)
smallint(m) 2個位元組  範圍(-32768~32767)
mediumint(m) 3個位元組  範圍(-8388608~8388607)
int(m) 4個位元組  範圍(-2147483648~2147483647)
bigint(m) 8個位元組  範圍(+-9.22*10的18次方)

取值範圍如果加了unsigned,則最大值翻倍,如tinyint unsigned的取值範圍為(0~256)。

 int(m)裡的m是表示SELECT查詢結果集中的顯示寬度,並不影響實際的取值範圍,沒有影響到顯示的寬度,不知道這個m有什麼用。

2、浮點型(float和double)

MySQL資料型別 含義
float(m,d) 單精度浮點型    8位精度(4位元組)     m總個數,d小數位
double(m,d) 雙精度浮點型    16位精度(8位元組)    m總個數,d小數位

設一個欄位定義為float(6,3),如果插入一個數123.45678,實際資料庫裡存的是123.457,但總個數還以實際為準,即6位。整數部分最大是3位,如果插入數12.123456,儲存的是12.1234,如果插入12.12,儲存的是12.1200.

3、定點數

浮點型在資料庫中存放的是近似值,而定點型別在資料庫中存放的是精確值。 

decimal(m,d) 引數m<65 是總個數,d<30且 d<m 是小數位。

4、字串(char,varchar,_text)

MySQL資料型別 含義
char(n) 固定長度,最多255個字元
varchar(n) 固定長度,最多65535個字元
tinytext 可變長度,最多255個字元
text 可變長度,最多65535個字元
mediumtext 可變長度,最多2的24次方-1個字元
longtext 可變長度,最多2的32次方-1個字元

char和varchar:

1.char(n) 若存入字元數小於n,則以空格補於其後,查詢之時再將空格去掉。所以char型別儲存的字串末尾不能有空格,varchar不限於此。 

2.char(n) 固定長度,char(4)不管是存入幾個字元,都將佔用4個位元組,varchar是存入的實際字元數+1個位元組(n<=255)或2個位元組(n>255),

所以varchar(4),存入3個字元將佔用4個位元組。 


3.char型別的字串檢索速度要比varchar型別的快。
varchar和text: 

1.varchar可指定n,text不能指定,內部儲存varchar是存入的實際字元數+1個位元組(n<=255)或2個位元組(n>255),text是實際字元數+2個字

節。 

2.text型別不能有預設值。 

3.varchar可直接建立索引,text建立索引要指定前多少個字元。varchar查詢速度快於text,在都建立索引的情況下,text的索引似乎不起作用。

5.二進位制資料(_Blob)

1._BLOB和_text儲存方式不同,_TEXT以文字方式儲存,英文儲存區分大小寫,而_Blob是以二進位制方式儲存,不分大小寫。

2._BLOB儲存的資料只能整體讀出。 

3._TEXT可以指定字符集,_BLO不用指定字符集。

6.日期時間型別

MySQL資料型別 含義
date 日期 '2008-12-2'
time 時間 '12:25:36'
datetime 日期時間 '2008-12-2 22:06:44'
timestamp 自動儲存記錄修改時間

若定義一個欄位為timestamp,這個欄位裡的時間資料會隨其他欄位修改的時候自動重新整理,所以這個資料型別的欄位可以存放這條記錄最後被修改的時間。

資料型別的屬性

MySQL關鍵字 含義
NULL 資料列可包含NULL值
NOT NULL 資料列不允許包含NULL值
DEFAULT 預設值
PRIMARY KEY 主鍵
AUTO_INCREMENT 自動遞增,適用於整數型別
UNSIGNED 無符號
CHARACTER SET name 指定一個字符集

二、MYSQL資料型別的長度和範圍

各資料型別及位元組長度一覽表:

資料型別 位元組長度 範圍或用法
Bit 1 無符號[0,255],有符號[-128,127],天緣部落格備註:BIT和BOOL布林型都佔用1位元組
TinyInt 1 整數[0,255]
SmallInt 2 無符號[0,65535],有符號[-32768,32767]
MediumInt 3 無符號[0,2^24-1],有符號[-2^23,2^23-1]]
Int 4 無符號[0,2^32-1],有符號[-2^31,2^31-1]
BigInt 8 無符號[0,2^64-1],有符號[-2^63 ,2^63 -1]
Float(M,D) 4 單精度浮點數。天緣部落格提醒這裡的D是精度,如果D<=24則為預設的FLOAT,如果D>24則會自動被轉換為DOUBLE型。
Double(M,D) 8  雙精度浮點。
Decimal(M,D) M+1或M+2 未打包的浮點數,用法類似於FLOAT和DOUBLE,天緣部落格提醒您如果在ASP中使用到Decimal資料型別,直接從資料庫讀出來的Decimal可能需要先轉換成Float或Double型別後再進行運算。
Date 3 以YYYY-MM-DD的格式顯示,比如:2009-07-19
Date Time 8 以YYYY-MM-DD HH:MM:SS的格式顯示,比如:2009-07-19 11:22:30
TimeStamp 4 以YYYY-MM-DD的格式顯示,比如:2009-07-19
Time 3 以HH:MM:SS的格式顯示。比如:11:22:30
Year 1 以YYYY的格式顯示。比如:2009
Char(M) M

定長字串。

VarChar(M) M 變長字串,要求M<=255
Binary(M) M 類似Char的二進位制儲存,特點是插入定長不足補0
VarBinary(M) M 類似VarChar的變長二進位制儲存,特點是定長不補0
Tiny Text Max:255 大小寫不敏感
Text Max:64K 大小寫不敏感
Medium Text Max:16M 大小寫不敏感
Long Text Max:4G 大小寫不敏感
TinyBlob Max:255 大小寫敏感
Blob Max:64K 大小寫敏感
MediumBlob Max:16M 大小寫敏感
LongBlob Max:4G 大小寫敏感
Enum 1或2 最大可達65535個不同的列舉值
Set 可達8 最大可達64個不同的值
Geometry
Point
LineString
Polygon
MultiPoint
MultiLineString
MultiPolygon
GeometryCollection

三、使用建議

1、在指定資料型別的時候一般是採用從小原則,比如能用TINY INT的最好就不用INT,能用FLOAT型別的就不用DOUBLE型別,這樣會對MYSQL在執行效率上提高很大,尤其是大資料量測試條件下。

2、不需要把資料表設計的太過複雜,功能模組上區分或許對於後期的維護更為方便,慎重出現大雜燴資料表

3、資料表和欄位的起名字也是一門學問

4、設計資料表結構之前請先想象一下是你的房間,或許結果會更加合理、高效

5、資料庫的最後設計結果一定是效率和可擴充套件性的折中,偏向任何一方都是欠妥的

選擇資料型別的基本原則

前提:使用適合儲存引擎。

選擇原則:根據選定的儲存引擎,確定如何選擇合適的資料型別。

下面的選擇方法按儲存引擎分類:

  • MyISAM 資料儲存引擎和資料列:MyISAM資料表,最好使用固定長度(CHAR)的資料列代替可變長度(VARCHAR)的資料列。
  • MEMORY儲存引擎和資料列:MEMORY資料表目前都使用固定長度的資料行儲存,因此無論使用CHAR或VARCHAR列都沒有關係。兩者都是作為CHAR型別處理的。
  • InnoDB 儲存引擎和資料列:建議使用 VARCHAR型別。


對於InnoDB資料表,內部的行儲存格式沒有區分固定長度和可變長度列(所有資料行都使用指向資料列值的頭指標),因此在本質上,使用固定長度的CHAR列不一定比使用可變長度VARCHAR列簡單。因而,主要的效能因素是資料行使用的儲存總量。由於CHAR平均佔用的空間多於VARCHAR,因 此使用VARCHAR來最小化需要處理的資料行的儲存總量和磁碟I/O是比較好的。

下面說一下固定長度資料列與可變長度的資料列。

char與varchar

CHAR和VARCHAR型別類似,但它們儲存和檢索的方式不同。它們的最大長度和是否尾部空格被保留等方面也不同。在儲存或檢索過程中不進行大小寫轉換。

下面的表顯示了將各種字串值儲存到CHAR(4)和VARCHAR(4)列後的結果,說明了CHAR和VARCHAR之間的差別:

CHAR(4) 儲存需求 VARCHAR(4) 儲存需求
'' '    ' 4個位元組 '' 1個位元組
'ab' 'ab  ' 4個位元組 'ab ' 3個位元組
'abcd' 'abcd' 4個位元組 'abcd' 5個位元組
'abcdefgh' 'abcd' 4個位元組 'abcd' 5個位元組


請注意上表中最後一行的值只適用不使用嚴格模式時;如果MySQL執行在嚴格模式,超過列長度不的值儲存,並且會出現錯誤。

從CHAR(4)和VARCHAR(4)列檢索的值並不總是相同,因為檢索時從CHAR列刪除了尾部的空格。通過下面的例子說明該差別:
mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));
Query OK, 0 rows affected (0.02 sec)
 
mysql> INSERT INTO vc VALUES ('ab  ', 'ab  ');
Query OK, 1 row affected (0.00 sec)
 
mysql> SELECT CONCAT(v, '+'), CONCAT(c, '+') FROM vc;
+----------------+----------------+
| CONCAT(v, '+') | CONCAT(c, '+') |
+----------------+----------------+
| ab  +          | ab+            |
+----------------+----------------+
1 row in set (0.00 sec)

text和blob

在使用text和blob欄位型別時要注意以下幾點,以便更好的發揮資料庫的效能。

①BLOB和TEXT值也會引起自己的一些問題,特別是執行了大量的刪除或更新操作的時候。刪除這種值會在資料表中留下很大的"空洞",以後填入這些"空洞"的記錄可能長度不同,為了提高效能,建議定期使用 OPTIMIZE TABLE 功能對這類表進行碎片整理.

②使用合成的(synthetic)索引。合成的索引列在某些時候是有用的。一種辦法是根據其它的列的內容建立一個雜湊值,並把這個值儲存在單獨的資料列中。接下來你就可以通過檢索雜湊值找到資料行了。但是,我們要注意這種技術只能用於精確匹配的查詢(雜湊值對於類似<或>=等範圍搜尋操作符 是沒有用處的)。我們可以使用MD5()函式生成雜湊值,也可以使用SHA1()或CRC32(),或者使用自己的應用程式邏輯來計算雜湊值。請記住數值型雜湊值可以很高效率地儲存。同樣,如果雜湊演算法生成的字串帶有尾部空格,就不要把它們儲存在CHAR或VARCHAR列中,它們會受到尾部空格去除的影響。

合成的雜湊索引對於那些BLOB或TEXT資料列特別有用。用雜湊識別符號值查詢的速度比搜尋BLOB列本身的速度快很多。

③在不必要的時候避免檢索大型的BLOB或TEXT值。例如,SELECT *查詢就不是很好的想法,除非你能夠確定作為約束條件的WHERE子句只會找到所需要的資料行。否則,你可能毫無目的地在網路上傳輸大量的值。這也是 BLOB或TEXT識別符號資訊儲存在合成的索引列中對我們有所幫助的例子。你可以搜尋索引列,決定那些需要的資料行,然後從合格的資料行中檢索BLOB或 TEXT值。

④把BLOB或TEXT列分離到單獨的表中。在某些環境中,如果把這些資料列移動到第二張資料表中,可以讓你把原資料表中 的資料列轉換為固定長度的資料行格式,那麼它就是有意義的。這會減少主表中的碎片,使你得到固定長度資料行的效能優勢。它還使你在主資料表上執行 SELECT *查詢的時候不會通過網路傳輸大量的BLOB或TEXT值。

浮點數與定點數

為了能夠引起大家的重視,在介紹浮點數與定點數以前先讓大家看一個例子:
mysql> CREATE TABLE test (c1 float(10,2),c2 decimal(10,2));
Query OK, 0 rows affected (0.29 sec)

mysql> insert into test values(131072.32,131072.32);
Query OK, 1 row affected (0.07 sec)

mysql> select * from test;
+-----------+-----------+
| c1        | c2        |
+-----------+-----------+
| 131072.31 | 131072.32 |
+-----------+-----------+
1 row in set (0.00 sec)

從上面的例子中我們看到c1列的值由131072.32變成了131072.31,這就是浮點數的不精確性造成的。

在mysql中float、double(或real)是浮點數,decimal(或numberic)是定點數。

浮點數相對於定點數的優點是在長度一定的情況下,浮點數能夠表示更大的資料範圍;它的缺點是會引起精度問題。在今後關於浮點數和定點數的應用中,大家要記住以下幾點:

  1. 浮點數存在誤差問題;
  2. 對貨幣等對精度敏感的資料,應該用定點數表示或儲存;
  3. 程式設計中,如果用到浮點數,要特別注意誤差問題,並儘量避免做浮點數比較;
  4. 要注意浮點數中一些特殊值的處理。