MYSQL中資料型別介紹
一、MySQL的資料型別
主要包括以下五大類:
整數型別:BIT、BOOL、TINY INT、SMALL INT、MEDIUM INT、 INT、 BIG INT
浮點數型別:FLOAT、DOUBLE、DECIMAL
字串型別:CHAR、VARCHAR、TINY TEXT、TEXT、MEDIUM TEXT、LONGTEXT、TINY BLOB、BLOB、MEDIUM BLOB、LONG BLOB
日期型別:Date、DateTime、TimeStamp、Time、Year
其他資料型別:BINARY、VARBINARY、ENUM、SET、Geometry、Point、MultiPoint、LineString、MultiLineString、Polygon、GeometryCollection等
1、整型
MySQL資料型別 | 含義(有符號) |
tinyint(m) | 1個位元組 範圍(-128~127) |
smallint(m) | 2個位元組 範圍(-32768~32767) |
mediumint(m) | 3個位元組 範圍(-8388608~8388607) |
int(m) | 4個位元組 範圍(-2147483648~2147483647) |
bigint(m) | 8個位元組 範圍(+-9.22*10的18次方) |
取值範圍如果加了unsigned,則最大值翻倍,如tinyint unsigned的取值範圍為(0~256)。
int(m)裡的m是表示SELECT查詢結果集中的顯示寬度,並不影響實際的取值範圍,沒有影響到顯示的寬度,不知道這個m有什麼用。
2、浮點型(float和double)
MySQL資料型別 | 含義 |
float(m,d) | 單精度浮點型 8位精度(4位元組) m總個數,d小數位 |
double(m,d) | 雙精度浮點型 16位精度(8位元組) m總個數,d小數位 |
設一個欄位定義為float(6,3),如果插入一個數123.45678,實際資料庫裡存的是123.457,但總個數還以實際為準,即6位。整數部分最大是3位,如果插入數12.123456,儲存的是12.1234,如果插入12.12,儲存的是12.1200.
3、定點數
浮點型在資料庫中存放的是近似值,而定點型別在資料庫中存放的是精確值。
decimal(m,d) 引數m<65 是總個數,d<30且 d<m 是小數位。
4、字串(char,varchar,_text)
MySQL資料型別 | 含義 |
char(n) | 固定長度,最多255個字元 |
varchar(n) | 固定長度,最多65535個字元 |
tinytext | 可變長度,最多255個字元 |
text | 可變長度,最多65535個字元 |
mediumtext | 可變長度,最多2的24次方-1個字元 |
longtext | 可變長度,最多2的32次方-1個字元 |
char和varchar:
1.char(n) 若存入字元數小於n,則以空格補於其後,查詢之時再將空格去掉。所以char型別儲存的字串末尾不能有空格,varchar不限於此。
2.char(n) 固定長度,char(4)不管是存入幾個字元,都將佔用4個位元組,varchar是存入的實際字元數+1個位元組(n<=255)或2個位元組(n>255),
所以varchar(4),存入3個字元將佔用4個位元組。
3.char型別的字串檢索速度要比varchar型別的快。
varchar和text:
1.varchar可指定n,text不能指定,內部儲存varchar是存入的實際字元數+1個位元組(n<=255)或2個位元組(n>255),text是實際字元數+2個字
節。
2.text型別不能有預設值。
3.varchar可直接建立索引,text建立索引要指定前多少個字元。varchar查詢速度快於text,在都建立索引的情況下,text的索引似乎不起作用。
5.二進位制資料(_Blob)
1._BLOB和_text儲存方式不同,_TEXT以文字方式儲存,英文儲存區分大小寫,而_Blob是以二進位制方式儲存,不分大小寫。
2._BLOB儲存的資料只能整體讀出。
3._TEXT可以指定字符集,_BLO不用指定字符集。
6.日期時間型別
MySQL資料型別 | 含義 |
date | 日期 '2008-12-2' |
time | 時間 '12:25:36' |
datetime | 日期時間 '2008-12-2 22:06:44' |
timestamp | 自動儲存記錄修改時間 |
若定義一個欄位為timestamp,這個欄位裡的時間資料會隨其他欄位修改的時候自動重新整理,所以這個資料型別的欄位可以存放這條記錄最後被修改的時間。
資料型別的屬性
MySQL關鍵字 | 含義 |
NULL | 資料列可包含NULL值 |
NOT NULL | 資料列不允許包含NULL值 |
DEFAULT | 預設值 |
PRIMARY KEY | 主鍵 |
AUTO_INCREMENT | 自動遞增,適用於整數型別 |
UNSIGNED | 無符號 |
CHARACTER SET name | 指定一個字符集 |
二、MYSQL資料型別的長度和範圍
各資料型別及位元組長度一覽表:
資料型別 | 位元組長度 | 範圍或用法 |
Bit | 1 | 無符號[0,255],有符號[-128,127],天緣部落格備註:BIT和BOOL布林型都佔用1位元組 |
TinyInt | 1 | 整數[0,255] |
SmallInt | 2 | 無符號[0,65535],有符號[-32768,32767] |
MediumInt | 3 | 無符號[0,2^24-1],有符號[-2^23,2^23-1]] |
Int | 4 | 無符號[0,2^32-1],有符號[-2^31,2^31-1] |
BigInt | 8 | 無符號[0,2^64-1],有符號[-2^63 ,2^63 -1] |
Float(M,D) | 4 | 單精度浮點數。天緣部落格提醒這裡的D是精度,如果D<=24則為預設的FLOAT,如果D>24則會自動被轉換為DOUBLE型。 |
Double(M,D) | 8 | 雙精度浮點。 |
Decimal(M,D) | M+1或M+2 | 未打包的浮點數,用法類似於FLOAT和DOUBLE,天緣部落格提醒您如果在ASP中使用到Decimal資料型別,直接從資料庫讀出來的Decimal可能需要先轉換成Float或Double型別後再進行運算。 |
Date | 3 | 以YYYY-MM-DD的格式顯示,比如:2009-07-19 |
Date Time | 8 | 以YYYY-MM-DD HH:MM:SS的格式顯示,比如:2009-07-19 11:22:30 |
TimeStamp | 4 | 以YYYY-MM-DD的格式顯示,比如:2009-07-19 |
Time | 3 | 以HH:MM:SS的格式顯示。比如:11:22:30 |
Year | 1 | 以YYYY的格式顯示。比如:2009 |
Char(M) | M |
定長字串。 |
VarChar(M) | M | 變長字串,要求M<=255 |
Binary(M) | M | 類似Char的二進位制儲存,特點是插入定長不足補0 |
VarBinary(M) | M | 類似VarChar的變長二進位制儲存,特點是定長不補0 |
Tiny Text | Max:255 | 大小寫不敏感 |
Text | Max:64K | 大小寫不敏感 |
Medium Text | Max:16M | 大小寫不敏感 |
Long Text | Max:4G | 大小寫不敏感 |
TinyBlob | Max:255 | 大小寫敏感 |
Blob | Max:64K | 大小寫敏感 |
MediumBlob | Max:16M | 大小寫敏感 |
LongBlob | Max:4G | 大小寫敏感 |
Enum | 1或2 | 最大可達65535個不同的列舉值 |
Set | 可達8 | 最大可達64個不同的值 |
Geometry | ||
Point | ||
LineString | ||
Polygon | ||
MultiPoint | ||
MultiLineString | ||
MultiPolygon | ||
GeometryCollection |
三、使用建議
1、在指定資料型別的時候一般是採用從小原則,比如能用TINY INT的最好就不用INT,能用FLOAT型別的就不用DOUBLE型別,這樣會對MYSQL在執行效率上提高很大,尤其是大資料量測試條件下。
2、不需要把資料表設計的太過複雜,功能模組上區分或許對於後期的維護更為方便,慎重出現大雜燴資料表
3、資料表和欄位的起名字也是一門學問
4、設計資料表結構之前請先想象一下是你的房間,或許結果會更加合理、高效
5、資料庫的最後設計結果一定是效率和可擴充套件性的折中,偏向任何一方都是欠妥的
選擇資料型別的基本原則
前提:使用適合儲存引擎。
選擇原則:根據選定的儲存引擎,確定如何選擇合適的資料型別。
下面的選擇方法按儲存引擎分類:
- MyISAM 資料儲存引擎和資料列:MyISAM資料表,最好使用固定長度(CHAR)的資料列代替可變長度(VARCHAR)的資料列。
- MEMORY儲存引擎和資料列:MEMORY資料表目前都使用固定長度的資料行儲存,因此無論使用CHAR或VARCHAR列都沒有關係。兩者都是作為CHAR型別處理的。
- InnoDB 儲存引擎和資料列:建議使用 VARCHAR型別。
對於InnoDB資料表,內部的行儲存格式沒有區分固定長度和可變長度列(所有資料行都使用指向資料列值的頭指標),因此在本質上,使用固定長度的CHAR列不一定比使用可變長度VARCHAR列簡單。因而,主要的效能因素是資料行使用的儲存總量。由於CHAR平均佔用的空間多於VARCHAR,因 此使用VARCHAR來最小化需要處理的資料行的儲存總量和磁碟I/O是比較好的。
下面說一下固定長度資料列與可變長度的資料列。
char與varchar
CHAR和VARCHAR型別類似,但它們儲存和檢索的方式不同。它們的最大長度和是否尾部空格被保留等方面也不同。在儲存或檢索過程中不進行大小寫轉換。
下面的表顯示了將各種字串值儲存到CHAR(4)和VARCHAR(4)列後的結果,說明了CHAR和VARCHAR之間的差別:
值 | CHAR(4) | 儲存需求 | VARCHAR(4) | 儲存需求 |
'' | ' ' | 4個位元組 | '' | 1個位元組 |
'ab' | 'ab ' | 4個位元組 | 'ab ' | 3個位元組 |
'abcd' | 'abcd' | 4個位元組 | 'abcd' | 5個位元組 |
'abcdefgh' | 'abcd' | 4個位元組 | 'abcd' | 5個位元組 |
請注意上表中最後一行的值只適用不使用嚴格模式時;如果MySQL執行在嚴格模式,超過列長度不的值不儲存,並且會出現錯誤。
從CHAR(4)和VARCHAR(4)列檢索的值並不總是相同,因為檢索時從CHAR列刪除了尾部的空格。通過下面的例子說明該差別:
mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));
Query OK, 0 rows affected (0.02 sec)
mysql> INSERT INTO vc VALUES ('ab ', 'ab ');
Query OK, 1 row affected (0.00 sec)
mysql> SELECT CONCAT(v, '+'), CONCAT(c, '+') FROM vc;
+----------------+----------------+
| CONCAT(v, '+') | CONCAT(c, '+') |
+----------------+----------------+
| ab + | ab+ |
+----------------+----------------+
1 row in set (0.00 sec)
text和blob
在使用text和blob欄位型別時要注意以下幾點,以便更好的發揮資料庫的效能。
①BLOB和TEXT值也會引起自己的一些問題,特別是執行了大量的刪除或更新操作的時候。刪除這種值會在資料表中留下很大的"空洞",以後填入這些"空洞"的記錄可能長度不同,為了提高效能,建議定期使用 OPTIMIZE TABLE 功能對這類表進行碎片整理.
②使用合成的(synthetic)索引。合成的索引列在某些時候是有用的。一種辦法是根據其它的列的內容建立一個雜湊值,並把這個值儲存在單獨的資料列中。接下來你就可以通過檢索雜湊值找到資料行了。但是,我們要注意這種技術只能用於精確匹配的查詢(雜湊值對於類似<或>=等範圍搜尋操作符 是沒有用處的)。我們可以使用MD5()函式生成雜湊值,也可以使用SHA1()或CRC32(),或者使用自己的應用程式邏輯來計算雜湊值。請記住數值型雜湊值可以很高效率地儲存。同樣,如果雜湊演算法生成的字串帶有尾部空格,就不要把它們儲存在CHAR或VARCHAR列中,它們會受到尾部空格去除的影響。
合成的雜湊索引對於那些BLOB或TEXT資料列特別有用。用雜湊識別符號值查詢的速度比搜尋BLOB列本身的速度快很多。
③在不必要的時候避免檢索大型的BLOB或TEXT值。例如,SELECT *查詢就不是很好的想法,除非你能夠確定作為約束條件的WHERE子句只會找到所需要的資料行。否則,你可能毫無目的地在網路上傳輸大量的值。這也是 BLOB或TEXT識別符號資訊儲存在合成的索引列中對我們有所幫助的例子。你可以搜尋索引列,決定那些需要的資料行,然後從合格的資料行中檢索BLOB或 TEXT值。
④把BLOB或TEXT列分離到單獨的表中。在某些環境中,如果把這些資料列移動到第二張資料表中,可以讓你把原資料表中 的資料列轉換為固定長度的資料行格式,那麼它就是有意義的。這會減少主表中的碎片,使你得到固定長度資料行的效能優勢。它還使你在主資料表上執行 SELECT *查詢的時候不會通過網路傳輸大量的BLOB或TEXT值。
浮點數與定點數
為了能夠引起大家的重視,在介紹浮點數與定點數以前先讓大家看一個例子:
mysql> CREATE TABLE test (c1 float(10,2),c2 decimal(10,2));
Query OK, 0 rows affected (0.29 sec)
mysql> insert into test values(131072.32,131072.32);
Query OK, 1 row affected (0.07 sec)
mysql> select * from test;
+-----------+-----------+
| c1 | c2 |
+-----------+-----------+
| 131072.31 | 131072.32 |
+-----------+-----------+
1 row in set (0.00 sec)
從上面的例子中我們看到c1列的值由131072.32變成了131072.31,這就是浮點數的不精確性造成的。
在mysql中float、double(或real)是浮點數,decimal(或numberic)是定點數。
浮點數相對於定點數的優點是在長度一定的情況下,浮點數能夠表示更大的資料範圍;它的缺點是會引起精度問題。在今後關於浮點數和定點數的應用中,大家要記住以下幾點:
- 浮點數存在誤差問題;
- 對貨幣等對精度敏感的資料,應該用定點數表示或儲存;
- 程式設計中,如果用到浮點數,要特別注意誤差問題,並儘量避免做浮點數比較;
- 要注意浮點數中一些特殊值的處理。