1. 程式人生 > >欄位型別與合理的選擇欄位型別

欄位型別與合理的選擇欄位型別

欄位型別

數值

MySQL 的數值資料型別可以大致劃分為兩個類別,一個是整數,另一個是浮點數或小數。
許多不同的子型別對這些類別中的每一個都是可用的,每個子型別支援不同大小的資料,並且 MySQL 允許我們指定數值欄位中的值是否有正負之分(UNSIGNED)或者用零填補(ZEROFILL)。

  • INT
    在 MySQL 中支援的 5 個主要整數型別是 TINYINT,SMALLINT,MEDIUMINT,INT 和 BIGINT。這些型別在很大程度上是相同的,只有它們儲存的值的大小是不相同的。

MySQL 以一個可選的顯示寬度指示器的形式對 SQL 標準進行擴充套件(如 INT(6),6即是其寬度指示器,該寬度指示器並不會影響int列儲存欄位的大小,也就是說,超過6位它不會自動擷取,依然會儲存,只有超過它本身的儲存範圍才會擷取;此處寬度指示器的作用在於該欄位是否有zerofill,如果有就未滿足6位的部分就會用0來填充),這樣當從資料庫檢索一個值時,可以把這個值加長到指定的長度。例如,指定一個欄位的型別為 INT(6),就可以保證所包含數字少於 6 個的值從資料庫中檢索出來時能夠自動地用空格填充。需要注意的是,使用一個寬度指示器不會影響欄位的大小和它可以儲存的值的範圍。

萬一我們需要對一個欄位儲存一個超出許可範圍的數字,MySQL 會根據允許範圍最接近它的一端截短後再進行儲存。還有一個比較特別的地方是,MySQL 會在不合規定的值插入表前自動修改為 0。

  • unsigned 和 zerofill
    UNSIGNED 修飾符規定欄位只儲存正值,即無符號,而mysql欄位預設是有符號的。因為不需要儲存數字的正、負符號,可以在儲時節約一個"位"的空間(即翻一倍)。從而增大這個欄位可以儲存的值的範圍。注意這個修飾符要緊跟在數值型別後面;
    ZEROFILL 修飾符規定 0(不是空格)可以用來真補輸出的值。使用這個修飾符可以阻止 MySQL 資料庫儲存負值,如果某列設定為zerofill,那它自動就unsigned。這個值要配合int,tinyint,smallint,midiumint等欄位的寬度指示器來用;XXint(M),如果沒有zerofill,這個M的寬度指示器是沒有意義的.(注意,測試前導0的時候,還是去黑視窗測試;)

為什麼mysql儲存的值要分有符號和無符號呢?因為一個位元組,佔8bit;也就1個bit有0和1兩種可能,8個bit就是2^8 = 256種可能,也就是0~255;但如果是有符號的話,就得拿一個1bit來儲存這個負號,本來8bit只剩7bit,2^7 = 128,也就是-128~127(正數部分包含一個0);

  • FLOAT、DOUBLE 和 DECIMAL 型別
    MySQL 支援的三個浮點型別是 FLOAT、DOUBLE 和 DECIMAL 型別。FLOAT 數值型別用於表示單精度浮點數值,而 DOUBLE 數值型別用於表示雙精度浮點數值。
    與整數一樣,這些型別也帶有附加引數:一個顯示寬度指示器和一個小數點指示器(必須要帶有指示器,要不然會查不到結果,並且寬度指示器和XXint型別的寬度指示器不同,這裡是有實際限制寬度的)。比如語句 FLOAT(7,3) 規定顯示的值不會超過 7 位數字(包括小數位),小數點後面帶有 3 位數字。對於小數點後面的位數超過允許範圍的值,MySQL 會自動將它四捨五入為最接近它的值,再插入它。
    DECIMAL 資料型別用於精度要求非常高的計算中,這種型別允許指定數值的精度和計數方法作為選擇引數。精度在這裡指為這個值儲存的有效數字的總個數,而計數方法表示小數點後數字的位數。比如語句 DECIMAL(7,3) 規定了儲存的值不會超過 7 位數字,並且小數點後不超過 3 位。
    FLOAT 型別在長度比較高比如 float(10,2)和 decimal(10,2)同時插入一個符合(10,2)寬度的數值,float 就會出現最後小數點出現一些出入;
    UNSIGNED 和 ZEROFILL 修飾符也可以被 FLOAT、DOUBLE 和 DECIMAL 資料型別使用。並且效果與 INT 資料型別相同。

關於flaot和double
在這裡我建議,乾脆忘記mysql有double這個資料型別。至於why?就不要管它了

字串型別

MySQL 提供了 8 個基本的字串型別,可以儲存的範圍從簡單的一個字元到巨大的文字塊或二進位制字串資料。

  • BINARY
    BINARY不是函式,是型別轉換運算子,它用來強制它後面的字串為一個二進位制字串,可以理解為在字串比較的時候區分大小寫

    SELECT BINARY 'ABCD' = 'abcd' as COM1,'ABCD' = 'abcd' as COM2; -- COM1輸出為0,COM2輸出為1; 
  • CHAR 和 VARCHAR 型別
    CHAR 型別用於定長字串,並且必須在圓括號內用一個大小修飾符來定義。這個大小修飾符的範圍從 0-255。比指定長度大的值將被截短,而比指定長度小的值將會用空格作填補。

CHAR 型別可以使用 BINARY 修飾符。當用於比較運算時,這個修飾符使 CHAR 以二進位制方式參於運算,而不是以傳統的區分大小寫的方式。

CHAR 型別的一個變體是 VARCHAR 型別。它是一種可變長度的字串型別,並且也必須帶有一個範圍在 0-255 之間的指示器。

CHAR 和 VARCHGAR 不同之處在於 MYSQL 資料庫處理這個指示器的方式:CHAR 把這個大小視為值的大小,不長度不足的情況下就用空格補足。而 VARCHAR 型別把它視為最大值並且只使用儲存字串實際需要的長度(增加一個額外位元組來儲存字串本身的長度)來儲存值。所以短於指示器長度的 VARCHAR 型別不會被空格填補,但長於指示器的值仍然會被截短。

因為 VARCHAR 型別可以根據實際內容動態改變儲存值的長度,所以在不能確定欄位需要多少字元時使用 VARCHAR 型別可以大大地節約磁碟空間、提高儲存效率。但如果確切知道字串長度,比如就在50~55之間,那就用 CHAR 因為 CHAR 型別由於本身定長的特性使其效能要高於 VARCHAR;

VARCHAR 型別在使用 BINARY 修飾符時與 CHAR 型別完全相同。

  • TEXT 和 BLOB 型別
    對於欄位長度要求超過 255 個的情況下,MySQL 提供了 TEXT 和 BLOB 兩種型別。根據儲存資料的大小,它們都有不同的子型別。這些大型的資料用於儲存文字塊或影象、聲音檔案等二進位制資料型別。

TEXT 和 BLOB 型別在分類和比較上存在區別。BLOB 型別區分大小寫,而 TEXT 不區分大小寫。大小修飾符不用於各種 BLOB 和 TEXT 子型別。比指定型別支援的最大範圍大的值將被自動截短。

時間型別

在處理日期和時間型別的值時,MySQL 帶有 5 個不同的資料型別可供選擇。

  • DATE、TIME 和 YEAR 型別
    MySQL 用 DATE 和 YEAR 型別儲存簡單的日期值,使用 TIME 型別儲存時間值。這些型別可以描述為字串或不帶分隔符的整數序列。如果描述為字串,DATE 型別的值應該使用連字號作為分隔符分開,而 TIME 型別的值應該使用冒號作為分隔符分開。

需要注意的是,沒有冒號分隔符的 TIME 型別值,將會被 MySQL 理解為持續的時間,而不是時間戳。

MySQL 還對日期的年份中的兩個數字的值,或是 SQL 語句中為 YEAR 型別輸入的兩個數字進行最大限度的通譯。因為所有 YEAR 型別的值必須用 4 個數字儲存。MySQL 試圖將 2 個數字的年份轉換為 4 個數字的值。把在 00-69 範圍內的值轉換到 2000-2069 範圍內。把 70-99 範圍內的值轉換到 1970-1979 之內。如果 MySQL 自動轉換後的值並不符合我們的需要,請輸入 4 個數字表示的年份。

  • DATETIME 和 TIMESTAMP 型別
    除了日期和時間資料型別,MySQL 還支援 DATETIME 和 TIMESTAMP 這兩種混合型別。它們可以把日期和時間作為單個的值進行儲存。這兩種型別通常用於自動儲存包含當前日期和時間的時間戳,並可在需要執行大量資料庫事務和需要建立一個除錯和審查用途的審計跟蹤的應用程式中發揮良好作用。

如果我們對 TIMESTAMP 型別的欄位沒有明確賦值,或是被賦與了 null 值。MySQL 會自動使用系統當前的日期和時間來填充它。

複合型別

MySQL 還支援兩種複合資料型別 ENUM 和 SET,它們擴充套件了 SQL 規範。雖然這些型別在技術上是字串型別,但是可以被視為不同的資料型別。一個 ENUM 型別只允許從一個集合中取得一個值;而 SET 型別允許從一個集合中取得任意多個值。

  • ENUM 型別
    ENUM 型別因為只允許在集合中取得一個值,有點類似於單選項。在處理相互排拆的資料時容易讓人理解,比如人類的性別。ENUM 型別欄位可以從集合中取得一個值或使用 null 值,除此之外的輸入將會使 MySQL 在這個欄位中插入一個空字串。另外如果插入值的大小寫與集合中值的大小寫不匹配,MySQL 會自動使用插入值的大小寫轉換成與集合中大小寫一致的值。

ENUM 型別在系統內部可以儲存為數字,並且從 1 開始用數字做索引。一個 ENUM 型別最多可以包含 65536 個元素,其中一個元素被 MySQL 保留,用來儲存錯誤資訊,這個錯誤值用索引 0 或者一個空字串表示。

MySQL 認為 ENUM 型別集合中出現的值是合法輸入,除此之外其它任何輸入都將失敗。這說明通過搜尋包含空字串或對應數字索引為 0 的行就可以很容易地找到錯誤記錄的位置。

  • SET 型別
    SET 型別與 ENUM 型別相似但不相同。SET 型別可以從預定義的集合中取得任意數量的值。並且與 ENUM 型別相同的是任何試圖在 SET 型別欄位中插入非預定義的值都會使 MySQL 插入一個空字串。如果插入一個即有合法的元素又有非法的元素的記錄,MySQL 將會保留合法的元素,除去非法的元素。
    一個 SET 型別最多可以包含 64 項元素。還去除了重複的元素,所以 SET 型別中不可能包含兩個相同的元素。
    希望從 SET 型別欄位中找出非法的記錄只需查詢包含空字串或二進位制值為 0 的行。

欄位型別總結

  1. 雖然上面列出了很多欄位型別,但最常用也就是 varchar(255),char(255),text,tinyint(4),smallint(6),mediumint,int(11)幾種。

  2. 複合型別我們一般用tinyint,更快的時間更省的空間以及更容易擴充套件

  3. 關於手機號,推薦用char(11),char(11)在查詢上更有效率,因為手機號是一個活躍欄位參與邏輯會很多。

  4. 一些常用欄位舉例
    姓名:char(20)
    價格:DECIMAL(7, 3)
    產品序列號:SMALLINT(5) unsigned
    文章內容: TEXT
    MD5: CHAR(32)
    ip: char(15)
    time: int(10)
    email char(32)

合理的選擇資料型別

  • 選擇合理範圍內最小的
    我們應該選擇最小的資料範圍,因為這樣可以大大減少磁碟空間及磁碟I/0讀寫開銷,減少記憶體佔用,減少CPU的佔用率。

  • 選擇相對簡單的資料型別
    數字型別相對字串型別要簡單的多,尤其是在比較運算時,所以我們應該選擇最簡單的資料型別,比如說在儲存時間時,因為PHP可以良好的處理LINUX時間戳所以我們可以將日期存為int(10)要方便、合適、快速的多

但是,工作中隨著專案越做越多,業務邏輯的處理越來越難以後,我發現時間型別還是用時間型別本身的欄位型別要好一些,因為mysql有著豐富的時間函式供我使用,方便我完成很多與時間相關的邏輯,比如月排行榜,周排行榜,當日熱門,生日多少天等等邏輯

    • 不要使用null
      為什麼這麼說呢,因為MYSQL對NULL欄位索引優化不佳,增加更多的計算難度,同時在儲存與處理NULL類形時,也會做更多的工作,所以從效率上來說,不建議用過多的NULL。有些值他確實有可能沒有值,怎麼辦呢?解決方法是數值弄用整數0,字串用空來定義預設值即可。

    • 字串型別的使用
      字串資料型別是一個萬能資料型別,可以儲存數值、字串、日期等。
      儲存數值型別最好不要用字串資料型別,這樣儲存的空間顯然是會更大,而且在排序時字串的9是大於22的,其實如果進行運算時mysql會將字串轉換為數值型別,大大降低效果,而且這種轉換是不會走原有的索引的。
      如果明確資料在一個完整的集合中如男,女,那麼可以使用set或enum資料型別,這種資料型別在運算及儲存時以數值方式操作,所以效率要比字串更好,同時空間佔用更少。

    • VARCHAR與CHAR
      VARCHAR是可變長度字串型別,那麼即然長度是可變的就會使用1,2個位元組來儲存字元的長度,如果長度在255內使用1個位元組來儲存字元長度,否則使用2個字元來儲存長度。由於varchar是根據儲存的值來儲存資料,所以可以大大節約磁碟空間。
      如果資料經常被執行更新操作,由於VARCHAR是根據內容來進行儲存的,所以mysql將做更多的工作來完成更新操作,如果新資料長度大於老資料長度一些儲存引擎會進行拆分操作處理。同時varchar會完全保留內部所有資料,最典型的說明就是尾部的空格。
      CHAR固定長度的字串儲存型別,CHAR會去掉尾部的空格。在資料長度相近時使用char型別比較合適,比如md5加密的密碼使用者名稱等。
      如果資料經常進行更新修改操作,那麼CHAR更好些,因為char長度固定,效能上要快。

    • 數值型別的選擇
      數值資料型別要比字串執行更快,區間小的資料型別佔用空間更少,處理速度更快,如tinyint可比bigint要快的多

      選擇資料型別時要考慮內容長度,比如是儲存毫米單位還是米而選擇不同的數值型別

      整數

      整數型別很多比如tinyint、int、smallint、bigint等,那麼我們要根據自己需要儲存的資料長度決定使用的型別,同時tinyint(10)與tinyint(100)在儲存與計算上並無任何差別,區別只是顯示層面上,但是我們也要選擇適合合適的資料型別長度。可以通過指定zerofill屬性檢視顯示時區別。

      浮點數與精度數值

      浮點數float在儲存空間及執行效率上要優於精度數值型別decimal,但float與double會有舍入錯誤而decimal則可以提供更加準確的小數級精確運算不會有錯誤產生計算更精確,適用於金融型別資料的儲存。