1. 程式人生 > >oracle中varchar2使用的一些整理

oracle中varchar2使用的一些整理

oracle中有三種比較常用的型別:varchar2(byte)、varchar2(char)、nvarchar2()。

那麼這三種類型到底有什麼區別呢?

首先,我們要時刻記清:無論是varchar2還是nvarchar2,最大位元組數都是4000

ALTER SESSION SET NLS_LENGTH_SEMANTICS= byte | char;

varchar2(byte):就是預設的表示方式,比如我們寫成:varchar2(100),就相當於varchar2(100 byte),表示最大位元組數是100,該欄位最多能容納100個位元組,強調空間大小。

由於我們描述的是位元組,因此,儲存漢字等字元時,就要小心了。如果你的資料庫用的是GBK編碼,那麼一個漢字將佔用2個位元組,最多能存50個漢字,如果你的資料庫用的是UTF8編碼,那麼一個漢字將佔用3個位元組,最多能存33個漢字。

varchar2(char):表示最大字元數是100,該欄位最多能容納100個字元,強調個數。假設我們寫成varchar2(100char),那麼無論是數字、字母、漢字,都看成一個字元,最多寫100個,當然,漢字越多,佔用的空間越大,同樣遵循上邊的資料庫編碼原則。例如:存入一個漢字,底層佔2或3個位元組,存入一個字母,佔1個位元組,絕對不是某些文章所說1個字母或數字也佔2或3個位元組!

nvarchar2():沒有byte、char之分,類似於varchar2(char),只不過nvarchar2()遮蔽了資料庫編碼,無論是何種編碼,nvarchar2()中一個漢字都佔兩個位元組。

一般的教程,也就到這了,可是如果再多一步思考,會發現一個致命問題。

實際應用中,很可能會出現這種寫法:varchar2(1400char),我們主觀的認為,這個欄位最長不能超過1400個字元,這意味著我們可能會存入1399個字元,貌似很正確的樣子。

但是,如果這1399個字元都是漢字,字元長度並沒有超過1400,看起來一切正常,但實際上我們損失了一部分資料,為什麼?

因為1399個漢字,按UTF8編碼來說(99%的專案都是UTF8編碼吧。。),需要佔用1399*3=4197個位元組,而文章開篇就說,無論是什麼char,最大長度就是4000位元組,一個也不能多,因此多出來的197個位元組,都會抹去,而整個過程中,無任何錯誤提示,你的資料就這樣蒸發了!

所以,對於GBK編碼的資料庫而言,安全的寫法為:varchar2(2000 char)、nvarchar2(2000),對於UTF8編碼的資料庫而言,安全的寫法為:varchar2(1333char)、nvarchar2(2000)。

 

參考地址:https://blog.csdn.net/feipeng21c/article/details/77853116