1. 程式人生 > >oracle資料庫字符集AL32UTF8修改為ZHS16GBK即從超集到子集

oracle資料庫字符集AL32UTF8修改為ZHS16GBK即從超集到子集

轉自:https://www.cnblogs.com/perilla/p/3873653.html

一、什麼是Oracle字符集

       Oracle字符集是一個位元組資料的解釋的符號集合,有大小之分,有相互的包容關係。ORACLE 支援國家語言的體系結構允許你使用本地化語言來儲存,處理,檢索資料。它使資料庫工具,錯誤訊息,排序次序,日期,時間,貨幣,數字,和日曆自動適應本地化語言和平臺。

 

影響Oracle資料庫字符集最重要的引數是NLS_LANG引數。

它的格式如下: NLS_LANG = language_territory.charset

它有三個組成部分(語言、地域和字符集),每個成分控制了NLS子集的特性。

其中:

Language: 指定伺服器訊息的語言, 影響提示資訊是中文還是英文

Territory: 指定伺服器的日期和數字格式,

Charset:  指定字符集。

如:AMERICAN _ AMERICA. ZHS16GBK

從NLS_LANG的組成我們可以看出,真正影響資料庫字符集的其實是第三部分。

所以兩個資料庫之間的字符集只要第三部分一樣就可以相互匯入匯出資料,前面影響的只是提示資訊是中文還是英文。

怎麼檢視資料庫版本

select * from v$version   包含版本資訊,核心版本資訊,位數資訊(32位或64位)等  至於位數資訊,在Linux/unix平臺上,可以通過file檢視,如file $ORACLE_HOME/bin/oracle


二、檢視資料庫字符集

涉及三方面的字符集,

1. oracel server端的字符集;

2. oracle client端的字符集;

3. dmp檔案的字符集。

 

在做資料匯入的時候,需要這三個字符集都一致才能正確匯入。

 

2.1 查詢oracle server端的字符集

有很多種方法可以查出oracle server端的字符集,比較直觀的查詢方法是以下這種:

SQL> select userenv('language') from dual;

USERENV('LANGUAGE')

----------------------------------------------------

SIMPLIFIED CHINESE_CHINA.ZHS16GBK

 

SQL>select userenv(‘language’) from dual;

AMERICAN _ AMERICA. ZHS16GBK

 

2.2 如何查詢dmp檔案的字符集

用oracle的exp工具匯出的dmp檔案也包含了字符集資訊,dmp檔案的第2和第3個位元組記錄了dmp檔案的字符集。如果dmp檔案不大,比如只有幾M或幾十M,可以用UltraEdit開啟(16進位制方式),看第2第3個位元組的內容,如0354,然後用以下SQL查出它對應的字符集:

SQL> select nls_charset_name(to_number('0354','xxxx')) from dual;

ZHS16GBK

 

如果dmp檔案很大,比如有2G以上(這也是最常見的情況),用文字編輯器開啟很慢或者完全打不開,可以用以下命令(在unix主機上):

cat exp.dmp |od -x|head -1|awk '{print $2 $3}'|cut -c 3-6

然後用上述SQL也可以得到它對應的字符集。

 

2.3 查詢oracle client端的字符集

在windows平臺下,就是登錄檔裡面相應OracleHome的NLS_LANG。還可以在dos窗口裡面自己設定,

比如: set nls_lang=AMERICAN_AMERICA.ZHS16GBK

這樣就隻影響這個窗口裡面的環境變數。

 

在unix平臺下,就是環境變數NLS_LANG。

$echo $NLS_LANG

AMERICAN_AMERICA.ZHS16GBK

 

如果檢查的結果發現server端與client端字符集不一致,請統一修改為同server端相同的字符集。

 

補充:

(1).資料庫伺服器字符集

select * from nls_database_parameters

來源於props$,是表示資料庫的字符集。

 

(2).客戶端字符集環境

select * from nls_instance_parameters

其來源於v$parameter,表示客戶端的字符集的設定,可能是引數檔案,環境變數或者是登錄檔

 

(3).會話字符集環境

select * from nls_session_parameters

來源於v$nls_parameters,表示會話自己的設定,可能是會話的環境變數或者是alter session完成,如果會話沒有特殊的設定,將與nls_instance_parameters一致。

 

(4).客戶端的字符集要求與伺服器一致,才能正確顯示資料庫的非Ascii字元。

如果多個設定存在的時候,NLS作用優先級別:Sql function > alter session > 環境變數或登錄檔> 引數檔案> 資料庫預設引數

 

字符集要求一致,但是語言設定卻可以不同,語言設定建議用英文。如字符集是zhs16gbk,則nls_lang可以是American_America.zhs16gbk。


三、修改server端字符集(不建議使用)


0.連線資料庫

sqlplus   /nolog

sql> conn /as sysdba


1. 關閉資料庫

SQL>SHUTDOWN IMMEDIATE

 

2. 啟動到Mount

SQL>STARTUP MOUNT;

SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION;

SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;

SQL>ALTER SYSTEM SET AQ_TM_PROCESSES=0;

SQL>ALTER DATABASE OPEN;

--這裡可以從父集到子集

SQL>ALTER DATABASE CHARACTER SET ZHS16GBK;

SQL>ALTER DATABASE NATIONAL CHARACTER SET AL16UTF16;

--如果是從子集到父集,需要使用INTERNAL_USE 引數,跳過超子集檢測

SQL>ALTER DATABASE CHARACTER SET INTERNAL_USE ZHS16GBK;

SQL>ALTER DATABASE NATIONAL CHARACTER SET INTERNAL_USE AL16UTF16;

 

SQL>SHUTDOWN IMMEDIATE;

SQL>STARTUP

注意:如果沒有大物件,在使用過程中進行語言轉換沒有什麼影響,(切記設定的字符集必須是ORACLE支援,不然不能start) 按上面的做法就可以。