1. 程式人生 > >PHP環境下utf8亂碼的解決方法---apache,php配置問題

PHP環境下utf8亂碼的解決方法---apache,php配置問題

如果你在網上搜索

apache

配置

,搜到的頁面大多都會建議你在

httpd.conf

中加上這麼一句:

AddDefaultCharset GB2312

。對於新手而且是隻用

GB2312

編碼的開發人來說,這麼做是

ok

的。

但是如果要想使用

UTF-8

字符集的話,比如

test.php

檔案中需要有

meta http-equiv="Content-Type" content="text/html; charset=UTF-8" 

這段程式碼。這時你再打

開瀏覽器訪問

test.php

頁面的話,你看到的是正確的頁面。但是如果實際上瀏覽器還是以

GB2312

碼解釋從伺服器返回的

response

,為什麼呢?原因是瀏覽器是根據

http

應答訊息頭部中的

Content-type: text/html; charset=GB2312 

來決定使用何種編碼解釋應答,也就是說

apache

服務

器仍然用

GB2312

編碼傳遞資料。

所以說如果

apache

的預設字符集被設定成了

GB2312

即使在頁面中宣告使用

UTF-8

編碼,

apache

服務

器還是會按照

GB2312

編碼來傳送

http response

沒關係,我們把

AddDefaultCharset GB2312 

改成

 AddDefaultCharset UTF-8

,看看什麼結果?如果

你看到亂碼恭喜你,你還知道是亂碼問題;如果你看到是空白頁面,那麼你就慘了,你可能會以為

這是其他什麼原因造成的,而不會從編碼的角度去考慮怎麼解決問題。這是為什麼?

原因在於

php

檔案本身是用系統字符集來編碼的,中文的

windows 

XP

都是用

GB2312

,每一個檔案頭部

都有欄位指示該檔案是用何種方式編碼的。當

apache

接到瀏覽器的請求後,會讓

php

去解釋所請求的

頁面,比如

 test.php

php

會識別出

test.php

的編碼方式是

GB2312

(

就像我們用

javac

編譯

java

檔案時,編譯器預設用系統編碼讀原始檔裡的內容。如果原始檔不是用系統編碼來儲存的,可以用

命令

javac -encoding

指定具體的編碼

)

,把資料以

GB2312

的編碼格式傳遞給

apache

,而

apache

服務

器不會改變從

php

傳來的資料,只是在應答訊息頭部中把字符集設定成

UTF-8

 Content-type: 

text/html; charset=UTF-8. 

也就是說你傳遞的是

GB2312

編碼的資料,而瀏覽器卻以

UTF-8

編碼來解

釋應答訊息。

由於

UTF-8

3

個位元組表示一個漢子,而普通的

GB2312

BIG5

是兩個。頁面輸出時,由於上述原因,

出現半個漢字的情況,這時該半個漢字會和的

 >

結合成一個亂碼字,導致

IE

無法讀完的話,會發現

實際上整個葉面全部已經輸出了。如果使用的是

Mozilla

Mozilla Firefox

Sarafi

的瀏覽器這不

會造成這個問題,而是一堆亂碼。這是由於

Firefox

瀏覽器和

IE

解析網頁編碼的策略不同產生的。

OK,

我們把

test.php

UTF-8

儲存,再用瀏覽器訪問時,就沒有問題了。可這樣做,會使得

apache

錄下的所有

web

應用只能用同一種編碼。如何搞定?

解決辦法:

首先,可以使用

AddDefaultCharset 

off

來關閉預設檔案編碼,這樣

apache

伺服器就不會在

http

應答

訊息頭部設定

charset

,只是設定

Content-type: text/html. 

而瀏覽器就會依靠

html

檔案中設定的

harset

來決定編碼。其次,指令碼

php.ini

檔案中的

default_charset = 

UTF-8

″作用同

httpd.conf

件,把該行註釋掉,使

php

自動識別檔案的編碼方式。

這樣不論你用什麼編碼方式,只要

test.php

中的

meta http-equiv=

Content-Type

 content=

text/html; charset=UTF-8

與你

test.php

檔案編碼

方式相同,就不會產生亂碼問題。

使用者提交資料的編碼

瀏覽器提交的字元編碼由客戶端的

characher encoding

決定。例如,當前瀏覽器的編碼是

Gb2312

使用者提交資料後,

無論

apache

設定的編碼方式是

GB2312

還是

UTF-8

這時在伺服器端接收到的仍是以