1. 程式人生 > >Tomcat中文亂碼問題的原理和解決方法(全面、詳細)

Tomcat中文亂碼問題的原理和解決方法(全面、詳細)

自從接觸Java和JSP以來,就不斷與Java的中文亂碼問題打交道,現在終於得到了徹底的解決,現將我們的解決心得與大家共享。 

一、Java中文問題的由來 

Java的核心和class檔案是基於unicode的,這使Java程式具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,Java和JSP檔案本身編譯時產生的亂碼問題和Java程式於其他媒介互動產生的亂碼問題。 

首先Java(包括JSP)原始檔中很可能包含有中文,而Java和JSP原始檔的儲存方式是基於位元組流的,如果Java和JSP編譯成class檔案過程中,使用的編碼方式與原始檔的編碼不一致,就會出現亂碼。基於這種亂碼,建議在Java檔案中儘量不要寫中文(註釋部分不參與編譯,寫中文沒關係),如果必須寫的話,儘量手動帶引數-ecoding GBK或-ecoding gb2312編譯;對於JSP,在檔案頭加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類亂碼問題。 


本文要重點討論的是第二類亂碼,即Java程式與其他儲存媒介互動時產生的亂碼。很多儲存媒介,如資料庫,檔案,流等的儲存方式都是基於位元組流的,Java程式與這些媒介互動時就會發生字元(char)與位元組(byte)之間的轉換,例如從頁面提交表單中提交的資料在Java程式裡顯示亂碼等情況。 

如果在以上轉換過程中使用的編碼方式與位元組原有的編碼不一致,很可能就會出現亂碼。 

二、解決方法 

對於流行的Tomcat來說,有以下兩種解決方法: 

1) 更改 D:\Tomcat\conf\server.xml,指定瀏覽器的編碼格式為“簡體中文”: 

方法是找到 server.xml 中的 

<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" 

enableLookups="false" redirectPort="8443" acceptCount="100" 
connectionTimeout="20000" disableUploadTimeout="true" URIEncoding='GBK' /> 


標記,粗體字是我新增的。 

可以這樣驗證你的更改是否成功:在更改前,在你出現亂碼的頁面的IE瀏覽器,點選選單“檢視|編碼”,會發現“西歐(ISO)”處於選中狀態。而更改後,點選選單“檢視|編碼”,會發現“簡體中文(GB2312)”處於選中狀態。 

b)更該 Java 程式,我的程式是這樣的: 

public class ThreeParams extends HttpServlet { 

public void doGet(HttpServletRequest request, HttpServletResponse response) 
throws ServletException, IOException { 
response.setContentType("text/html; charset=GBK"); 
... 




粗體字是必需要有的,它的作用是讓瀏覽器把Unicode字元轉換為GBK字元。這樣頁面的內容和瀏覽器的顯示模式都設成了GBK,就不會亂碼了。 




tomcat下中文的徹底解決 

這些天開發一個專案,伺服器是tomcat,作業系統是xp,採用的是MVC架構,模式是採用Facade模式,總是出現亂碼,自己也解決了好多天,同事也幫忙解決,也參考了網上眾多網友的文章和意見,總算是搞定。但是好記性不如爛筆桿,所以特意記下,以防止自己遺忘,同時也給那些遇到同樣問題的人提供一個好的參考途徑: 

(一) JSP頁面上是中文,但是看的是後是亂碼: 
解決的辦法就是在JSP頁面的編碼的地方<%@ page language="java" contentType="text/html;charset=GBK" %>,因為Jsp轉成Java檔案時的編碼問題,預設的話有的伺服器是ISO-8859-1,如果一個JSP中直接輸入了中文,Jsp把它當作ISO8859-1來處理是肯定有問題的,這一點,我們可以通過檢視Jasper所生成的Java中間檔案來確認 

(二) 當用Request物件獲取客戶提交的漢字程式碼的時候,會出現亂碼: 
解決的辦法是:要配置一個filter,也就是一個Servelet的過濾器,程式碼如下: 
import java.io.IOException; 
import javax.servlet.Filter; 
import javax.servlet.FilterChain; 
import javax.servlet.FilterConfig; 
import javax.servlet.ServletException; 
import javax.servlet.ServletRequest; 
import javax.servlet.ServletResponse; 
import javax.servlet.UnavailableException; 

/** 
* Example filter that sets the character encoding to be used in parsing the 
* incoming request 
*/ 
public class SetCharacterEncodingFilter implements Filter { 

/** 
* Take this filter out of service. 
*/ 
public void destroy() { 

/** 
* Select and set (if specified) the character encoding to be used to 
* interpret request parameters for this request. 
*/ 
public void doFilter(ServletRequest request, ServletResponse response, 
FilterChain chain)throws IOException, ServletException { 

request.setCharacterEncoding("GBK"); 

// 傳遞控制到下一個過濾器 
chain.doFilter(request, response); 


public void init(FilterConfig filterConfig) throws ServletException { 


配置web.xml 
<filter> 
<filter-name>Set Character Encoding</filter-name> 
<filter-class>SetCharacterEncodingFilter</filter-class> 
</filter> 
<filter-mapping> 
<filter-name>Set Character Encoding</filter-name> 
<url-pattern>/*</url-pattern> 
</filter-mapping> 
如果你的還是出現這種情況的話你就往下看看是不是你出現了第四中情況,你的Form提交的資料是不是用get提交的,一般來說用post提交的話是沒有問題的,如果是的話,你就看看第四中解決的辦法。 
還有就是對含有漢字字元的資訊進行處理,處理的程式碼是: 
package dbJavaBean; 

public class CodingConvert 

public CodingConvert() 

// 

public String toGb(String uniStr){ 
String gbStr = ""; 
if(uniStr == null){ 
uniStr = ""; 

try{ 
byte[] tempByte = uniStr.getBytes("ISO8859_1"); 
gbStr = new String(tempByte,"GB2312"); 

catch(Exception ex){ 

return gbStr; 


public String toUni(String gbStr){ 
String uniStr = ""; 
if(gbStr == null){ 
gbStr = ""; 

try{ 
byte[] tempByte = gbStr.getBytes("GB2312"); 
uniStr = new String(tempByte,"ISO8859_1"); 
}catch(Exception ex){ 

return uniStr; 


你也可以在直接的轉換,首先你將獲取的字串用ISO-8859-1進行編碼,然後將這個編碼存放到一個位元組陣列中,然後將這個陣列轉化成字串物件就可以了,例如: 
String str=request.getParameter(“girl”); 
Byte B[]=str.getBytes(“ISO-8859-1”); 
Str=new String(B); 
通過上述轉換的話,提交的任何資訊都能正確的顯示。 
(三) 在Formget請求在服務端用request. getParameter(“name”)時返回的是亂碼;按tomcat的做法設定Filter也沒有用或者用request.setCharacterEncoding("GBK");也不管用問題是出在處理引數傳遞的方法上:如果在servlet中用doGet(HttpServletRequest request, HttpServletResponse response)方法進行處理的話前面即使是寫了: 
request.setCharacterEncoding("GBK"); 
response.setContentType("text/html;charset=GBK"); 
也是不起作用的,返回的中文還是亂碼!!!如果把這個函式改成doPost(HttpServletRequest request, HttpServletResponse response)一切就OK了。 
同樣,在用兩個JSP頁面處理表單輸入之所以能顯示中文是因為用的是post方法傳遞的,改成get方法依舊不行。 
由此可見在servlet中用doGet()方法或是在JSP中用get方法進行處理要注意。這畢竟涉及到要通過瀏覽器傳遞引數資訊,很有可能引起常用字符集的衝突或是不匹配。 
解決的辦法是: 
1) 開啟tomcat的server.xml檔案,找到區塊,加入如下一行: 
URIEncoding=”GBK” 
完整的應如下: 
<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" enableLookups="false" redirectPort="8443" acceptCount="100" debug="0" connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="GBK"/> 

2)重啟tomcat,一切OK。 
需要加入的原因大家可以去研究 $TOMCAT_HOME/webapps/tomcat-docs/config/http.html下的這個檔案就可以知道原因了。需要注意的是:這個地方如果你要是用UTF-8的時候在傳遞的過程中在Tomcat中也是要出現亂碼的情況,如果不行的話就換別的字符集。 

(四) JSP頁面上有中文,按鈕上面也有中文,但是通過伺服器檢視頁面的時候出現亂碼: 
解決的辦法是:首先在JSP檔案中不應該直接包含本地化的訊息文字,而是應該通過<bean:message>標籤從Resource Bundle中獲得文字。應該把你的中文文字放到Application.properties檔案中,這個檔案放在WEB-INF/classes/*下,例如我在頁面裡有姓名,年齡兩個label,我首先就是要建一個Application.properties,裡面的內容應該是name=”姓名” age=”年齡”,然後我把這個檔案放到WEB-INF/classes/properties/下,接下來根據Application.properties檔案,對他進行編碼轉化,建立一箇中文資原始檔,假定名字是Application_cn.properties。在JDK中提供了native2ascii命令,他能夠實現字元編碼的轉換。在DOS環境中找到你放置Application.properties的這個檔案的目錄,在DOS環境中執行一下命令,將生成按GBK編碼的中文資原始檔Application_cn.properties:native2ascii ?encoding gbk Application.properties Application_cn.properties執行以上命令以後將生成如下內容的Application_cn.properties檔案:name=u59d3u540d age=u5e74u9f84,在Struts-config.xml中配置:<message-resources parameter="properties.Application_cn"/>。到這一步,基本上完成了一大半,接著你就要在JSP頁面上寫<%@ page language="java" contentType="text/html;charset=GBK" %>,到名字的那個label是要寫<bean:message key=”name”>,這樣的化在頁面上出現的時候就會出現中文的姓名,年齡這個也是一樣,按鈕上漢字的處理也是同樣的。 
(五) 寫入到資料庫是亂碼: 
解決的方法:要配置一個filter,也就是一個Servelet的過濾器,程式碼如同第二種時候一樣。 
如果你是通過JDBC直接連結資料庫的時候,配置的程式碼如下:jdbc:mysql://localhost:3306/workshopdb?useUnicode=true&characterEncoding=GBK,這樣保證到資料庫中的程式碼是不是亂碼。 
如果你是通過資料來源連結的化你不能按照這樣的寫法了,首先你就要寫在配置檔案中,在tomcat 5.0.19中配置資料來源的地方是在C:Tomcat 5.0confCatalinalocalhost這個下面,我建立的工程是workshop,放置的目錄是webapp下面,workshop.xml的配置檔案如下: 
<!-- insert this Context element into server.xml --> 

<Context path="/workshop" docBase="workshop" debug="0" 
reloadable="true" > 

<Resource name="jdbc/WorkshopDB" 
auth="Container" 
type="javax.sql.DataSource" /> 

<ResourceParams name="jdbc/WorkshopDB"> 
<parameter> 
<name>factory</name> 
<value>org.apache.commons.dbcp.BasicDataSourceFactory</value> 
</parameter> 
<parameter> 
<name>maxActive</name> 
<value>100</value> 
</parameter> 
<parameter> 
<name>maxIdle</name> 
<value>30</value> 
</parameter> 


<parameter> 
<name>maxWait</name> 
<value>10000</value> 
</parameter> 

<parameter> 
<name>username</name> 
<value>root</value> 
</parameter> 
<parameter> 
<name>password</name> 
<value></value> 
</parameter> 

<!-- Class name for mm.mysql JDBC driver --> 
<parameter> 
<name>driverClassName</name> 
<value>com.mysql.jdbc.Driver</value> 

相關推薦

Tomcat中文亂碼問題的原理解決方法(全面詳細)

自從接觸Java和JSP以來,就不斷與Java的中文亂碼問題打交道,現在終於得到了徹底的解決,現將我們的解決心得與大家共享。 一、Java中文問題的由來 Java的核心和class檔案是基於unicode的,這使Java程式具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻

2017.6.17 jsp中 get請求的中文亂碼問題的解決方法

utf meta class enc 請求 服務 charset url編碼 uri 一般Tocant 的url編碼是iso-8859-1(查看tocat/conf/server.xml 中的Connector 節點沒有寫URIEncoding="xxxxxx") 如下:

VScode中python中用run coder輸出結果中文亂碼的最終解決方法

我用vscode寫python用的是run code這個外掛,今天寫程式碼時發現print('中文') 在終端視窗是亂碼,找了很多原因,最後才發現是一個設定的問題: 用run code輸入是亂碼,用系統的cmd確是好的,這叫我知道肯定是哪裡設定出了問題: 解決方法有兩種:     1:在環

mysql5.5-中文亂碼原因與解決方法

一、出現中文亂碼的原因 1.檢視字符集 mysql> show variables like ‘%char%’; ±-------------------------±-----------------------------------------

關於《JavaWeb開發實戰經典》中接收封裝表單的文字資料出現中文亂碼問題的解決方法

smartupload亂碼問題 今天在寫smartupload的demo時,在接收表單資料時出現了中文亂碼,從網上綜合了各種方法才得以解決。 1.smartupload.html中可見對form使用enctype進行表單封裝 <!DOCTYPE html&

對Java程式中的中文亂碼問題的解決方法

中文問題的來源 計算機最初的作業系統支援的編碼是單位元組的字元編碼,於是,在計算機中一切處理程式最初都是以單位元組編碼的英文為準進行處理。 隨著計算機的發展,為了適應世界其它民族的語言(當然包括我們的漢字),人們提出了UNICODE編碼,它採用雙位元組編碼,相容英文字元和其它民族的雙位元

WIN7部分程式中文亂碼的簡單解決方法

控制面板——區域和語言——設定——在彈出的視窗中將系統區域設定成“英語(英國)”,然後點選確定,重啟電腦。這裡需要提醒的是,重啟後可能會全是亂碼,因此我們需要牢記如何從桌面進入到這個介面,可以用筆記錄點選的位置和步驟 重啟完成後,我們按照上面記錄的再次來到區域和語言設定這一視窗,這次我們選擇“中

Get,Post請求中文亂碼問題有效解決方法

對於做Java WEB專案同學來說,中文亂碼問題是一個經常遇到而又非常頭痛的問題,而最容易出現亂碼的環節就是在瀏覽器向伺服器傳送請求的過程,至於出現亂碼的原因不是本文的關注的重點,想了解的朋友可以參考 本文主要介紹如何有效解決web請求中的亂碼問題,其實解決方法有很多種,不

eclipse插入資料到MySQL資料庫時,出現中文亂碼問題的解決方法

       中文亂碼 問題,一直讓人很煩,在百度上找了很多方法,都不行,後來,忽然想到一個方法,竟然沒有亂碼了,好了,進入正題;        首先,說明我的中文亂碼是出現在配置hibernate

Servlet中文亂碼問題及其解決方法

關於設定中文的亂碼問題 原因:response緩衝區的預設編碼是iso8859-1,此碼錶中沒有中文,可以通過response的setCharacterEncoding(String charset)

關於Get,Post請求中文亂碼問題有效解決方法

對於做Java WEB專案同學來說,中文亂碼問題是一個經常遇到而又非常頭痛的問題,而最容易出現亂碼的環節就是在瀏覽器向伺服器傳送請求的過程,至於出現亂碼的原因不是本文的關注的重點,想了解的朋友可以參考 本文主要介紹如何有效解決web請求中的亂碼問題,其實解決方法有很多種,

Mybatis like 查詢 防止SQL注入方法相關原理解決方法整理

SQL注入:引自百度百科: 所謂SQL注入,就是通過把SQL命令插入到Web表單提交或輸入域名或頁面請求的查詢字串,最終達到欺騙伺服器執行惡意的SQL命令。具體來說,它是利用現有應用程式,將(惡意)的

ASP.net連線mysql資料庫中文亂碼問題的解決方法

1. 修改mysql的配置。到mysql server的安裝目錄下找到my.ini,修改[mysql]小節中的default-character-set為utf8[mysql] default-character-set=utf8 2. 修改mysql server的字符集如

IntelliJ IDEA 控制檯輸出中文亂碼問題的解決方法

首先,找到 IntelliJ IDEA 的安裝目錄,進入bin目錄下,定位到idea.vmoptions檔案,如下圖所示: 雙擊開啟idea.vmoptions檔案,如下圖所示: 然後,在其中追加-

外部訪問虛擬機器的tomcat遇到的問題解決方法

部署好tomcat,想在自己電腦上的瀏覽器訪問,但是發現訪問不了 訪問方式是瀏覽器位址列輸入ip加埠,我的是192.138.211.121:8080,顯示結果是無連線 在電腦上ping一下主機發現是可以ping通的,在虛擬機器使用curl 192.138.211.121:8

SSH連線失敗,報錯Host key verification failed——原理解決方法

##原因,當時用ssh命令遠端連線sshd服務的時候。連線過程是需要認證的,以保證連線的安全和資料傳輸的加密。 客戶端ssh連線服務端sshd時,服務端根據自己的私鑰生成公鑰 (身份驗證使用公鑰加密演算法實現——公鑰加密私鑰解密),並傳送給客戶端ssh。 客戶端ssh命令接收服務端的公鑰,(第一次連線時,連線

idea tomcat解決中文亂碼的N種方法

在IDEA中啟動tomcat發現靜態頁面中文亂碼,提供以下幾種方法: 1. html增加utf-8 然而並沒有解決問題,有時候換了一種亂碼形式 2. tomcat server.xml增加編碼 server.xml 加入URIEncoding=“UTF-8” 這種也沒

idea tomcat解決中文亂碼的N種方法

在IDEA中啟動tomcat發現靜態頁面中文亂碼,提供以下幾種方法: 1. html增加utf-8 然而並沒有解決問題,有時候換了一種亂碼形式 2. tomcat server.xml增加編碼 se

IDEA開發Struts2Tomcat中文亂碼解決方案

idea struts2中文亂碼。idea tomcat中文亂碼。 1.很可能是寫有中文的Java檔案編碼和前端不一樣導致。 統一為UTF-8編碼: jsp檔案 <%@ page contentType="text/html;charset=UTF-8" pag

get請求時候引數中含有“中文”欄位出現亂碼問題的原因解決方法

關於使用get請求時候,在傳遞的引數中有中文字元時候出現亂碼問題的原因 1.伺服器:伺服器按照預設的iso-8859-1進行解碼。 A、post方式 post方式屬於表單提交,引數存在於請求體中,只需要如下配置即可。 request.setCharacterEncoding