1. 程式人生 > >Tomcat部署jsp,出現亂碼問題

Tomcat部署jsp,出現亂碼問題

一、Java中文問題的由來 

Java的核心和class檔案是基於unicode的,這使Java程式具有良好的跨平臺性,但也帶來了一些中文亂碼問題的麻煩。原因主要有兩方面,Java和JSP檔案本身編譯時產生的亂碼問題和Java程式於其他媒介互動產生的亂碼問題。 

首先Java(包括JSP)原始檔中很可能包含有中文,而Java和JSP原始檔的儲存方式是基於位元組流的,如果Java和JSP編譯成class檔案過程中,使用的編碼方式與原始檔的編碼不一致,就會出現亂碼。基於這種亂碼,建議在Java檔案中儘量不要寫中文(註釋部分不參與編譯,寫中文沒關係),如果必須寫的話,儘量手動帶引數-ecoding GBK或-ecoding gb2312編譯;對於JSP,在檔案頭加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類亂碼問題。 


本文要重點討論的是第二類亂碼,即Java程式與其他儲存媒介互動時產生的亂碼。很多儲存媒介,如資料庫,檔案,流等的儲存方式都是基於位元組流的,Java程式與這些媒介互動時就會發生字元(char)與位元組(byte)之間的轉換,例如從頁面提交表單中提交的資料在Java程式裡顯示亂碼等情況。 

如果在以上轉換過程中使用的編碼方式與位元組原有的編碼不一致,很可能就會出現亂碼。 

二、解決方法 

對於流行的Tomcat來說,有以下兩種解決方法: 

1) 更改 D:/Tomcat/conf/server.xml,指定瀏覽器的編碼格式為“簡體中文”: 

方法是找到 server.xml 中的 

<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" 

enableLookups="false" redirectPort="8443" acceptCount="100" 
connectionTimeout="20000" disableUploadTimeout="true" URIEncoding='GBK' /> 


標記,粗體字是我新增的。 

可以這樣驗證你的更改是否成功:在更改前,在你出現亂碼的頁面的IE瀏覽器,點選選單“檢視|編碼”,會發現“西歐(ISO)”處於選中狀態。而更改後,點選選單“檢視|編碼”,會發現“簡體中文(GB2312)”處於選中狀態。 

b)更該 Java 程式,我的程式是這樣的: 

public class ThreeParams extends HttpServlet { 

public void doGet(HttpServletRequest request, HttpServletResponse response) 
throws ServletException, IOException { 
response.setContentType("text/html; charset=GBK"); 
... 




粗體字是必需要有的,它的作用是讓瀏覽器把Unicode字元轉換為GBK字元。這樣頁面的內容和瀏覽器的顯示模式都設成了GBK,就不會亂碼了。 




tomcat下中文的徹底解決 

這些天開發一個專案,伺服器是tomcat,作業系統是xp,採用的是MVC架構,模式是採用Facade模式,總是出現亂碼,自己也解決了好多天,同事也幫忙解決,也參考了網上眾多網友的文章和意見,總算是搞定。但是好記性不如爛筆桿,所以特意記下,以防止自己遺忘,同時也給那些遇到同樣問題的人提供一個好的參考途徑: 

(一) JSP頁面上是中文,但是看的是後是亂碼: 
解決的辦法就是在JSP頁面的編碼的地方<%@ page language="java" contentType="text/html;charset=GBK" %>,因為Jsp轉成Java檔案時的編碼問題,預設的話有的伺服器是ISO-8859-1,如果一個JSP中直接輸入了中文,Jsp把它當作ISO8859-1來處理是肯定有問題的,這一點,我們可以通過檢視Jasper所生成的Java中間檔案來確認 

(二) 當用Request物件獲取客戶提交的漢字程式碼的時候,會出現亂碼: 
解決的辦法是:要配置一個filter,也就是一個Servelet的過濾器,程式碼如下: 
import java.io.IOException; 
import javax.servlet.Filter; 
import javax.servlet.FilterChain; 
import javax.servlet.FilterConfig; 
import javax.servlet.ServletException; 
import javax.servlet.ServletRequest; 
import javax.servlet.ServletResponse; 
import javax.servlet.UnavailableException; 

/** 
* Example filter that sets the character encoding to be used in parsing the 
* incoming request 
*/ 
public class SetCharacterEncodingFilter implements Filter { 

/** 
* Take this filter out of service. 
*/ 
public void destroy() { 

/** 
* Select and set (if specified) the character encoding to be used to 
* interpret request parameters for this request. 
*/ 
public void doFilter(ServletRequest request, ServletResponse response, 
FilterChain chain)throws IOException, ServletException { 

request.setCharacterEncoding("GBK"); 

// 傳遞控制到下一個過濾器 
chain.doFilter(request, response); 


public void init(FilterConfig filterConfig) throws ServletException { 


配置web.xml 
<filter> 
<filter-name>Set Character Encoding</filter-name> 
<filter-class>SetCharacterEncodingFilter</filter-class> 
</filter> 
<filter-mapping> 
<filter-name>Set Character Encoding</filter-name> 
<url-pattern>/*</url-pattern> 
</filter-mapping> 
如果你的還是出現這種情況的話你就往下看看是不是你出現了第四中情況,你的Form提交的資料是不是用get提交的,一般來說用post提交的話是沒有問題的,如果是的話,你就看看第四中解決的辦法。 
還有就是對含有漢字字元的資訊進行處理,處理的程式碼是: 
package dbJavaBean; 

public class CodingConvert 

public CodingConvert() 

// 

public String toGb(String uniStr){ 
String gbStr = ""; 
if(uniStr == null){ 
uniStr = ""; 

try{ 
byte[] tempByte = uniStr.getBytes("ISO8859_1"); 
gbStr = new String(tempByte,"GB2312"); 

catch(Exception ex){ 

return gbStr; 


public String toUni(String gbStr){ 
String uniStr = ""; 
if(gbStr == null){ 
gbStr = ""; 

try{ 
byte[] tempByte = gbStr.getBytes("GB2312"); 
uniStr = new String(tempByte,"ISO8859_1"); 
}catch(Exception ex){ 

return uniStr; 


你也可以在直接的轉換,首先你將獲取的字串用ISO-8859-1進行編碼,然後將這個編碼存放到一個位元組陣列中,然後將這個陣列轉化成字串物件就可以了,例如: 
String str=request.getParameter(“girl”); 
Byte B[]=str.getBytes(“ISO-8859-1”); 
Str=new String(B); 
通過上述轉換的話,提交的任何資訊都能正確的顯示。 
(三) 在Formget請求在服務端用request. getParameter(“name”)時返回的是亂碼;按tomcat的做法設定Filter也沒有用或者用request.setCharacterEncoding("GBK");也不管用問題是出在處理引數傳遞的方法上:如果在servlet中用doGet(HttpServletRequest request, HttpServletResponse response)方法進行處理的話前面即使是寫了: 
request.setCharacterEncoding("GBK"); 
response.setContentType("text/html;charset=GBK"); 
也是不起作用的,返回的中文還是亂碼!!!如果把這個函式改成doPost(HttpServletRequest request, HttpServletResponse response)一切就OK了。 
同樣,在用兩個JSP頁面處理表單輸入之所以能顯示中文是因為用的是post方法傳遞的,改成get方法依舊不行。 
由此可見在servlet中用doGet()方法或是在JSP中用get方法進行處理要注意。這畢竟涉及到要通過瀏覽器傳遞引數資訊,很有可能引起常用字符集的衝突或是不匹配。 
解決的辦法是: 
1) 開啟tomcat的server.xml檔案,找到區塊,加入如下一行: 
URIEncoding=”GBK” 
完整的應如下: 
<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" enableLookups="false" redirectPort="8443" acceptCount="100" debug="0" connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="GBK"/> 

2)重啟tomcat,一切OK。 
需要加入的原因大家可以去研究 $TOMCAT_HOME/webapps/tomcat-docs/config/http.html下的這個檔案就可以知道原因了。需要注意的是:這個地方如果你要是用UTF-8的時候在傳遞的過程中在Tomcat中也是要出現亂碼的情況,如果不行的話就換別的字符集。 

(四) JSP頁面上有中文,按鈕上面也有中文,但是通過伺服器檢視頁面的時候出現亂碼: 
解決的辦法是:首先在JSP檔案中不應該直接包含本地化的訊息文字,而是應該通過<bean:message>標籤從Resource Bundle中獲得文字。應該把你的中文文字放到Application.properties檔案中,這個檔案放在WEB-INF/classes/*下,例如我在頁面裡有姓名,年齡兩個label,我首先就是要建一個Application.properties,裡面的內容應該是name=”姓名” age=”年齡”,然後我把這個檔案放到WEB-INF/classes/properties/下,接下來根據Application.properties檔案,對他進行編碼轉化,建立一箇中文資原始檔,假定名字是Application_cn.properties。在JDK中提供了native2ascii命令,他能夠實現字元編碼的轉換。在DOS環境中找到你放置Application.properties的這個檔案的目錄,在DOS環境中執行一下命令,將生成按GBK編碼的中文資原始檔Application_cn.properties:native2ascii ?encoding gbk Application.properties Application_cn.properties執行以上命令以後將生成如下內容的Application_cn.properties檔案:name=u59d3u540d age=u5e74u9f84,在Struts-config.xml中配置:<message-resources parameter="properties.Application_cn"/>。到這一步,基本上完成了一大半,接著你就要在JSP頁面上寫<%@ page language="java" contentType="text/html;charset=GBK" %>,到名字的那個label是要寫<bean:message key=”name”>,這樣的化在頁面上出現的時候就會出現中文的姓名,年齡這個也是一樣,按鈕上漢字的處理也是同樣的。 
(五) 寫入到資料庫是亂碼: 
解決的方法:要配置一個filter,也就是一個Servelet的過濾器,程式碼如同第二種時候一樣。 
如果你是通過JDBC直接連結資料庫的時候,配置的程式碼如下:jdbc:mysql://localhost:3306/workshopdb?useUnicode=true&characterEncoding=GBK,這樣保證到資料庫中的程式碼是不是亂碼。 
如果你是通過資料來源連結的化你不能按照這樣的寫法了,首先你就要寫在配置檔案中,在tomcat 5.0.19中配置資料來源的地方是在C:Tomcat 5.0confCatalinalocalhost這個下面,我建立的工程是workshop,放置的目錄是webapp下面,workshop.xml的配置檔案如下: 
<!-- insert this Context element into server.xml --> 

<Context path="/workshop" docBase="workshop" debug="0" 
reloadable="true" > 

<Resource name="jdbc/WorkshopDB" 
auth="Container" 
type="javax.sql.DataSource" /> 

<ResourceParams name="jdbc/WorkshopDB"> 
<parameter> 
<name>factory</name> 
<value>org.apache.commons.dbcp.BasicDataSourceFactory</value> 
</parameter> 
<parameter> 
<name>maxActive</name> 
<value>100</value> 
</parameter> 
<parameter> 
<name>maxIdle</name> 
<value>30</value> 
</parameter> 


<parameter> 
<name>maxWait</name> 
<value>10000</value> 
</parameter> 

<parameter> 
<name>username</name> 
<value>root</value> 
</parameter> 
<parameter> 
<name>password</name> 
<value></value> 
</parameter> 

<!-- Class name for mm.mysql JDBC driver --> 
<parameter> 
<name>driverClassName</name> 
<value>com.mysql.jdbc.Driver</value> 
</parameter> 
<parameter> 
<name>url</name> 
<value><![CDATA[jdbc:mysql://localhost:3306/workshopdb?useUnicode=true&characterEncoding=GBK]]></value> 
</parameter> 
</ResourceParams> 

</Context> 
粗體的地方要特別的注意,和JDBC直接連結的時候是有區別的,如果你是配置正確的化,當你輸入中文的時候到資料庫中就是中文了,有一點要注意的是你在顯示資料的頁面也是要用<%@ page language="java" contentType="text/html;charset=GBK" %>這行程式碼的。需要注意的是有的前臺的人員在寫程式碼的是後用Dreamver寫的,寫了一個Form的時候把他改成了一個jsp,這樣有一個地方要注意了,那就是在Dreamver中Action的提交方式是request的,你需要把他該過來,因為在jsp的提交的過程中緊緊就是POST和GET兩種方式,但是這兩種方式提交的程式碼在編碼方面還是有很大不同的,這個在後面的地方進行說明。3 

以上就是我在開發系統中解決中文的問題,不知道能不能解決大家的問題,時間匆忙,沒有及時完善,文筆也不是很好,有些地方估計是詞不達意。大家可以給我意見,希望能共同進步

來自:http://blog.csdn.net/menban/article/details/1569250