1. 程式人生 > >java檔案下載檔名亂碼

java檔案下載檔名亂碼

response.setHeader(…)下載中文檔名亂碼問題
關於中文檔案下載的問題,網上的諮詢和答疑已經很多,我原來處理下載的程式碼如下:
java程式碼

response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));  

下載的程式裡有了這句,一般在IE6的下載提示框上將正確顯示檔案的名字,無論是簡體中文,還是日文。不過當時確實沒有仔細測試檔名很長的中文檔名。先如今經過仔細測試,發現文字只要超過17個字,就不能下載了。經過好一番google和反覆測試,總算對這個問題有了系統的認識,分列如下:

一. 通過我原來的方式,也就是先用URLEncoder編碼,當中文文字超過17個時,IE6 無法下載檔案。這是IE的bug,參見微軟的知識庫文章 KB816868 。原因可能是因為ie在處理 Response Header 的時候,對header的長度限制在150位元組左右。而一個漢字編碼成UTF-8是9個位元組,那麼17個字便是153個位元組,所以便會報錯。微軟提供了一個補丁,可以從 這裡 下載。這個補丁需要先安裝ie6 sp1。因為我平時勤打補丁,我的IE6版本號是 6.0.2800.1106.xpsp2_xxxxx。所以我可能已經安裝過了補丁,從而可以下載,但仍然出現檔名被截斷的現象。微軟讓我們等待IE下一個service pack的釋出。我今天也上網看到了好訊息,迫於firefox的壓力,IE7可能在年中釋出。另外,Firefox 不支援這樣的方式,將把編碼後的%xx%xx直接作為檔名顯示。

二. 我嘗試使用 javamail 的MimeUtility.encode()方法來編碼檔名,也就是編碼成 =?gb2312?B?xxxxxxxx?= 這樣的形式,並從 RFC1522 中找到對應的標準支援。不過很遺憾,IE6並不支援這一個標準。我試了一下,Firefox是支援的。

三. 按網上很多人提供的解決方案:將檔名編碼成ISO8859-1似乎是有效的解決方案,程式碼如下:
java程式碼

response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"
), "ISO8859-1" ) );

在確保附件檔名都是簡體中文字的情況下,那麼這個辦法確實是最有效的,不用讓客戶逐個的升級IE。如果臺灣同胞用,把gb2312改成big5就行。但現在的系統通常都加入了國際化的支援,普遍使用UTF-8。如果檔名中又有簡體中文字,又有繁體中文,還有日文。那麼亂碼便產生了。另外,在我的電腦上Firefox(v1.0-en)下載也是亂碼。

折中考慮,我結合了一、三的方式,程式碼片斷如下: 
        String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");  
        /* 
         * see http://support.microsoft.com/default.aspx?kbid=816868 
         */  
        if (fileName.length() > 150) {  
            String guessCharset = xxxx /*根據request的locale 得出可能的編碼,中文作業系統通常是gb2312*/  
            fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");   
        }  
        response.setHeader("Content-Disposition", "attachment; filename=" + fileName);  

暫且不考慮 Firefox 是因為它目前似乎還沒有有力侵食到IE的企業使用者市場。影響客戶買單的常常是進度,而不是相容度。