1. 程式人生 > >XML中遇到特殊字元無法解析的問題

XML中遇到特殊字元無法解析的問題

  今天非常的鬱悶,用xml做配置檔案,出現了無法解析的問題。現把我的配置檔案分享出來:

  <webs>
          <web id="rzzl_chinazlxxw" url='http://chinarents.com/corp/company_search.php?page=1&firstid=1&twoid=10&threeid=169'>
            <urls>
              <url id="child_url"><![CDATA[(?isu)<div[^>]+bgLine[^>]+><a href="\.\.(\/shop\/about.*?contact)"\s+class[^>]+blackLink]]></url>
            </urls>

             <events>
               <event id="url" url="http://chinarents.com/corp/company_search.php?page=###&firstid=1&twoid=10&threeid=169" min="2" max="23"></event>
             </events>
  </web>

當解析xml的時候,說有特殊的字元,解析失敗。我當時第一反應就是可能因為"&"而引起的。於是我打算用<![CDATA]]>來解決,無奈,這個"&" 是放在XMl的屬性url中的。

        我在網上搜索了一下,有熱心的網友說可以用&#38;代替,於是我把"&"替換成了"&#38;",問題終於解決了,差點今天晚上沒有辦法睡覺啊。。

       現在把HTML中常用的特殊字元表貼出來。

部份HTML轉碼

SYMBOL CODE ENTITY NAME
&#8482;
&euro;
Space &#32; &nbsp;
! &#33;
" &#34; &quot;
# &#35;
$ &#36;
% &#37;
& &#38; &amp;
' &#39;
( &#40;
) &#41;
* &#42;
+ &#43;
, &#44;
- &#45;
. &#46;
/ &#47;
0 &#48;
1 &#49;
2 &#50;
3 &#51;
4 &#52;
5 &#53;
6 &#54;
7 &#55;
8 &#56;
9 &#57;
: &#58;
[ &#91;
\ &#92;
] &#93;
^ &#94;
_ &#95;
` &#96;
{ &#123;
| &#124;
} &#125;
~ &#126;
¡ &#161; &iexcl;
¢ &#162; &cent;
£ &#163; &pound;
¤ &#164; &curren;
¥ &#165; &yen;
¦ &#166; &brvbar;
§ &#167; &sect;
¨ &#168; &uml;
© &#169; &copy;
ª &#170; &ordf;
« &#171;
¬ &#172; &not;
&#173; &shy;
® &#174; &reg;
¯ &#175; &macr;
° &#176; &deg;
± &#177; &plusmn;
² &#178; &sup2;
³ &#179; &sup3;
SYMBOL CODE ENTITY NAME
; &#59;
< &#60; &lt;
= &#61;
> &#62; &gt;
? &#63;
@ &#64;
A &#65;
B &#66;
C &#67;
D &#68;
E &#69;
F &#70;
G &#71;
H &#72;
I &#73;
J &#74;
K &#75;
L &#76;
M &#77;
N &#78;
O &#79;
P &#80;
Q &#81;
R &#82;
S &#83;
T &#84;
U &#85;
V &#86;
W &#87;
X &#88;
Y &#89;
Z &#90;
a &#97;
b &#98;
c &#99;
d &#100;
e &#101;
f &#102;
g &#103;
h &#104;
i &#105;
j &#106;
k &#107;
l &#108;
m &#109;
n &#110;
o &#111;
p &#112;
q &#113;
r &#114;
s &#115;
t &#116;
u &#117;
v &#118;
w &#119;
x &#120;
y &#121;
z &#122;

相關推薦

XML遇到特殊字元無法解析的問題

  今天非常的鬱悶,用xml做配置檔案,出現了無法解析的問題。現把我的配置檔案分享出來: <webs> <web id="rzzl_chinazlxxw" url='http://chinarents.com/corp/compan

string.xml特殊字元的編碼

專案中要在string.xml 中顯示特殊符號,考慮使用ASCII碼進行顯示:  空格:&#160; 換行:\n 英文引號:\" 以下為常見的ASCII十進位制交換編碼: &#032;--> <-- 是空格 &#033;-->!&

php過濾xml特殊字元

業務需要將mongodb中的資料匯出為xml, 部分欄位封裝成xml檔案後, php再讀入解析會有錯誤, xmlspye也無法解析.排查發現這40W+資料中有6條資料包含控制符, 用下面這個函式過濾後解決了. <

xml特殊字元

> 和 < 這類字元是XML 標記字元,在 XML 中有特殊的含義。當在 SQL 查詢(或 XPath 查詢)中指定這些字元時,必須對它們進行適當的編碼(也稱為實體編碼)。下表列出了這些特殊字元並描述了它們的含義。有關更多資訊,請參見 XML 1.0 規範 中的

關於web傳給後臺的json包含特殊字元導致無法解析的解決方案

最近做的專案中涉及到大量英文,web傳json給後臺時會存在英文的   ""(雙引號):(冒號),(逗號)會出現json解析失敗,因此需要web將這些特殊的字元進行轉換:var txt=$(".tInfo").eq(i).val().replace(/\"/g,"'");

【潤乾報表5】資料庫密碼含有特殊字元潤乾應用部署時xml怎麼處理

問題舉例:     資料庫密碼中含有<字元,報表設計器下配置資料來源時,設計器會自動將這些特殊字元進行轉換,然而如果當我們在專案部署或整合時扔按照常規的配置,配置資料庫連線池時,會發現訪問報表時網頁出現如下報錯資訊: 問題總結:        經排查發現xml檔案

(android檔案下載)下載連結包含特殊字元--空格,中文等,導致無法識別處理方案

今天在app測試時出現標題所示錯誤,導致無法正常重server端下載檔案; 通過檢視日誌,瞭解到是由於下載連結中出現空格、中文等特殊字元,導致連線地址不合法; 在網上也查看了很多描述相關問題解決方案的帖子,很有啟發-- 但是考慮到方便自己和大家,還是把問題和解決方案貼出來

字串特殊字元的處理

用正則表示式進行轉換處理   使用正則表示式也是一種常用的處理方式,實現原理就是使用替換的方式來實現轉碼和解碼,轉碼時把<>,空格符,&,’,""替換成html編碼,解碼就把html編碼替換成對應的字元,實現程式碼如下: var HtmlUtil = { /1.用正則

PHP字串去除特殊字元

去除字串特殊字元的函式有trim、ltrim、rtrim、str_replace 1、trim--去除字串首尾處的空白字元(或其他字元) 語法: String trim(string $str[,string $charlist]) String trim:返回字串型別 stri

IDEASSH整合jsp無法解析el表示式

 在eclipse中ssh專案執行正常能夠解析el表示式而IDEA中卻無法解析,值棧中已經有值   jsp頁面顯示能夠解析OGNL表示式取無法解析el表示式,解決辦法   <%@page isELIgnored="fa

SQL SERVER 列名或別名特殊字元或為關鍵字

特殊字元:單引號、斜槓、百分號等。 關鍵字:from、in、select、where等。 一般會報xx附近有語法錯誤。確定xx為特殊字元或關鍵字。 解決辦法,列名或別名用中括號括起來。 舉個栗子: SELECT [借/貸] FROM TEST; SELECT [FROM] FRO

JQ的選擇器出現特殊字元的處理

HTML <body> <div id="id.a">aa</div> <div id="id#b">bb</div> <div id="id[1]">cc</div> </body>

latex06-LaTeX特殊字元

特殊符號有一堆,總不可能去記憶。全都用命令的形式來體現也不合適。 用到的時候,先看下Texstudio軟體編輯的左側有沒有這些特殊符號,有的話直接點選使用。 也可以直接百度,速度也是很快的。 下面給出一些常見的特殊符號 Latex中的空格 除了表格中的,還有些空格方式,下面連結的

url特殊字元問題

在 使用url進行引數傳遞時,經常會傳遞一些中文名(或含有特殊字元)的引數或URL地址,在後臺處理時會發生轉換錯誤。在有些傳遞頁面使用GB2312, 而在接收頁面使用UTF8,這樣接收到的引數就可能會與原來發生不一致。使用伺服器端的urlEncode函式編碼的URL,與使用客

在C++使用模板出現“無法解析的外部符號”問題

當我們宣告和定義一個模板的時候,必須要讓宣告和定義放在一個檔案裡。否則編譯器會報錯。 這就是為什麼boost的實現檔案的字尾名是hpp了。 這其中的理由是什麼呢?為什麼會這樣? 首先,一個編譯單元(translation unit)是指一個.cpp檔案以及它所

處理FusionCharts圖表特殊字元(%,¥,&等)

文章轉載自:慧都控制元件網 [http://www.evget.com] 概述:在FusionCharts圖表裡,如果要在圖形裡用到一些特殊的字元,你就要對它進行編碼,否則就無法顯示。本文中例舉了FusionCharts圖表中一些特殊字元來進行編碼,希望對學習Fusi

java處理url特殊字元%等

java處理url中的特殊字元(如&,%...) URL(Uniform Resoure Locator,統一資源定位器)是Internet中對資源進行統一定位和管理的標誌。一個完整的URL包括如下內容:1.       &

過濾XML的非法字元

在用Dom4J處理XML檔案時,丟擲了這個異常: An invalid XML character (Unicode: 0x8) was found in the CDATA section. 通過Google的快取裡面找到了一個解決辦法,原文連

XAML特殊字元以及空白的處理

XAML受限於XML的規則,例如,XML特別關注一些特殊字元,如&,<以及>。如果試圖使用這些字元設定一個元素的內容,將會遇到很多麻煩,因為XAML解析器認為正

我的Android進階之旅------>android一些特殊字元(如:←↑→↓等箭頭符號)的Unicode碼值

        在專案中,有時候在一些控制元件(如Button、TextView)中要新增一些符號,如下圖所示:                        這個時候可以使用圖片的方式來顯示,不過這些