1. 程式人生 > >淺析XML和JSON的區別

淺析XML和JSON的區別

前言

今天做介面對接時,發現對方竟然是通過XML進行資料傳輸,當時冒出的第一個想法就是:WTF,這都什麼年代了,還在用XML,是來搞笑的吧,JSON它不香嗎?

想法歸想法,但對接還是要完成的是吧?然後看了下開發文件時間(2013年),那還是可以理解的嘛!

之前對XML一知半解,現在要用到了,趕緊補充一下知識,總結一下XML和JSON的區別

1.XML介紹

  • XML 指可擴充套件標記語言(EXtensible Markup Language)
  • XML 是一種標記語言,很類似 HTML
  • XML 的設計宗旨是傳輸資料,而非顯示資料
  • XML 標籤沒有被預定義。您需要自行定義標籤。
  • XML 被設計為具有自我描述性。
  • XML 是 W3C 的推薦標準 

2.JSON介紹

JSON(JavaScript Object Notation) 是一種輕量級的資料交換格式。 易於人閱讀和編寫。同時也易於機器解析和生成。 它基於JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一個子集。 JSON採用完全獨立於語言的文字格式,但是也使用了類似於C語言家族的習慣(包括C, C++, C#, Java, JavaScript, Perl, Python等)。 這些特性使JSON成為理想的資料交換語言。

3.XML和JSON優缺點

(1).XML的優缺點

XML的優點:

  1. 格式統一,符合標準;
  2. 容易與其他系統進行遠端互動,資料共享比較方便。

XML的缺點:

  1. XML檔案龐大,檔案格式複雜,傳輸佔頻寬;
  2. 伺服器端和客戶端都需要花費大量程式碼來解析XML,導致伺服器端和客戶端程式碼變得異常複雜且不易維護;
  3. 客戶端不同瀏覽器之間解析XML的方式不一致,需要重複編寫很多程式碼;
  4. 伺服器端和客戶端解析XML花費較多的資源和時間。

(2).JSON的優缺點

JSON的優點:

  1. 資料格式比較簡單,易於讀寫,格式都是壓縮的,佔用頻寬小;
  2. 易於解析,客戶端JavaScript可以簡單的通過eval()進行JSON資料的讀取;
  3. 支援多種語言,包括ActionScript, C, C#, ColdFusion, Java, JavaScript, Perl, PHP, Python, Ruby等伺服器端語言,便於伺服器端的解析;
  4. 在PHP世界,已經有PHP-JSON和JSON-PHP出現了,偏於PHP序列化後的程式直接呼叫,PHP伺服器端的物件、陣列等能直接生成JSON格式,便於客戶端的訪問提取;
  5. 因為JSON格式能直接為伺服器端程式碼使用,大大簡化了伺服器端和客戶端的程式碼開發量,且完成任務不變,並且易於維護。

JSON的缺點:

暫無

4.XML和JSON的優缺點對比

(1).可讀性方面。

JSON和XML的資料可讀性基本相同,JSON和XML的可讀性可謂不相上下,一邊是建議的語法,一邊是規範的標籤形式,XML可讀性較好些。

(2).可擴充套件性方面。

XML天生有很好的擴充套件性,JSON當然也有,沒有什麼是XML能擴充套件,JSON不能的。

(3).編碼難度方面。

XML有豐富的編碼工具,比如Dom4j、JDom等,JSON也有json.org提供的工具,但是JSON的編碼明顯比XML容易許多,即使不借助工具也能寫出JSON的程式碼,可是要寫好XML就不太容易了。

(4).解碼難度方面。

XML的解析得考慮子節點父節點,讓人頭昏眼花,而JSON的解析難度幾乎為0。這一點XML輸的真是沒話說。

(5).流行度方面。

當前JSON在流行度方面已經遠遠超過XML。

(6).解析手段方面。

JSON和XML同樣擁有豐富的解析手段。

(7).資料體積方面。

JSON相對於XML來講,資料的體積小,傳遞的速度更快些。

(8).資料互動方面。

JSON與JavaScript的互動更加方便,更容易解析處理,更好的資料互動。

(9).資料描述方面。

JSON對資料的描述性比XML較差。

(10).傳輸速度方面。

JSON的速度要遠遠快於XML。

5.XML與JSON資料格式比較

(1).關於輕量級和重量級

輕量級和重量級是相對來說的,那麼XML相對於JSON的重量級體現在哪呢?應該體現在解析上,XML目前設計了兩種解析方式:DOM和 SAX。

<1>.DOM

DOM是把一個數據交換格式XML看成一個DOM物件,需要把XML檔案整個讀入記憶體,這一點上JSON和XML的原理是一樣的,但是XML要考慮父節點和子節點,這一點上JSON的解析難度要小很多,因為JSON構建於兩種結構:key/value,鍵值對的集合;值的有序集合,可理解為陣列;

<2>.SAX

SAX不需要整個讀入文件就可以對解析出的內容進行處理,是一種逐步解析的方法。程式也可以隨時終止解析。這樣,一個大的文件就可以逐步的、一點一點的展現出來,所以SAX適合於大規模的解析。這一點,JSON目前是做不到得。

所以,JSON和XML的輕/重量級的區別在於:
JSON只提供整體解析方案,而這種方法只在解析較少的資料時才能起到良好的效果;
XML提供了對大規模資料的逐步解析方案,這種方案很適合於對大量資料的處理。

(2).關於資料格式編碼及解析難度

<1>.在編碼方面。

雖然XML和JSON都有各自的編碼工具,但是JSON的編碼要比XML簡單,即使不借助工具,也可以寫出JSON程式碼,但要寫出好的XML程式碼就有點困難;與XML一樣,JSON也是基於文字的,且它們都使用Unicode編碼,且其與資料交換格式XML一樣具有可讀性。
主觀上來看,JSON更為清晰且冗餘更少些。JSON網站提供了對JSON語法的嚴格描述,只是描述較簡短。從總體來看,XML比較適合於標記文件,而JSON卻更適於進行資料交換處理。

<2>.在解析方面。

在普通的web應用領域,開發者經常為XML的解析傷腦筋,無論是伺服器端生成或處理XML,還是客戶端用 JavaScript 解析XML,都常常導致複雜的程式碼,極低的開發效率。
實際上,對於大多數Web應用來說,他們根本不需要複雜的XML來傳輸資料,XML宣稱的擴充套件性在此就很少具有優勢,許多Ajax應用甚至直接返回HTML片段來構建動態Web頁面。和返回XML並解析它相比,返回HTML片段大大降低了系統的複雜性,但同時缺少了一定的靈活性。同XML或 HTML片段相比,資料交換格式JSON 提供了更好的簡單性和靈活性。

(3).例項比較

XML和JSON都使用結構化方法來標記資料,下面來做一個簡單的比較。

<1>.用XML表示中國部分省市資料如下:
<?xml version="1.0" encoding="utf-8" ?>
<country>
  <name>中國</name>
  <province>
    <name>黑龍江</name>
    <citys>
      <city>哈爾濱</city>
      <city>大慶</city>
    </citys>    
  </province>
  <province>
    <name>廣東</name>
    <citys>
      <city>廣州</city>
      <city>深圳</city>
      <city>珠海</city>
    </citys>   
  </province>
  <province>
    <name>臺灣</name>
    <citys>
       <city>臺北</city>
       <city>高雄</city>
    </citys> 
  </province>
  <province>
    <name>新疆</name>
    <citys>
      <city>烏魯木齊</city>
    </citys>
  </province>
</country>
<2>.用JSON表示中國部分省市資料如下:
 var country =
        {
            name: "中國",
            provinces: [
            { name: "黑龍江", citys: { city: ["哈爾濱", "大慶"]} },
            { name: "廣東", citys: { city: ["廣州", "深圳", "珠海"]} },
            { name: "臺灣", citys: { city: ["臺北", "高雄"]} },
            { name: "新疆", citys: { city: ["烏魯木齊"]} }
            ]
        }

編碼的可讀性來說,XML有明顯的優勢,畢竟人類的語言更貼近這樣的說明結構。JSON讀起來更像一個數據塊,讀起來就比較費解了。不過,我們讀起來費解的語言,恰恰是適合機器閱讀,所以通過JSON的索引country.provinces[0].name就能夠讀取“黑龍江”這個值。

編碼的手寫難度來說,XML還是舒服一些,好讀當然就好寫。不過寫出來的字元JSON就明顯少很多。去掉空白製表以及換行的話,JSON就是密密麻麻的有用資料,而XML卻包含很多重複的標記字元。