PHP XML Expat 解析器

內建的 Expat 解析器使在 PHP 中處理 XML 文件成為可能。


XML 是什麼?

XML 用於描述資料,其焦點是資料是什麼。XML 檔案描述了資料的結構。

在 XML 中,沒有預定義的標籤。您必須定義自己的標籤。

如需學習更多關於 XML 的知識,請訪問我們的 XML 教程。


Expat 是什麼?

如需讀取和更新 - 建立和處理 - 一個 XML 文件,您需要 XML 解析器。

有兩種基本的 XML 解析器型別:

  • 基於樹的解析器:這種解析器把 XML 文件轉換為樹型結構。它分析整篇文件,並提供了對樹中元素的訪問,例如文件物件模型 (DOM)。
  • 基於事件的解析器:將 XML 文件視為一系列的事件。當某個具體的事件發生時,解析器會呼叫函式來處理。

Expat 解析器是基於事件的解析器。

基於事件的解析器集中在 XML 文件的內容,而不是它們的結構。正因為如此,基於事件的解析器能夠比基於樹的解析器更快地訪問資料。

請看下面的 XML 片段:

<from>Jani</from>

基於事件的解析器把上面的 XML 報告為一連串的三個事件:

  • 開始元素:from
  • 開始 CDATA 部分,值:Jani
  • 關閉元素:from

上面的 XML 例項包含了形式良好的 XML。不過這個例項是無效的 XML,因為沒有與它關聯的文件型別宣告 (DTD)。

然而,在使用 Expat 解析器時,這沒有區別。Expat 是不檢查有效性的解析器,忽略任何 DTD。

作為一款基於事件、非驗證的 XML 解析器,Expat 快速且輕巧,十分適合 PHP 的 Web 應用程式。

註釋:XML 文件必須形式良好,否則 Expat 會生成錯誤。


安裝

XML Expat 解析器函式是 PHP 核心的組成部分。無需安裝就可以使用這些函式。


XML 檔案

下面的 XML 檔案將應用在我們的例項中:

<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>


初始化 XML 解析器

我們要在 PHP 中初始化 XML 解析器,為不同的 XML 事件定義處理器,然後解析這個 XML 檔案。

例項

<?php
//Initialize the XML parser
$parser=xml_parser_create();

//Function to use at the start of an element
function start($parser,$element_name,$element_attrs)
{
switch($element_name)
{
case "NOTE":
echo "-- Note --<br>";
break;
case "TO":
echo "To: ";
break;
case "FROM":
echo "From: ";
break;
case "HEADING":
echo "Heading: ";
break;
case "BODY":
echo "Message: ";
}
}

//Function to use at the end of an element
function stop($parser,$element_name)
{
echo "<br>";
}

//Function to use when finding character data
function char($parser,$data)
{
echo $data;
}

//Specify element handler
xml_set_element_handler($parser,"start","stop");

//Specify data handler
xml_set_character_data_handler($parser,"char");

//Open XML file
$fp=fopen("test.xml","r");

//Read data
while ($data=https://www.itread01.com/php/fread($fp,4096))
{
xml_parse($parser,$data,feof($fp)) or
die (sprintf("XML Error: %s at line %d",
xml_error_string(xml_get_error_code($parser)),
xml_get_current_line_number($parser)));
}

//Free the XML parser
xml_parser_free($parser);
?>

以上程式碼將輸出:

-- Note --
To: Tove
From: Jani
Heading: Reminder
Message: Don't forget me this weekend!

工作原理:

  1. 通過 xml_parser_create() 函式初始化 XML 解析器
  2. 建立配合不同事件處理程式的的函式
  3. 新增 xml_set_element_handler() 函式來定義,當解析器遇到開始和結束標籤時執行哪個函式
  4. 新增 xml_set_character_data_handler() 函式來定義,當解析器遇到字元資料時執行哪個函式
  5. 通過 xml_parse() 函式來解析檔案 "test.xml"
  6. 萬一有錯誤的話,新增 xml_error_string() 函式把 XML 錯誤轉換為文字說明
  7. 呼叫 xml_parser_free() 函式來釋放分配給 xml_parser_create() 函式的記憶體

更多 PHP Expat 解析器的資訊

如需瞭解更多關於 PHP Expat 函式的資訊,請訪問我們的 PHP XML Parser 參考手冊。