1. 程式人生 > >Android解析XML檔案的方式

Android解析XML檔案的方式


androd手機中處理xml資料時很常見的事情,通常在不同平臺傳輸資料的時候,我們就可能使用xmlxml是與平臺無關的特性,被廣泛運用於資料通訊中,那麼在中如何解析xml檔案資料呢?

 通常有三種方式:DOM,SAX,PULL

DOM方式來處理。

DOM方式解析xml是先把xml文件都讀到記憶體中,然後再用DOM API來訪問樹形結構,並獲取資料的,但是這樣一來,如果xml檔案很大呢?手機CPU處理能力當然不能與PC機器比,因此在處理效率方面就相對差了,當然這是對於其他方式處理xml文件而言。

 解析xml文件,當然必須有xml文件檔案啦,下面是一個參考river,放在assets目錄.如下:

<?xml version="1.0" encoding="utf-8"?>
<rivers>
 <river name="靈渠" length="605">
     <introduction>
      靈渠在廣西壯族自治區興安縣境內,是世界上最古老的運河之一,有著世界古代水利建築明珠的美譽。靈渠古稱秦鑿渠、零渠、陡河、興安運河,於公元前214年鑿成通航,距今已2217年,仍然發揮著功用。
     </introduction>
      <imageurl>
      http://imgsrc.baidu.com/baike/pic/item/389aa8fdb7b8322e08244d3c.jpg
     </imageurl>
   </river> 
   
   <river name="膠萊運河

" length="200">
     <introduction>
      膠萊運河南起黃海靈山海口,北抵渤海三山島,流經現膠南、膠州、平度、高密、昌邑和萊州等,全長200公里,流域面積達5400平方公里,南北貫穿山東半島,溝通黃渤兩海。膠萊運河自平度姚家村東的分水嶺南北分流。南流由麻灣口入膠州灣,為南膠萊河,長30公里。北流由海倉口入萊州灣,為北膠萊河,100餘公里。
     </introduction>
      <imageurl>
      http://imgsrc.baidu.com/baike/pic/item/389aa8fdb7b8322e08244d3c.jpg
     </imageurl>
   </river>
   
   <river name="蘇北灌溉總渠
" length="168"> 
     <introduction>
      位於淮河下游江蘇省北部,西起洪澤湖邊的高良澗,流經洪澤,青浦、淮安,阜寧、射陽,濱海等六縣(),東至扁擔港口入海的大型人工河道。全長168km
     </introduction>
      <imageurl>
      http://imgsrc.baidu.com/baike/pic/item/389aa8fdb7b8322e08244d3c.jpg
     </imageurl>
   </river>
 </rivers>

那麼如何處理呢?

具體思路是:

*首先利用DocumentBuilderFactory建立一個DocumentBuilderFactory例項
*然後利用DocumentBuilderFactory建立DocumentBuilder

*然後載入XML文件(Document,
然後獲取文件的根結點(Element)
然後獲取根結點中所有子節點的列表(NodeList),
然後使用再獲取子節點列表中的需要讀取的結點。

 當然我們觀察節點,我需要用一個River物件來儲存資料,抽象出River

public class River implements Serializable { 
    private static final long serialVersionUID = 1L; 
    private String name;
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public int getLength() {
        return length;
    }
    public void setLength(int length) {
        this.length = length;
    }
    public String getIntroduction() {
        return introduction;
    }
    public void setIntroduction(String introduction) {
        this.introduction = introduction;
    }
    public String getImageurl() {
        return imageurl;
    }
    public void setImageurl(String imageurl) {
        this.imageurl = imageurl;
    }
    private int length;
    private String introduction;
    private String imageurl; 
}

下面我們就開始讀取xml文件物件,並新增進List中:程式碼如下:

我們這裡是使用assets中的river.xml檔案,那麼就需要讀取這個xml檔案,返回輸入流。

讀取方法為:inputStream=this.context.getResources().getAssets().open(fileName);   引數是xml檔案路徑,當然預設的是assets目錄為根目錄。

然後可以用DocumentBuilder物件的parse方法解析輸入流,並返回document物件,然後再遍歷doument物件的節點屬性。

//獲取全部河流資料
    /**
     * 引數fileName:為xml文件路徑
     */
    public List<River> getRiversFromXml(String fileName){
        List<River> rivers=new ArrayList<River>();
        DocumentBuilderFactory factory=null;
        DocumentBuilder builder=null;
        Document document=null;
        InputStream inputStream=null;
        //首先找到xml檔案
        factory=DocumentBuilderFactory.newInstance();
        try {
            //找到xml,並載入文件
            builder=factory.newDocumentBuilder();
            inputStream=this.context.getResources().getAssets().open(fileName);
            document=builder.parse(inputStream);
            //找到根Element
             Element root=document.getDocumentElement();
             NodeList nodes=root.getElementsByTagName(RIVER);
            //遍歷根節點所有子節點,rivers 下所有river
             River river=null;
             for(int i=0;i<nodes.getLength();i++){
                     river=new River(); 
                     //獲取river元素節點
                     Element riverElement=(Element)(nodes.item(i));
                     //獲取rivername屬性值
                     river.setName(riverElement.getAttribute(NAME));
                     river.setLength(Integer.parseInt(riverElement.getAttribute(LENGTH)));
                     //獲取riverintroduction標籤
                     Element introduction=(Element)riverElement.getElementsByTagName(INTRODUCTION).item(0);
                     river.setIntroduction(introduction.getFirstChild().getNodeValue());
                     Element imageUrl=(Element)riverElement.getElementsByTagName(IMAGEURL).item(0);
                     river.setImageurl(imageUrl.getFirstChild().getNodeValue()); 
                 rivers.add(river);
             }
        }catch (IOException e){
            e.printStackTrace();
        } catch (SAXException e) {
            e.printStackTrace();
        }
         catch (ParserConfigurationException e) {
            e.printStackTrace();
        }finally{
            try {
                inputStream.close();
            } catch (IOException e) {    
                e.printStackTrace();
            }
        }
        return rivers;
    }

 在這裡新增到List中, 然後我們使用ListView將他們顯示出來。如圖所示:

android解析xml檔案的方式(其二)

上一節中,我們使用DOM方式解析xml文件,該方式比較符合我們日常思維方式,容易上手,但是它直接把文件調入記憶體中,比較耗記憶體。在這裡我們可以用另外一種方式解析xml,這個就是SAX方式。

SAX即是:Simple API for XML

SAX是基於事件驅動的。當然android的事件機制是基於回撥函式的,在用SAX解析xml文件時候,在讀取到文件開始和結束標籤時候就會回撥一個事件,在讀取到其他節點與內容時候也會回撥一個事件。

既然涉及到事件,就有事件源,事件處理器。在SAX介面中,事件源是org.xml.sax包中的XMLReader,它通過parser()方法來解析XML文件,併產生事件。事件處理器是org.xml.sax包中ContentHanderDTDHanderErrorHandler,以及EntityResolver4個介面

XMLReader通過相應事件處理器註冊方法setXXXX()來完成的與ContentHanderDTDHanderErrorHandler,以及EntityResolver4個介面的連線,詳細介紹請見下表:

但是我們無需都繼承這4個介面,SDK為我們提供了DefaultHandler類來處理,DefaultHandler類的一些主要事件回撥方法如下:

由以上可知,我們需要XmlReader 以及DefaultHandler來配合解析xml

處理思路是:

1:建立SAXParserFactory物件

2: 根據SAXParserFactory.newSAXParser()方法返回一個SAXParser解析器
3:根據SAXParser解析器獲取事件源物件XMLReader
4:例項化一個DefaultHandler物件

5:連線事件源物件XMLReader到事件處理類DefaultHandler

6:呼叫XMLReaderparse方法從輸入源中獲取到的xml資料

7:通過DefaultHandler返回我們需要的資料集合。

程式碼如下:

public List<River> parse(String xmlPath){
        List<River> rivers=null;
        SAXParserFactory factory=SAXParserFactory.newInstance();
        try {
            SAXParser parser=factory.newSAXParser();
            //獲取事件源
            XMLReader xmlReader=parser.getXMLReader();
            //設定處理器
            RiverHandler handler=new RiverHandler();
            xmlReader.setContentHandler(handler);
            //解析xml文件
            //xmlReader.parse(new InputSource(new URL(xmlPath).openStream()));
            xmlReader.parse(new InputSource(this.context.getAssets().open(xmlPath)));
            rivers=handler.getRivers();    
        } catch (ParserConfigurationException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (SAXException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        
        return rivers;
    }

 重點在於DefaultHandler物件中對每一個元素節點,屬性,文字內容,文件內容進行處理。

 前面說過DefaultHandler是基於事件處理模型的,基本處理方式是:當SAX解析器導航到文件開始標籤時回撥startDocument方法,導航到文件結束標籤時回撥endDocument方法。當SAX解析器導航到元素開始標籤時回撥startElement方法,導航到其文字內容時回撥characters方法,導航到標籤結束時回撥endElement方法。

 根據以上的解釋,我們可以得出以下處理xml文件邏輯:

1:當導航到文件開始標籤時,在回撥函式startDocument中,可以不做處理,當然你可以驗證下UTF-8等等。

2:當導航到rivers開始標籤時,在回撥方法startElement中可以例項化一個集合用來存貯list,不過我們這裡不用,因為在建構函式中已經例項化了。

3:導航到river開始標籤時,就說明需要例項化River物件了,當然river標籤中還有name ,length屬性,因此例項化River後還必須取出屬性值,attributes.getValue(NAME),同時賦予river物件中,同時新增為導航到的river標籤新增一個boolean為真的標識,用來說明導航到了river元素。

4:當然有river標籤內還有子標籤(節點),但是SAX解析器是不知道導航到什麼標籤的,它只懂得開始,結束而已。那麼如何讓它認得我們的各個標籤呢?當然需要判斷了,於是可以使用回撥方法startElement中的引數String localName,把我們的標籤字串與這個引數比較下,就可以了。我們還必須讓SAX知道,現在導航到的是某個標籤,因此新增一個true屬性讓SAX解析器知道。因此

5:它還會導航到文字內標籤,(就是<img></img>裡面的內容),回撥方法characters,我們一般在這個方法中取出就是<img></img>裡面的內容,並儲存。

6:當然它是一定會導航到結束標籤</river> 或者</rivers>的,如果是</river>標籤,記得把river物件新增進list中。如果是river中的子標籤</introduction>,就把前面設定標記導航到這個標籤的boolean標記設定為false.

按照以上實現思路,可以實現如下程式碼:

/**導航到開始標籤觸發**/
        public void startElement (String uri, String localName, String qName, Attributes attributes){ 
         String tagName=localName.length()!=0?localName:qName;
         tagName=tagName.toLowerCase().trim();
         //如果讀取的是river標籤開始,則例項化River
         if(tagName.equals(RIVER)){
             isRiver=true;
             river=new River();
                /**導航到river開始節點後**/
                river.setName(attributes.getValue(NAME));
                river.setLength(Integer.parseInt(attributes.getValue(LENGTH)));
         }
         //然後讀取其他節點
          if(isRiver){ 
              if(tagName.equals(INTRODUCTION)){
                 xintroduction=true;
             }else if(tagName.equals(IMAGEURL)){
                 ximageurl=true;
             }  
         }  
        }
        
        /**導航到結束標籤觸發**/
        public void endElement (String uri, String localName, String qName){
         String tagName=localName.length()!=0?localName:qName;
         tagName=tagName.toLowerCase().trim();
         
        //如果讀取的是river標籤結束,則把River新增進集合中
         if(tagName.equals(RIVER)){
             isRiver=true;
             rivers.add(river);
         }
         //然後讀取其他節點
          if(isRiver){ 
              if(tagName.equals(INTRODUCTION)){
                 xintroduction=false;
             }else if(tagName.equals(IMAGEURL)){
                 ximageurl=false;
             } 
          }   
        } 
        
        //這裡是讀取到節點內容時候回撥
        public void characters (char[] ch, int start, int length){
            //設定屬性值
                if(xintroduction){
                     //解決null問題
                     river.setIntroduction(river.getIntroduction()==null?"":river.getIntroduction()+new String(ch,start,length));
                 }else if(ximageurl){
                     //解決null問題
                     river.setImageurl(river.getImageurl()==null?"":river.getImageurl()+new String(ch,start,length));
                 }    
        } 

執行結果如下:

android解析xml檔案的方式(其三)

上一節中,我們使用SAX方式解析xml文件, SAX方式是基於事件驅動的。當然android的事件機制是基於回撥函式的。在這一節中,我們用另外一種方式解析xml文件,這種方式也是基於事件驅動的,與SAX方式一樣,它就是PULL方式。只不過PULL方式讀xml回撥方法返回的是數字

   讀取到xml的宣告返回      START_DOCUMENT; 
   讀取到xml的結束返回       END_DOCUMENT ; 
   讀取到xml的開始標籤返回 START_TAG 
   讀取到xml的結束標籤返回 END_TAG 
   讀取到xml的文字返回       TEXT 
xml資料結果還是採用我們先前使用的river.xml檔案。

採用PULL方式與SAX大同小異,重點在於我們需要知道導航到什麼標籤時候做什麼就行了,依據上一節SAX處理方式的思路,我們也可以在這一節中一樣處理,基本方法是:

基本處理方式是:當PULL解析器導航到文件開始標籤時就開始例項化list集合用來存貯資料物件。導航到元素開始標籤時回判斷元素標籤型別,如果是river標籤,則需要例項化River物件了,如果是其他型別,則取得該標籤內容並賦予River物件。當然它也會導航到文字標籤,不過在這裡,我們可以不用。

 根據以上的解釋,我們可以得出以下處理xml文件邏輯:

1:當導航到XmlPullParser.START_DOCUMENT,可以不做處理,當然你可以例項化集合物件等等。

2:當導航到XmlPullParser.START_TAG,則判斷是否是river標籤,如果是,則例項化river物件,並呼叫getAttributeValue方法獲取標籤中屬性值。

3:當導航到其他標籤,比如Introduction時候,則判斷river物件是否為空,如不為空,則取出Introduction中的內容,nextText方法來獲取文字節點內容

4:當然啦,它一定會導航到XmlPullParser.END_TAG的,有開始就要有結束嘛。在這裡我們就需要判讀是否是river結束標籤,如果是,則把river物件存進list集合中了,並設定river物件為null.

由以上的處理邏輯,我們可以得出以下程式碼:

public List<River> parse(String xmlPath){
        List<River> rivers=new ArrayList<River>();
        River river=null;
        InputStream inputStream=null;    
        //獲得XmlPullParser解析器
        XmlPullParser xmlParser = Xml.newPullParser();   
        try {
            //得到檔案流,並設定編碼方式
            inputStream=this.context.getResources().getAssets().open(xmlPath);
            xmlParser.setInput(inputStream, "utf-8");
            //獲得解析到的事件類別,這裡有開始文件,結束文件,開始標籤,結束標籤,文字等等事件。
            int evtType=xmlParser.getEventType();
         //一直迴圈,直到文件結束    
         while(evtType!=XmlPullParser.END_DOCUMENT){ 
            switch(evtType){ 
            case XmlPullParser.START_TAG:
                String tag = xmlParser.getName(); 
                //如果是river標籤開始,則說明需要例項化物件了
                if (tag.equalsIgnoreCase(RIVER)) { 
                   river = new River(); 
                  //取出river標籤中的一些屬性值
                  river.setName(xmlParser.getAttributeValue(null, NAME));
                  river.setLength(Integer.parseInt(xmlParser.getAttributeValue(null, LENGTH)));
                }else if(river!=null){
                    //如果遇到introduction標籤,則讀取它內容
                    if(tag.equalsIgnoreCase(INTRODUCTION)){
                    river.setIntroduction(xmlParser.nextText());
                    }else if(tag.equalsIgnoreCase(IMAGEURL)){
                        river.setImageurl(xmlParser.nextText());
                    }
                }
                break;
                
           case XmlPullParser.END_TAG:
             //如果遇到river標籤結束,則把river物件新增進集合中
               if (xmlParser.getName().equalsIgnoreCase(RIVER) && river != null) { 
                   rivers.add(river); 
                   river = null; 
               }
                break; 
                default:break;
            }
            //如果xml沒有結束,則導航到下一個river節點
            evtType=xmlParser.next();
         }
        } catch (XmlPullParserException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }catch (IOException e1) {
            // TODO Auto-generated catch block
            e1.printStackTrace();
        } 
        return rivers; 
    }

執行結果與其他2個一樣: