专注收集记录技术开发学习笔记、技术难点、解决方案
网站信息搜索 >> 请输入关键词:
您当前的位置: 首页 > XML/SOAP

XML文件的常见解析步骤

发布时间:2010-05-20 14:01:29 文章来源:www.iduyao.cn 采编人员:星星草
XML文件的常见解析方法

SAX解析XML

SAX是一个解析速度快并且占用内存少的xml解析器,非常适合用于Android等移动设备。 SAX解析XML文件采用的是事件驱动,也就是说,它并不需要解析完整个文档,在按内容顺序解析文档的过程中,SAX会判断当前读到的字符是否合法XML语法中的某部分,如果符合就会触发事件。所谓事件,其实就是一些回调(callback)方法,这些方法(事件)定义在ContentHandler接口。下面是一些ContentHandler接口常用的方法:

startDocument()

当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。

endDocument()

和上面的方法相对应,当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。 

startElement(String namespaceURI, String localName, String qName, Attributes atts) 

当读到一个开始标签的时候,会触发这个方法。namespaceURI就是命名空间,localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。要注意的是SAX中一个重要的特点就是它的流式处理,当遇到一个标签的时候,它并不会纪录下以前所碰到的标签,也就是说,在startElement()方法中,所有你所知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不得而知的,都需要你的程序来完成。这使得SAX在编程处理上没有DOM来得那么方便。

endElement(String uri, String localName, String name)

这个方法和上面的方法相对应,在遇到结束标签的时候,调用这个方法。

characters(char[] ch, int start, int length) 

这个方法用来处理在XML文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。

SAX是基于事件驱动的。当然android的事件机制是基于回调函数的,在用SAX解析xml文档时候,在读取到文档开始和结束标签时候就会回调一个事件,在读取到其他节点与内容时候也会回调一个事件。

只要为SAX提供实现ContentHandler接口的类,那么该类就可以得到通知事件(实际上就是SAX调用了该类中的回调方法)。因为ContentHandler是一个接口,在使用的时候可能会有些不方便,因此,SAX还为其制定了一个Helper类:DefaultHandler,它实现了ContentHandler接口,但是其所有的方法体都为空,在实现的时候,你只需要继承这个类,然后重写相应的方法即可。使用SAX解析itcast.xml的代码如下:

public static List<Person> readXML(InputStream inStream) {
   try {
       SAXParserFactory spf = SAXParserFactory.newInstance();
       SAXParser saxParser = spf.newSAXParser(); //创建解析器
       //设置解析器的相关特性,http://xml.org/sax/features/namespaces = true 表示开启命名空间特性  
       //saxParser.setProperty("http://xml.org/sax/features/namespaces",true);
       XMLContentHandler handler = new XMLContentHandler();
       saxParser.parse(inStream, handler);
       inStream.close();
       return handler.getPersons();
   }catch (Exception e) {
       e.printStackTrace();
   }
   return null;
}

SAX 支持已内置到JDK1.5中,你无需添加任何的jar文件。关于XMLContentHandler的代码实现请看本页下面备注。

实验:

1、 建立xml文件

在src目录下面直接建立xml文件如下

<?xml version="1.0" encoding="utf-8"?>
<persons>
    <person id="100">
        <name >Tom</name>
        <age>20</age>
    </person>
    <person id="101">
        <name>Mary</name>
        <age>19</age>
    </person>    
</persons>

2、 创建javabean  cn.class3g.domain.person
package cn.class3g.domain;
public class Person {
    private String name;
    private int age;
    private int id;
    public int getId() {
        return id;
    }
    public void setId(int id) {
        this.id = id;
    }
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public int getAge() {
        return age;
    }
    public void setAge(int age) {
        this.age = age;
    }
    public String toString() {
        return "Person [name=" + name + ", age=" + age + ", id=" + id + "]";
    }
    public Person(String name, int age, int id) {
        super();
        this.name = name;
        this.age = age;
        this.id = id;
    }
     public Person() { }
}

3、 建立业务处理类SAXPersonService 、 PersonHandler

SAXPersonService

package cn.class3g.service; 
/*

 * 建立解析Persons.xml的业务类

*/
public class SAXPersonService {
//创建SAX解析器,并利用PersonHandler对象进行解析,并将结果返回
    public List<Person> getPersonList(InputStream inStream) throws Exception{
        SAXParserFactory factory = SAXParserFactory.newInstance();
        SAXParser parser = factory.newSAXParser();
        PersonHandler handler = new PersonHandler();
        parser.parse(inStream, handler);
        List<Person> personList = handler.getPersons();
        inStream.close();
        return personList;
    }
}
PersonHandler
package cn.class3g.service;
public class PersonHandler extends DefaultHandler {
    List<Person> persons;
    Person person;
    String elementTag=null;
    public List<Person> getPersons(){
        return persons;
    }

    public void startDocument() throws SAXException {

        persons = new ArrayList<Person>();

    }

    public void startElement(String uri, String localName, String qName,Attributes attributes) throws SAXException {
        if("person".equals(localName)){
            person = new Person();
            person.setId(new Integer(attributes.getValue(0)));
        }
        elementTag = localName;
     }

     public void characters(char[] ch, int start, int length) throws SAXException {
         if(elementTag != null){
             String data = new String(ch,start, length).trim();
             //为避免出现空指针异常,不要使用elementTag.equals("name")
             if("name".equals(elementTag)){
                 person.setName(data);
             }else if("age".equals(elementTag)){
                 person.setAge(Integer.valueOf(data));
             }
         }
    }

    public void endElement(String uri, String localName, String qName) throws SAXException {
    /*
     *注意此时不能用elementTag,因为有可能遇到两个连续的结束标签,连续调用
     *endElement,第一个结束标记调用时已经讲elementTag赋值为null,第二次调用会出现
     *空指针异常
   */
    if("person".equals(localName) && person!=null){
        persons.add(person);
        person = null;
    }
    elementTag = null;
    }
    public void endDocument() throws SAXException {

    }

}
编写测试类及测试方法

public void testSAX() throws Throwable{
    InputStream is = this.getClass().getClassLoader().getResourceAsStream("persons.xml");
    SAXPersonService service = new SAXPersonService();
    List<Person> personList = service.getPersonList(is);
    for(int i=0; i<personList.size(); i++){
    Log.i("TAG", personList.get(i).toString());
}

DOM解析xml

DOM解析XML文件时,会将XML文件的所有内容以对象树方式存放在内存中,然后允许您使用DOM API遍历XML树、检索所需的数据。使用DOM操作XML的代码看起来比较直观,并且,在某些方面比基于SAX的实现更加简单。但是,因为DOM需要将XML文件的所有内容以对象树方式存放在内存中,所以内存的消耗比较大,特别对于运行Android的移动设备来说,因为设备的资源比较宝贵,所以建议还是采用SAX来解析XML文件,当然,如果XML文件的内容比较小采用DOM是可行的。

创建DOMPersonService类

package cn.class3g.service;

…

public class DOMPersonService {
    public static List<Person> getPersonList(InputStream in) throws Exception{
        List<Person> personList = new ArrayList<Person>();
        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
        DocumentBuilder builder = factory.newDocumentBuilder();
        Document document = builder.parse(in);
        //注意是org.w3c.dom.Element;
        Element root = document.getDocumentElement(); //获取根节点
        NodeList nodes = root.getElementsByTagName("person");
        for(int i=0; i<nodes.getLength(); i++){
            Element personElement = (Element) nodes.item(i);
            Person person = new Person();
            person.setId(Integer.valueOf(personElement.getAttribute("id")));
            NodeList childNodes = personElement.getChildNodes();
            //遍历person孩子节点,注意这里孩子节点包括那些空格和换行(它们是文本节点)
            for(int j=0; j<childNodes.getLength(); j++){
                Node childNode = childNodes.item(j);
                 //确定是否为元素节点
                if(childNode.getNodeType() == Node.ELEMENT_NODE){
                    if("name".equals(childNode.getNodeName())){
                         person.setName(childNode.getFirstChild().getNodeValue());
                    }else if("age".equals(childNode.getNodeName())){
                         person.setAge(Integer.valueOf(childNode.getFirstChild().getNodeValue()));
                    }
                }
            }
            personList.add(person);
       }
       return personList;
    }
}
测试方法
public void testDOM() throws Throwable{
    InputStream is = this.getClass().getClassLoader().getResourceAsStream("persons.xml");
    DOMPersonService service = new DOMPersonService();
    List<Person> personList = service.getPersonList(is);
    Log.i("TAG", personList.toString());
}

Pull解析xml

除了可以使用 SAX和DOM解析XML文件,大家也可以使用Android内置的Pull解析器解析XML文件。 Pull解析器的运行方式与 SAX 解析器相似。它提供了类似的事件,如:开始元素和结束元素事件,使用parser.next()可以进入下一个元素并触发相应事件。事件将作为数值代码被发送,因此可以使用一个switch对感兴趣的事件进行处理。当元素开始解析时,调用parser.nextText()方法可以获取下一个Text类型元素的值。

Pull解析器的源码及文档下载网址:http://www.xmlpull.org/

实验步骤

添加文件 PullPersonService

package cn.class3g.service;

…

public class PullPersonService {
    public List<Person> getPersonList(InputStream in) throws XmlPullParserException, IOException {
        List<Person> personList = null;
        XmlPullParser parser = Xml.newPullParser();
        parser.setInput(in, "utf-8");
        int eventType = parser.getEventType();
        Person person = null;
        while (eventType != XmlPullParser.END_DOCUMENT) {
            switch (eventType) {
                case XmlPullParser.START_DOCUMENT:
                    personList = new ArrayList<Person>();
                break;
                case XmlPullParser.START_TAG:
                // 判断是否为person元素节点
                    if ("person".equals(parser.getName())) {
                    // 创建person,并读取属性id的值
                         person = new Person();
                         person.setId(Integer.valueOf(parser.getAttributeValue(0)));
                     }else if (person != null) {
                         if ("name".equals(parser.getName())) {
                         // 获取name元素值
                             person.setName(parser.nextText());
                         } else if ("age".equals(parser.getName())) {
                             person.setAge(Integer.valueOf(parser.nextText()));
                         }
                     }
                     break;
                case XmlPullParser.END_TAG:
                //结束标记如果为“person”且person对象不空则添加如list
                if ("person".equals(parser.getName()) && person != null) {
                    personList.add(person);
                    person = null;
                }
                break;
            }
            eventType = parser.next();
         }
         return personList;
    }
}

测试方法

public void testPull() throws Throwable{
    InputStream is = this.getClass().getClassLoader().getResourceAsStream("persons.xml");
    PullPersonService service = new PullPersonService();
    List<Person> personList = service.getPersonList(is);
    Log.i("TAG", personList.toString());
}








友情提示:
信息收集于互联网,如果您发现错误或造成侵权,请及时通知本站更正或删除,具体联系方式见页面底部联系我们,谢谢。

其他相似内容:

热门推荐: