SAX PULL DOCUMENT解析XML总结
一、SAX解析
1、继承DefaultHandler类,重写startDocument、startElement、character、endElement、endDocument方法,startDocument在读取时调用,可写一些实例化列表等;startElement在读取每个标签时调用,通过判断历史标签需要是否为需要获取的值的头;characters用来读取标签中的值;endElement读取标签的结束,用来保存characters获取的值;endDocument一般不做处理。
2、调用,用SAXParser或者XMLReader来解析
SAXParser解析
|
XMLReader解析
SAXHandlerParseService saxForHandler = new SAXHandlerParseService();
SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser saxParse = spf.newSAXParser();
// 为xmlReader设置内容处理器
XMLReader reader = saxParse.getXMLReader();
reader.setContentHandler(saxForHandler);
// 开始赋值
reader.parse(new InputSource(new StringReader(xml)));
List> userList = saxForHandler.getUser();
在解析时,一定要小心,不要忽略空白的地方,Sax解析器会把它认为是一个TextNod
二、PULL解析
与SAX类似,同样有START_DOCUMENT、START_ELEMENT、CHARACTERS、END_ELEMENT、END_DOCUMENT
1、实例化XmlPullParser解析器,设置输入编码(setInput),获得事件类型(getEventType),用SAX相同的处理进行,next()方法往下继续读取
三、DOCUMENT解析
1、实例化DocumentBuilderFactory,代码如下:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(input);
Element root = document.getDocumentElement();
2、跟xml传入的数据结构进行处理
3、返回需要的列表值即可
工程下载:ParseTest.rar
四、三者区别
DOM:
解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;
使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、CPU)
SAX/PULL:
事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少
缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;
使用场合:只需XML文档的少量内容,很少回头访问;一次性读取;机器内存少;
注意:SAX 解析器不创建任何对象。
- 基于TI最新多核DSP SoC架构解析(05-12)
- ARM linux解析之压缩内核zImage的启动过程(11-10)
- 基于Xilinx V5的DDR2数据解析功能实现(09-12)
- 网站出现“register_globals must is Off”解析(09-12)
- 两起西门子PROFIBUS-DP网络干扰故障解析(09-12)
- 移动存储器全面解析(09-12)