java -Djavax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl YourApp 如果没有安装JAXP,SAXBuilder缺省地指向Apache Xerces。一旦你创建了SAXBuilder实例,你就可以在生成器中设置几个属性,其中包括:setValidation(boolean validate)。 这一方法告诉分析器在生成过程中是否根据Document Type Definition(DTD,文档类型定义)进行验证。缺省设置为"否"(off)。所用的DTD是文档中DocType引用的一个。根据任何其他DTD进行验证是不可能的,因为还没有分析器支持这一功能。setIgnoringElementContentWhitespace(boolean ignoring)。 这一方法告诉分析器是否忽略元素内容中所谓的"可忽略空格(whitespace)"。按照XML1.0规范,元素内容中的空格必须由分析器保留,但当根据DTD进行验证时,分析器可能知道文档的特定部分不会支持空格,所以这一区域的任何空格都是"可忽略的"。其缺省设置为"否"(off)。如果你不希望使一个文档"往返旅行",将输入内容以原样输出的话,那么将这一开关打开通常会使性能略微有些提高。注意,这一标志只有在验证已完成时才有效。而进行验证会导致性能下降,所以这一技巧仅在已应用验证时才有用。setFeature(String name, String value)。 这一方法设置基础SAX分析器的一个特性。这是一个原始的"传递(pass-through)"调用,所以在应用这一方法时应非常小心,因为对特性的错误设置(如弄错名称空间)可能会中断JDOM行为。而且,依靠任何特定分析器特性都会限制可移植性。这一调用对于启用模式验证最为有用。setProperty(String name, Object value)。 这一方法设置基础SAX分析器的一个属性。它也是一个原始的"传递"调用,它具有同样的风险,而且对于有才能的用户同样有用,特别是对于模式验证。下面的代码结合这些方法,利用JAXP选择的分析器读取本地文件,验证功能有效,可忽略的空格都被忽略。 SAXBuilder builder = new SAXBuilder();builder.setValidation(true);builder.setIgnoringElementContentWhitespace(true);Document doc = builder.build(new File("/tmp/foo.xml")); | |