java-解析XML时忽略DTD
作者:互联网
使用XOM xml库解析文件时,如何忽略DTD声明.我的文件包含以下行:
<?xml version="1.0"?>
<!DOCTYPE BlastOutput PUBLIC "-//NCBI//NCBI BlastOutput/EN" "NCBI_BlastOutput.dtd">
//rest of stuff here
当我尝试build()我的文档时,我得到了DTD文件的filenotfound异常.我知道我没有此文件,我也不关心它,那么在使用XOM时如何将其删除?
这是一个代码片段:
public BlastXMLParser(String filePath) {
Builder b = new Builder(false);
//not a good idea to have exception-throwing code in constructor
try {
_document = b.build(filePath);
} catch (ParsingException ex) {
Logger.getLogger(BlastXMLParser.class.getName()).log(Level.SEVERE,"err", ex);
} catch (IOException ex) {
//
}
private Elements getBlastReads() {
Element root = _document.getRootElement();
Elements rootChildren = root.getChildElements();
for (int i = 0; i < rootChildren.size(); i++) {
Element child = rootChildren.get(i);
if (child.getLocalName().equals("BlastOutput_iterations")) {
return child.getChildElements();
}
}
return null;
}
}
我在这行得到一个NullPointerException:
Element root = _document.getRootElement();
将DTD行从源XML文件中删除后,我可以成功解析它,但这不是最终生产系统中的选项.
解决方法:
首选的解决方案是实现一个EntityResolver来拦截对DTD的请求,并将其重定向到嵌入式副本.如果你
>无法访问DTD,并且
>绝对确定您将不需要它(除了验证,它还可以声明文档中使用的字符实体),并且
>您正在使用Xerces XML Parser实现
您可以通过设置相应的SAX功能来禁用DTD的获取.在XOM中,应该通过将XMLReader传递给Builder构造函数,如下所示:
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.XMLReaderFactory;
...
XMLReader xmlreader = XMLReaderFactory.createXMLReader();
xmlreader.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);
Builder builder = new Builder(xmlreader);
标签:java,xml,xom 来源: https://codeday.me/bug/20191010/1887249.html