javascript-如何从通过XMLHttpRequest接收的html页面创建DOM对象?
作者:互联网
我正在开发一个Chrome扩展程序,因此对于我要获得权限的域,我对XMLHttpRequests具有跨主机权限.
我已经使用XMLHttpRequest并获得了HTML网页(txt / html).我想使用XPath(document.evaluate)从中提取相关位.不幸的是,我无法从html返回的字符串构造DOM对象.
var xhr = new XMLHttpRequest();
var name = escape("Sticks N Stones Cap");
xhr.open("GET", "http://items.jellyneo.net/?go=show_items&name="+name+"&name_type=exact", true);
xhr.onreadystatechange = function () {
if (xhr.readyState == 4) {
var parser = new DOMParser();
var xmlDoc = parser.parseFromString(xhr.responseText,"text/xml");
console.log(xmlDoc);
}
}
xhr.send();
console.log用于在Chromium JS控制台中显示调试内容.
在所说的JS控制台中.我得到这个:
Document
<html>
<body>
<parsererror style="display: block; white-space: pre; border: 2px solid #c77; padding: 0 1em 0 1em; margin: 1em; background-color: #fdd; color: black">
<h3>This page contains the following errors:</h3>
<div style="font-family:monospace;font-size:12px">error on line 1 at column 60: Space required after the Public Identifier
</div>
<h3>Below is a rendering of the page up to the first error.</h3>
</parsererror>
</body>
</html>
那么我应该如何使用XMLHttpRequest->接收HTML->转换为DOM->使用XPath横向?
我应该使用“隐藏的” iframe hack来加载/接收DOM对象吗?
解决方法:
DOMParser使DOCTYPE定义令人窒息.在任何其他非xhtml标记(例如< link>没有结束/.您可以控制要发送的文件吗?如果不是,最好的选择是将其解析为字符串.使用正则表达式查找所需内容.
编辑:您可以通过将浏览器注入到隐藏的div中来使浏览器为您解析正文的内容:
var hidden = document.body.appendChild(document.createElement("div"));
hidden.style.display = "none";
hidden.innerHTML = /<body[^>]*>([\s\S]+)<\/body>/i(xhr.responseText)[1];
现在,在隐藏的内容内搜索以查找所需内容:
var myEl = hidden.querySelector("table.foo > tr > td.bar > span.fu");
var myVal = myEl.innerHTML;
标签:domparser,javascript 来源: https://codeday.me/bug/20191209/2096045.html