编程语言
首页 > 编程语言> > c# – 从WebBrowserControl中单击的HtmlElement获取XPath

c# – 从WebBrowserControl中单击的HtmlElement获取XPath

作者:互联网

如何从WebBrowserControl中单击的HtmlElement获取XPath?

这是我检索点击的HtmlElement的方法:

System.Windows.Forms.HtmlDocument document = this.webBrowser1.Document;
document.MouseUp += new HtmlElementEventHandler(this.htmlDocument_Click);

private void htmlDocument_Click(object sender, HtmlElementEventArgs e)
{
    HtmlElement element = this.webBrowser1.Document.GetElementFromPoint(e.ClientMousePosition);
}

我想在网站上点击特定元素(价格,商品编号,描述等)并获取他们的XPath表达式.

谢谢!

解决方法:

XPath表达式不是HTML的标准功能(与XML不同).如果您希望获得一个稍后可以与Html Agility Pack一起使用的元素XPath,那么您至少有两个选项:

>使用HtmlElement.Parent向上走元素的DOM祖先树并构造
手动XPath.
>使用Html Agility Pack本身并做这样的事情(未经测试):

HtmlElement element = this.webBrowser1.Document.GetElementFromPoint(e.ClientMousePosition);

var savedId = element.Id;
var uniqueId = Guid.NewGuid().ToString();
element.Id = uniqueId;

var doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(element.Document.GetElementsByTagName("html")[0].OuterHtml);
element.Id = savedId;

var node = doc.GetElementbyId(uniqueId);
var xpath = node.XPath;

标签:c,webbrowser-control,xpath
来源: https://codeday.me/bug/20190718/1491716.html