其他分享
首页 > 其他分享> > CodeGo.net>如何从网页中提取动态ajax内容

CodeGo.net>如何从网页中提取动态ajax内容

作者:互联网

我的要求是从网页中提取所需的内容.该页面有一部分正在使用ajax填充.当我在页面源代码中查看时,它没有显示使用Ajax加载的内容.该部分的内容将根据选中的复选框而变化.如果我们选中“印度”复选框,则该部分将显示印度的所有详细信息.页面源将仅显示默认内容,而不显示使用ajax显示的内容.选中复选框后,我检查了页面源,但仍仅显示默认值.如何获得该部分的内容,

解决方法:

在C#中,可以使用HTMLAgilityPack来抓取数据,但是如果使用webBrowser.DocumentText,则无法从网页加载Ajax内容来获取xpath.因此,在webBrowser控件完全加载了网页之后.在Document_Complete方法中,在下面添加一些代码:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
this.webBrowser1.Document;
IHTMLDocument2 currentDoc =(IHTMLDocument2)this.webBrowser1.Document.DomDocument;

doc.LoadHtml(currentDoc.activeElement.innerHTML);

标签:c-4-0,web-scraping,html-parsing,c,parsing
来源: https://codeday.me/bug/20191031/1979767.html