编程语言
首页 > 编程语言> > c#-使用HTML Agility Pack和xpath将“ iso-8859-1”转换为“ utf-8”

c#-使用HTML Agility Pack和xpath将“ iso-8859-1”转换为“ utf-8”

作者:互联网

我正在尝试获取一个网页,但是特殊字符有问题.如何转换数据以获得正确的读数?该网站使用ISO 8859-1,我必须使用UTF 8.

    string url = "http://www.ta-meteo.fr/troyes.htm";
       HtmlWeb web = new HtmlWeb();
       HtmlDocument doc = web.Load(url);
       HtmlNode bulletinMatin = doc.DocumentNode.SelectSingleNode("//*[@id='blockdetday0']/div[1]/p[1]");
       MessageBox.Show(bulletinMatin.InnerText);    

谢谢.

解决方法:

我解决了问题

 string url = "http://www.ta-meteo.fr/troyes.htm";

 Encoding iso = Encoding.GetEncoding("iso-8859-1");
   HtmlWeb web = new HtmlWeb()
        {
            AutoDetectEncoding = false,
            OverrideEncoding = iso,
        };

   HtmlDocument doc = web.Load(url);
   HtmlNode bulletinMatin = doc.DocumentNode.SelectSingleNode("//*[@id='blockdetday0']/div[1]/p[1]");
   MessageBox.Show(bulletinMatin.InnerText);     

标签:iso-8859-1,html-agility-pack,c
来源: https://codeday.me/bug/20191030/1969371.html