java-如何在HTML文件中搜索某些标签?
作者:互联网
我在Java中有一个小问题.
操作方法:我想在HTML文件中搜索标签href和src,然后获取与该标签关联的URL.
最好的方法是什么?
谢谢您的帮助.
最好的祝福.
解决方法:
这是我用来完全完成您想要做的事情的代码,但首先让我给您一些提示.
如果您在Java Swing环境中,请确保使用javax.swing.text.html和javax.swing.text.html.parser包中的方法.不幸的是,它们主要用于JEditorPane,但我仍然强烈建议您看看这些.
Java 6 API中有一个名为HTML.Tag的类,用于标识HTML的开始和结束标记,然后可以使用它们来确定希望程序跟随的链接在哪里.http://java.sun.com/javase/6/docs/api/javax/swing/text/html/HTML.Tag.html
当我编写与此非常相似的程序时,我使用了3种主要方法:
public void handleStartTag(HTML.Tag t, MUtableAttributeSet atts, int pos)
public void handleEndTag(HTML.Tag t, int pos)
public void handleText(char[] text, int pos)
如果您需要更多有关如何编写这些方法的帮助,可以向我发送消息,但基本上,您正在寻找一个初始标签和一个结束标签,然后您将确定该URL,然后可以继续进行下一步. ,该网址后面是url.
要遵循该URL,建议您使用JEditorPane对象. javax.swing.event.HyperlinkListener接口仅定义了一个方法hyperlinkUpdate(HyperlinkEvent e),您可以将URL传递给该方法,然后在JEditorPane对象上调用.setPage(evt.getURL()).然后,将使用新页面更新窗格,并允许您再次开始该过程.
如果您有任何问题,请与我联系,请对这个答案进行投票!
标签:html-parsing,html,java 来源: https://codeday.me/bug/20191210/2103386.html