编程语言
首页 > 编程语言> > java – 如何记录nutch插件的执行情况

java – 如何记录nutch插件的执行情况

作者:互联网

我正在努力构建具有特殊要求的自定义nutch插件.

我在hadoop.log中找到了我的插件,但它没有相关性.

我在我的代码的不同位置添加了LOG.debug(“test”)和LOG.info(“test2”),我在log4j.properties中写道

# Logging for development
log4j.logger.org.apache.nutch.parse.html=DEBUG

我的问题是:我在哪里可以找到这些消息,我已经检查过hadoop.log但我找不到任何东西?

如何记录/跟踪我的java代码? (我不是在使用eclipse.)

谢谢

解决方法:

如果你的插件有类Variable

public static final Log LOG = LogFactory.getLog(YourClass.class
        .getName());

你的被叫方法有:

LOG.info("Your Logmessage");

你已经构建了你的插件,并配置Nutch在获取/抓取时使用你的插件/ …然后在hadoop.log中记录消息.

当你构建Nutch时,是否说它正在构建你的插件?

如果是,您可以检查您的插件配置,该配置部署到NutchHome / runtime / local / conf / nutch-site.xml:

<property>
<name>plugin.includes</name>
<value>protocol-http|urlfilter-regex|parse-(html)|yourplugin</value>
<description>The plugins which are used in every crawl ordered by call-  order</description>
</property>

如果您的插件是在运行时环境中配置的.如果没有更改配置文件和重建Nutch.如果这没有帮助,您可以提供更多信息.

标签:java,plugins,solr,web-crawler,nutch
来源: https://codeday.me/bug/20190709/1416950.html