java – 如何记录nutch插件的执行情况
作者:互联网
我正在努力构建具有特殊要求的自定义nutch插件.
我在hadoop.log中找到了我的插件,但它没有相关性.
我在我的代码的不同位置添加了LOG.debug(“test”)和LOG.info(“test2”),我在log4j.properties中写道
# Logging for development
log4j.logger.org.apache.nutch.parse.html=DEBUG
我的问题是:我在哪里可以找到这些消息,我已经检查过hadoop.log但我找不到任何东西?
如何记录/跟踪我的java代码? (我不是在使用eclipse.)
谢谢
解决方法:
如果你的插件有类Variable
public static final Log LOG = LogFactory.getLog(YourClass.class
.getName());
你的被叫方法有:
LOG.info("Your Logmessage");
你已经构建了你的插件,并配置Nutch在获取/抓取时使用你的插件/ …然后在hadoop.log中记录消息.
当你构建Nutch时,是否说它正在构建你的插件?
如果是,您可以检查您的插件配置,该配置部署到NutchHome / runtime / local / conf / nutch-site.xml:
<property>
<name>plugin.includes</name>
<value>protocol-http|urlfilter-regex|parse-(html)|yourplugin</value>
<description>The plugins which are used in every crawl ordered by call- order</description>
</property>
如果您的插件是在运行时环境中配置的.如果没有更改配置文件和重建Nutch.如果这没有帮助,您可以提供更多信息.
标签:java,plugins,solr,web-crawler,nutch 来源: https://codeday.me/bug/20190709/1416950.html