其他分享
首页 > 其他分享> > CrawlSpider

CrawlSpider

作者:互联网

CrawlSpider

简介

CrawlSpider是Spider的一个子类,除继承了Spider的特性和功能外,还派生了自由的更强大的特性和能力。最显著的功能是"LinkExtracts",Spider是所有爬虫的基类,设计原则只是为了爬取start_url列表中的网页,而从爬取到的网页中进一步提取url进行爬取的工作用CrawlSpider更合适。

基本使用

  1. 创建工程:scrapy startproject xxx
  2. 创建爬虫:scrapy genspider -t crawl 爬虫名 起始url

    Rule

    Rule对象是一个爬取规则的类。

标签:调用,提取,函数,CrawlSpider,Spider,domains,链接
来源: https://www.cnblogs.com/tmdhhl/p/10661211.html