其他分享
首页 > 其他分享> > scrapy爬虫案例--如何爬取网易新闻?

scrapy爬虫案例--如何爬取网易新闻?

作者:互联网

一、目标

爬取网易新闻首页(https://news.163.com/)中(国内、国际、军事、航空)四个版块的新闻内容,并且按照格式:(网易新闻/版块名/新闻标题.txt)创建文件名,写入新闻内容

二、分析

通过对首页、各版块页、以及详情页分析发现,只有四个版块中的新闻标题是通过js动态加载获取的,因此这部分内容准备采用selenium+ChromeDriver去获取。

在scrapy中使用selenium+ChromeDriver的大体策略如下:

三、代码实现

四、爬取结果展示

 

标签:bro,item,--,request,爬取,url,scrapy,path
来源: https://www.cnblogs.com/eliwang/p/14843571.html