其他分享
首页 > 其他分享> > 爬取安居客二手房房屋信息

爬取安居客二手房房屋信息

作者:互联网

目标

1 打开安居客二手房页面,如 https://nanning.anjuke.com/sale/?from=navigation 。得到如下页面。

   通过分析发现,每个页面有60个二手房信息。一共有50页。

 

 

 

 

 

2 打开其中一个二手房的信息后,跳转到如下页面。我们的目标是要得到下图所示框起来的“房屋信息”的内容。

  也就是我们需要爬取 50 * 60 = 3000 个“房屋信息”

 

 

思路

1 打开安居客二手房页面,获取源码后,使用xpath抓取每个页面的二手房标题的跳转链接。如下图所示。以便进入跳转页面。

 

 

  当使用reques请求页面源码后,安居客的反爬机制会检测出我们的请求,提示如下页面。为了解决这个问题,我们应该使用代理IP。我们本次使用蘑菇代理IP。

1 import requests
2 url = 'https://nanning.anjuke.com/sale/p1/#filtersort'
3 response = requests.get(url)
4 print(response.text)

 

 

 

标签:房屋信息,如下,爬取,二手房,跳转,安居,页面
来源: https://www.cnblogs.com/weifeng1998/p/13236137.html