其他分享
首页 > 其他分享> > 如何反扒

如何反扒

作者:互联网

2 通过headers字段来反爬

headers中有很多字段,这些字段都有可能会被对方服务器拿过来进行判断是否为爬虫

2.1 通过headers中的User-Agent字段来反爬
 
2.2 通过referer字段或者是其他字段来反爬
2.3 通过cookie来反爬
 

3 通过js来反爬

普通的爬虫默认情况下无法执行js,获取js执行之后的结果,所以很多时候对方服务器会通过js的技术实现反爬

3.1 通过js实现跳转来反爬

在这些请求中,如果请求数量很多,一般来讲,只有那些response中带cookie字段的请求是有用的,意味着通过这个请求,对方服务器有设置cookie到本地

3.2 通过js生成了请求参数
3.3 通过js实现了数据的加密
 

4 通过验证码来反爬

5 通过ip地址来反爬

6 通过用户行为来反爬

7 其他的反爬方式

7.1 通过自定义字体来反爬
解决思路:切换到手机版
 
7.2 通过css来反爬

下图来自猫眼去哪儿电脑版

解决思路:计算css的偏移

标签:请求,反爬,通过,爬虫,js,如何,字段,反扒
来源: https://www.cnblogs.com/lab-zj/p/12166669.html