编程语言
首页 > 编程语言> > Python学习 Day56 动态网页爬虫 01

Python学习 Day56 动态网页爬虫 01

作者:互联网

动态网页爬虫

一、相关概念

1.动态网页

2.Ajax(Asynchronouse JavaScript And XML)

在这里插入图片描述
打卡数据链接得到的数据是JSON数据格式
在这里插入图片描述


二、动态网页爬虫的解决方案

方式优点缺点
分析接口直接请求数据,无需解析;代码量少,性能高分析接口较复杂,特别是一些通过JS混淆的接口,需要一定的JS知识;容易被监测到是爬虫
selenium直接模拟浏览器的行为,浏览器能请求到的,使用selenium也能请求到;爬虫更稳定代码量多,性能低

分析URL时,去掉其中的“jsoncallback=XX”参数即可得到符合要求的JSON数据格式
在这里插入图片描述

标签:01,网页,Python,爬虫,接口,URL,Ajax,Day56,加载
来源: https://blog.csdn.net/ShengXIABai/article/details/118421162