大神牛刀小试,用Python爬取海量头条妹子图!
作者:互联网
首先需要安装的Python库:
requests
urllib
直接pip安装就好了
接着我们在网页上打开今日头条,在搜索栏搜索“街拍”
因为这里面的小姐姐多,漂亮
之后,我们选择“network”标签,按F5刷新,就能找到类型“Type”是“xhr”的,这是一个Ajax请求。Ajax的全称是“Asynchronous JavaScript and XML”,即异步的‘JavaScript ’和‘XML’。
原理是:利用JavaScript在保证页面不被刷新、页面链接不改变的情况下与服务器交换数据并更新部分网页的技术。
点击“Type”为“xhr”的Ajax请求的name,再选择“Preview”标签,我们就可以看到下图的数据了,这是浏览器向服务器请求的 json数据,将data展开可以我们就看到了
接下来我们展开‘data’,再点开一个,比如‘0’,找到里面的‘image_list’展开,这四个URL就是网页上的四张缩略图的URL。
看看效果:
好了,不多说了 !直接上代码。
需要的Python资料的可以私信、留言小编,免费领取!
标签:XML,网页,牛刀小试,Python,JavaScript,爬取,URL,Ajax 来源: https://www.cnblogs.com/heiyu123/p/14023000.html