其他分享
首页 > 其他分享> > 伤腰的Python爬虫案例,零基础必备实战教程。

伤腰的Python爬虫案例,零基础必备实战教程。

作者:互联网

序言
今日带大家一起收集一个二次元图片网址,里边漂亮小姐姐五花八门,图形的信息量也是非常大的,来一睹为快吧!!

开发工具详细介绍:
python3.6pycharmrequestsparselos
网络爬虫实例数据收集一般流程:
找数据相对应的链接地址
编码推送详细地址请求
数据解析<分析我们应该的信息>
信息存储(当地)

1.最先第一步,寻找相对应的链接地址
毕竟是静态页面,因此数据信息很容易就会找到
#url编号:汉语在请求和响应时转换格式,http协议默认设置不兼容汉语,由%数字字母
request_address=fhttps:/连接带不上/page/{page}
#意味着电脑浏览器识别码
headers={user-agent:Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/91.0.4472.124Safari/537.36}

2.编码推送详细地址请求
response=requests.get(url=request_address,headers=headers)
html_data=response.text#字符串数组--正则匹配
print(html_data)
要求一下,看一下对吗
3.数据解析<分析我们应该的信息>html数据信息,xpath

selector=parsel.Selector(html_data)#变换基本数据类型
lis=selector.xpath(//div[@id="post-list"]/ul/li)#全部相册图片标签
forliinlis:#一个一个实际操作相册图片标识目标
pic_title=li.xpath(.//h2/a/text()).get()#相册图片文章标题
pic_href=li.xpath(.//h2/a/@href).get()#相册图片详细地址
print(pic_title,pic_href)

4.保存数据
withopen(fimg{pic_title}{pic_name},mode=wb)asf:
f.write(img_data)
print(储存进行:,pic_name)
运作详细编码
是否一项特别简单的网络爬虫,也能让我们坚持不懈敲代码的例子呢?

标签:Python,爬虫,零基础必,实战教程,数据,链接,数字字母
来源: