首页 > 编程语言> > 12行代码拿下所有lol皮肤！！Python超简单爬虫【内附详细教学】

12行代码拿下所有lol皮肤！！Python超简单爬虫【内附详细教学】

2021-06-13 12:00:25 作者：互联网

12行代码拿下所有lol皮肤！！Python超简单爬虫【内附详细教学】

提示：本文代码只是为学习爬虫提供思路，真正想要爬取皮肤最好还是用我加工后的代码O(∩_∩)O

文章目录

一、效果展示
二、代码区
三、原理详解

一、效果展示

话不多说，上图

二、代码区

注意代码不能直接用，要建一个文件夹放皮肤图片，然后用文件夹路径替换掉下面这条中的'pf/'，这样图片就都存在文件夹里了。

name='pf/'+str(id)+str(page)+".jpg"

import requests
lol1='https://game.gtimg.cn/images/lol/act/img/skin/big'
lol2='.jpg'
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0'}
for id in range(0,888):
    for page in range(30):
        url=lol1+str(id)+"00"+str(page)+lol2
        h=requests.get(url=url,headers=header).content
        name='pf/'+str(id)+str(page)+".jpg"
        print(name)
        with open(name,'wb') as fp:
                fp.write(h)

三、原理详解

如果看到这说明你不是个单纯的白嫖党，想必是有bear来

首先要爬东西当然要引入requests模块

然后是去lol官网逛一逛~

资料库里就有我们要的皮肤哦

按F12，用金手指看看图片的路径在哪

好的，轻轻松松获(bai)取(piao)到图片的地址，打开看看。https://game.gtimg.cn/images/lol/act/img/skin/big1009.jpg 没错，就是咱们要的东西。再多看看安妮其他皮肤的地址，发现什么规律没有?

https://game.gtimg.cn/images/lol/act/img/skin/big1003.jpg

https://game.gtimg.cn/images/lol/act/img/skin/big1004.jpg

https://game.gtimg.cn/images/lol/act/img/skin/big1005.jpg

没错，只是改动了一个数字而已！再看看其他英雄的原皮地址：

https://game.gtimg.cn/images/lol/act/img/skin/big2000.jpg

https://game.gtimg.cn/images/lol/act/img/skin/big3000.jpg

https://game.gtimg.cn/images/lol/act/img/skin/big4000.jpg

没错，也只是改动了一个数字而已！那么我们就可以推测，所有皮肤都是在/images/lol/act/img/skin/目录下的，第一位是英雄id，后三位是皮肤id，那么我们就可以暴力地遍历所有数字啦！

lol1='https://game.gtimg.cn/images/lol/act/img/skin/big'
lol2='.jpg'

这样把网址除数字部分拿出来，再循环用数字转str，用+连起来就能遍历大量网址了。

然后要准备一下咱们去请求资源的伪装：

header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0'}

就是在F12的网络下刷新一遍，第一个GET请求右下角有一个User-Agent，把后面的复制过来赋值给header就行了。

然后捏，咱们最新的英雄滚...咳咳，是格温，id号是887

那么直接简单粗暴，从0遍历到888，确保覆盖了所有英雄。

for id in range(0,888):

然后捏，咱们的皮肤最大id不超过20，我们就直接从0到30，确保覆盖了所有皮肤。

for page in range(30):

把id和page拼接起来，构成网址，别忘了中间还有两个’0‘。

url=lol1+str(id)+"00"+str(page)+lol2

有了网址，我们就可以下载数据咯，把图片的数据赋值给h

h=requests.get(url=url,headers=header).content

给他起个名字，加上之前创建的文件夹路径
        name='pf/'+str(id)+str(page)+".jpg"
        print(name)
最后打开这个文件，写进图片的数据，这样就可以了！

with open(name,'wb') as fp:
fp.write(h)

总结

u1s1，看着文件夹渐渐丰满起来，在边上打吧王者的时间，已经下(bai)载(piao)了近700张皮肤了！真香！你学废了吗！

标签：12,img,Python,内附,jpg,lol,str,skin,id
来源： https://blog.csdn.net/Roymasterpiece/article/details/117866889