Python爬虫学以致用,嘿嘿
作者:互联网
因为放假回到了老家,可能是在镇上的缘故,治安管的可能不是那么严,每天晚上都会有鬼火少年出来炸街,md,有时候半夜两三点突然炸一下街,声音贼大,但是吧,声音贼大,车速还没我跑的快
天菩萨,真的烦死人了,一声砰,一下抖,家人们就说连续几天烦死了
于是我就想写篇文章去我们当地的"情报网"(就是那种地方自己人吐槽或者互助的网),希望大家一起对这种行为控诉一波,也希望家里有鬼火少年的家长不要天天麻将馆007,多看看你孩子在街上放炮。
于是我就写了篇文章去控述,但是吧,担心浏览量低了,大家看不到,于是就想想能不能用python写个爬虫来长长浏览量,说干就干。
由于那个网址太low,也没啥反扒的,也不需要休眠啥的,就很简单的写了出来,就用了个多线程,轮换ip,欸嘿嘿。
下面是代码
import requests
import random
from concurrent.futures import ThreadPoolExecutor
"""发送请求到网址"""
def Requsts():
# ip池
proxies = [
{'http': '183.230.106.87'},
{'http': '183.64.239.19'},
{'http': '36.92.159.181'},
{'http': '202.142.126.6'},
{'http': '67.229.29.109'},
{'http': '36.95.15.149'}
]
header={
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.9 Safari/537.36"
}
proxy = random.choice(proxies)# 随机选取一个ip
url='https://www.qj023.com/forum.php?mod=viewthread&tid=1940772'
resp=requests.get(url,headers=header,proxies=proxy)
"""多线程刷网址"""
def Multithreading():
with ThreadPoolExecutor(100) as t: # 创建线程池,有100个线程
for i in range(1000000):
t.submit(Requsts)
print(i)
if __name__ == '__main__':
Multithreading()
看看成果吧
欸嘿嘿,不敢长太多了,万一被逮到村口示众就蛋糕了。
代码因网址而已哈,有些网址有反扒机制的,可以自己去破破(比如添加cookie),刷太快怕被检测到的,可以每次休眠一会会儿。
标签:__,http,Python,ip,爬虫,网址,import,proxies,学以致用 来源: https://blog.csdn.net/m0_67394230/article/details/123258361