首页 > 其他分享> > 网页动态数据加载爬取

网页动态数据加载爬取

2022-05-27 23:01:11 作者：互联网

from selenium import webdriver
from lxml import etree
from time import sleep
#实例化一个浏览器对象（传入浏览器的驱动成）
bro = webdriver.Chrome(executable_path='./chromedriver')
#让浏览器发起一个指定url对应请求
bro.get('http://125.35.6.84:81/xk/')

#page_source获取浏览器当前页面的页面源码数据
page_text = bro.page_source

#解析企业名称
tree = etree.HTML(page_text)
li_list = tree.xpath('//ul[@id="gzlist"]/li')
for li in li_list:
    name = li.xpath('./dl/@title')[0]
    print(name)
sleep(5)
bro.quit()

标签：bro,浏览器,text,li,爬取,import,动态数据,page,加载
来源： https://www.cnblogs.com/simon1993/p/16319371.html