其他分享
首页 > 其他分享> > 了解使用Pyppeteer

了解使用Pyppeteer

作者:互联网

1.Pyppeteer的来源

如果大家对 Python 爬虫有所了解的话,想必你应该听说过 Selenium 这个库,这实际上是一个自动化测试工具.但是其环境配置的麻烦就不用我多说了.

 Pyppeteer,不是 Puppeteer。它是 Puppeteer 的 Python 版本的实现,但他不是 Google 开发的,是一位来自于日本的工程师依据 Puppeteer 的一些功能开发出来的非官方版本。

在 Pyppetter 中,实际上它背后也是有一个类似 Chrome 浏览器的 Chromium 浏览器在执行一些动作进行网页渲染.

2.Pyppeteer的几种基本用法

pyppeteer github 地址:https://github.com/miyakogi/pyppeteer

2.1设置网页格式

driver = await launch({
        # 谷歌浏览器的安装路径
        'executablePath': 'C:\Program Files\Google\Chrome\Application\chrome.exe',
        # Pyppeteer 默认使用的是无头浏览器
        'headless': False,
        # 设置Windows-size和Viewport大小来实现网页完整显示
        'args': ['--no-sandbox', '--window-size=1024,768']
    })
code1

2.2打开你所需要的网站

page = await driver.newPage()
await page.goto(url)
code2

2.3通过选择器进行操作

await page.type(选择器信息,内容,时间)
#await page.type('#q4','20183769')
await page.click(选择器信息)
#await page.click('#divquestion3 > ul > li > a')
test=await page.querySelector(选择器信息)
await test.click()
#date=await page.querySelector('#q1')
#await date.click()
code3

2.4通过xpath 定位/操作

click_handle = await page.xpath("xpath路径")
await click_handle[0].click()
code4

2.5定位转换frame

date = await page.querySelector('#q2')
    await date.click()
    frame = page.frames#获取所有的frame
    date2 = await frame[1].querySelector('#selectTodayButton')
    await date2.click()
code5

2.6获取所有页面

page_list = await driver.pages()
await page_list[-1].content() 
code6

3.Pyppeteer几种常用类

浏览器类

pyppeteer.browser.Browser()
这个类是由launch()返回的实例

 键盘类

worker类

page.on(‘workercreated’, 函数) 这个函数传入的参数就是worker类

Dialog类

page.on( 'dialog', 函数),函数的参数就是这个类

frame

 

ElementHandle

 

 

 

 

frame

标签:返回,await,浏览器,coroutine,Pyppeteer,click,了解,使用,page
来源: https://www.cnblogs.com/zzmds/p/14277230.html