Pyppeteer的使用

在 7.1 节,我们学习了 Selenium 的基本用法,其功能的确非常强大,但很多时候会发现它也有一些不太方便的地方,例如配置环境时,需要先安装好相关测览器,例如 Chrome、Firefox 等,然后到官方网站下载对应的驱动。最重要的是,需要安装对应的 Python Selenium 库,而且得看版本是否对应,这确实不太方便。另外,如果要大规模部署 Selenium,一些环境配置问题也是很头疼的。

本节,我们介绍 Selenium 的另一个替代品: Pyppeteer。

是 Pyppeteer,不是 Puppeteer,Puppeteer 是基于 Nodejs 的,Pyppeteer 是基于 Python 的。

Pyppeteer 介绍

安装

快速上手

launch方法

无头模式

调试模式

禁用提示条

防止检测

页面大小设置

用户数据持久化

Browser

开启无痕模式

关闭

Page

总结

Pyppeteer 还有其他很多功能,例如键盘事件、鼠标事件、对话框事件等,这里就不再一一赘述了。

更多内容可以参考官方文档 https://miyakogi.github.io/pyppeteer/reference.html 的案例说明。

本节我们凭借一些小案例介绍了 Pyppeteer 的基本用法,7.6 节将使用 Pyppeteer 完成一个爬取实例。