东莞列举网 > 商务服务 > 网站/软件服务 > 分享爬虫利器 Playwright
东莞
[切换城市]

分享爬虫利器 Playwright

更新时间:2022-06-21 10:45:44 浏览次数:46次
区域: 东莞 > 南城
类别:IDC服务
地址:南城高盛科技大厦
微软开源了一个项目叫「playwright-python」,作为一个兴起项目,出现后受到了大家热烈的欢迎,那它到底是什么样的存在呢?今天为你介绍一下这个传说中的小白神器。

Playwright 是针对 Python 语言的纯自动化工具,它可以通过单个API自动执行 Chromium,Firefox 和 WebKit 浏览器,连代码都不用写,就能实现自动化功能。
虽然测试工具 selenium 具有完备的文档,但是其学习成本让一众小白们望而却步,对比之下 playwright-python 简直是小白们的神器。

Playwright真的适用于Python吗?答案是肯定的,微软对于适用于Python的Playwright已准备就绪。可能会发生API重大更改。但大概率是这种情况不会发生,微软还表示仅在他们知道它可以改善您使用新库的体验时,才会可能这样做。不过微软也提醒尚不支持特定于供应商的API的某些极端情况,例如收集Chromium跟踪,覆盖率报告等。

一:介绍Playwright

Playwright是一个强大的Python库,仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作,并同时支持以无头模式、有头模式运行。

Playwright提供的自动化技术是绿色的、功能强大、可靠且快速,支持Linux、Mac以及Windows操作系统。

二:应用Playwright

Playwright的安装非常简单,两步解决:

A:安装Playwright依赖库,需要Python3.7+

B:安装Chromium、Firefox、WebKit等浏览器的驱动文件

安装playwright库

pip install playwright

安装浏览器驱动文件(安装过程稍微有点慢)

python -m playwright install

录制:使用Playwright无需写一行代码,我们只需手动操作浏览器,它会录制我们的操作,然后自动生成代码脚本。命令:命令行键入 --help 可看到所有选项

python -m playwright codegen

codegen的用法可以使用--help查看,如果简单使用就是直接在命令后面加上url链接,如果有其他需要可以添加options。

python -m playwright codegen --help

Usage: index codegen [options] [url]

open page and generate code for user actions

Options:

-o, --output <file name> saves the generated script to a file

--target <language> language to use, one of javascript, python, python-async, csharp

default: "python"

-h, --help display help for command

Examples:

$ codegen

$ codegen --target=python

$ -b webkit codegen https://ex***

options含义:1:-o:将录制的脚本保存到一个文件。2:--target:规定生成脚本的语言,有JS和Python两种,默认为Python。3:-b:指定浏览器驱动

比方:我要在http://***搜索,用chromium驱动,将结果保存为my.py的python文件。

python -m playwright codegen --target python -o 'my.py' -b chromium https://www.***

命令行输入后会自动打开浏览器,然后可以看见在浏览器上的一举一动都会被自动翻译成代码,结束后自动关闭浏览器,保存生成的自动化脚本到py文件。
还可以配合pytest插件一起使用,感兴趣可以自己试一下
文件过大明天分享剩余部分
东莞网站/软件服务相关信息
制造业网站建设
其他-常平
1天前 刷新
工厂网站建设
其他-常平
1天前 刷新
1天前 刷新
11月20日 刷新
东莞网站建设
其他-常平
8月7日 刷新
注册时间:2021年07月02日
UID:725737
---------- 认证信息 ----------
手机已认证
查看用户主页