深入解析:Playwright同步、异步、并行、串行执行效率比较

news/2025/10/4 9:12:46/文章来源:https://www.cnblogs.com/lxjshuju/p/19125299

一、源码展示

1.1串行同步.py

import time
from playwright.sync_api import sync_playwrightURL = "https://www.baidu.com"def do_one(page, keyword, is_first_run):t0 = time.perf_counter()# 优化1:首次运行才加载页面,后续复用页面if is_first_run:# 优化等待策略:DOM加载完成即可,无需等待全部资源page.goto(URL, wait_until='domcontentloaded')else:# 非首次运行:直接返回首页并清空搜索框(比重新goto更快)page.get_by_role("link", name="到百度首页").click()page.wait_for_selector('#chat-textarea', timeout=10000)# 输入搜索关键词page.fill('#chat-textarea', keyword)# 优化2:合并点击与导航等待,减少一次等待with page.expect_navigation(wait_until='domcontentloaded'):page.click('#chat-submit-button')# 优化3:用精准元素等待替代networkidlepage.wait_for_selector('#content_left', timeout=10000)cost = time.perf_counter() - t0return costdef main():t_all = time.perf_counter()with sync_playwright() as p:# 浏览器启动优化:添加参数加速t_launch = time.perf_counter()browser = p.chromium.launch(headless=True,args=['--disable-gpu','--disable-extensions','--no-sandbox','--disable-dev-shm-usage'])launch_cost = time.perf_counter() - t_launchpage = browser.new_page()# 保持串行执行,通过参数标记是否首次运行jay_cost = do_one(page, "周杰伦", is_first_run=True)kun_cost = do_one(page, "蔡徐坤", is_first_run=False)browser.close()total_biz = jay_cost + kun_costwall_clock = time.perf_counter() - t_allreturn launch_cost, total_biz, wall_clockif __name__ == '__main__':a,b,c=main()print(a+b+c)

1.2串行异步.py

import time
import asyncio
from playwright.async_api import async_playwrightURL = "https://www.baidu.com"async def do_one(page, keyword):t0 = time.perf_counter()# 修复:添加await关键字,正确调用异步方法window_obj = await page.evaluate("() => window")if "已初始化" not in window_obj:# 首次加载:使用domcontentloaded加快首屏加载await page.goto(URL, wait_until='domcontentloaded')# 标记为已初始化await page.evaluate("() => window['已初始化'] = true")else:# 非首次:直接清空搜索框,无需重新加载整个页面await page.fill('#chat-textarea', '')# 输入搜索关键词await page.fill('#chat-textarea', keyword)# 点击与导航等待合并async with page.expect_navigation(wait_until='domcontentloaded'):await page.click('#chat-submit-button')# 等待搜索结果区域出现await page.wait_for_selector('#content_left', timeout=10000)cost = time.perf_counter() - t0return costasync def main():async with async_playwright() as p:# 浏览器启动优化t_launch_0 = time.perf_counter()browser = await p.chromium.launch(headless=True,args=['--disable-gpu','--disable-extensions','--no-sandbox','--disable-dev-shm-usage'])launch_cost = time.perf_counter() - t_launch_0page = await browser.new_page()# 保持串行执行jay_cost = await do_one(page, "周杰伦")kun_cost = await do_one(page, "蔡徐坤")await browser.close()total_biz = jay_cost + kun_costwall_clock = launch_cost + total_bizreturn launch_cost, total_biz, wall_clockif __name__ == '__main__':a, b, c = asyncio.run(main())print(a+b+c)

1.3并行同步.py

import time
from playwright.sync_api import sync_playwright
from concurrent.futures import ThreadPoolExecutor
import threadingURL = "https://www.baidu.com"# 使用线程本地存储来隔离不同线程的Playwright实例
thread_local = threading.local()def init_playwright():"""为每个线程初始化独立的Playwright实例"""if not hasattr(thread_local, 'playwright'):thread_local.playwright = sync_playwright().start()return thread_local.playwrightdef do_work(keyword):# 每个线程使用自己的Playwright实例,避免线程冲突p = init_playwright()# 浏览器冷启动计时t_launch = time.perf_counter()browser = p.chromium.launch(headless=True,args=['--disable-gpu','--disable-extensions','--no-sandbox','--disable-setuid-sandbox','--disable-dev-shm-usage'])launch_cost = time.perf_counter() - t_launchpage = browser.new_page()t0 = time.perf_counter()# 优化页面加载策略page.goto(URL, wait_until='domcontentloaded')# 元素交互search_box = page.locator('#chat-textarea')search_box.fill(keyword)# 点击与导航等待合并with page.expect_navigation(wait_until='domcontentloaded'):page.click('#chat-submit-button')# 等待搜索结果区域出现page.wait_for_selector('#content_left', timeout=10000)biz_cost = time.perf_counter() - t0browser.close()return launch_cost, biz_costdef main():t_all = time.perf_counter()results = []# 定义线程清理函数def cleanup_thread_local():if hasattr(thread_local, 'playwright'):thread_local.playwright.stop()try:with ThreadPoolExecutor(max_workers=2) as pool:results = list(pool.map(do_work, ["周杰伦", "蔡徐坤"]))(launch1, biz1), (launch2, biz2) = resultslaunch_cost = launch1 + launch2total_biz = max(biz1, biz2)wall_clock = time.perf_counter() - t_allreturn launch_cost, total_biz, wall_clockfinally:# 确保所有线程的Playwright实例都被正确关闭cleanup_thread_local()if __name__ == '__main__':a, b, c = main()print(a+b+c)

1.4并行异步.py

import time
import asyncio
from playwright.async_api import async_playwrightURL = "https://www.baidu.com"async def do_one(page, keyword):t0 = time.perf_counter()# 优化导航等待策略,使用'domcontentloaded'可能比'load'更快await page.goto(URL, wait_until='domcontentloaded')# 直接使用选择器操作,减少可能的查找开销search_box = page.locator('#chat-textarea')await search_box.fill(keyword)# 点击搜索按钮,同时等待导航完成async with page.expect_navigation(wait_until='domcontentloaded'):await page.click('#chat-submit-button')# 可以根据实际情况调整等待策略,不一定需要networkidle# 例如等待某个特定元素出现await page.wait_for_selector('#content_left')cost = time.perf_counter() - t0return costasync def main():async with async_playwright() as p:# 浏览器启动优化:可以添加一些启动参数加速t_launch_0 = time.perf_counter()browser = await p.chromium.launch(headless=True,args=['--disable-gpu','--disable-extensions','--disable-dev-shm-usage','--no-sandbox','--disable-setuid-sandbox'])launch_cost = time.perf_counter() - t_launch_0# 优化:可以复用一个上下文而不是创建两个# 除非有特殊的隔离需求context = await browser.new_context()page1, page2 = await context.new_page(), await context.new_page()# 并行执行两个搜索任务biz_costs = await asyncio.gather(do_one(page1, "周杰伦"),do_one(page2, "蔡徐坤"))await browser.close()jay_cost, kun_cost = biz_coststotal_biz = max(biz_costs)wall_clock = launch_cost + total_bizreturn launch_cost, total_biz, wall_clockif __name__ == '__main__':a,b,c=asyncio.run(main())print(a+b+c)

1.5init.py

from .串行同步 import main as one
from .串行异步 import main as two
from .并行同步 import main as three
from .并行异步 import main as four

1.6compare.py

import asyncio
import matplotlib.pyplot as plt
from 同步异步 import one, two, three, fourdef out_pic():# 中文与负号plt.rcParams['font.sans-serif'] = ['SimHei']plt.rcParams['axes.unicode_minus'] = Falselabels = ['串行同步', '串行异步', '并行同步', '并行异步']# 收集数据launch_costs, total_biz, wall_clocks = [], [], []for func in (one, lambda :asyncio.run(two()), three, lambda :asyncio.run(four())):lc, tb, wc = func()launch_costs.append(lc)total_biz.append(tb)wall_clocks.append(wc)# 一个画布上画 3 个子图fig, axes = plt.subplots(1, 3, figsize=(15, 4), sharey=False)colors = ['skyblue', 'orange', 'lightgreen']titles = ['浏览器冷启动时间', '业务耗时对比', '总耗时对比']data_list = [launch_costs, total_biz, wall_clocks]for ax, data, title, color in zip(axes, data_list, titles, colors):ax.bar(labels, data, color=color)ax.set_title(title)ax.set_ylabel('秒')# 关键:先设刻度位置,再设标签ax.set_xticks(range(len(labels)))  # 固定刻度位置ax.set_xticklabels(labels, rotation=15, ha='right')plt.tight_layout()plt.show()if __name__ == '__main__':out_pic()

二、目录结构

三、运行结果

四、结论

理论上说,并行异步运行最快,实际运行可能有些许误差

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/926964.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎么用织梦做自己的网站苏州app开发

1 混合出版物 允许传统稿件提交或作者支付的开放获取(OA)稿件 2 长度 所有页面限制包括参考文献和作者简历。对于常规论文,接受稿件的最终版面设计完成后超出这些限制的页面,将收取强制性超长页面费用(MOPC&#xf…

详细介绍:异步日志系统

详细介绍:异步日志系统2025-10-04 09:03 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; fon…

Linux基础开发工具 --- vim - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025十一集训——Day2模拟赛

赛时: 四个题都很可做的样子, T3好像是原??? OK T1 简单二分,切了。 调 lowerbound 那里 +-1 的细节,8:50 成功过掉大样例。 开 T2。 9:00,想到差分。 诶T2咋是原,就一黄f**k.本文来自博客园,作者:zhangxia…

完整教程:ARM Cortex-M:内存保护单元 (MPU) 发布

完整教程:ARM Cortex-M:内存保护单元 (MPU) 发布pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas"…

【Clion】【文件编码】Clion内置控制台中文字体乱码的解决方案及编码格式调整

View Post【Clion】【文件编码】Clion内置控制台中文字体乱码的解决方案及编码格式调整Clion内置控制台中文字体乱码的解决方案及编码格式调整一、问题描述 在使用Clion时,在保证文件编码,项目编码,属性文件的默认编…

完整教程:JavaWeb零基础学习Day1——HTMLCSS

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

淘宝联盟网站建设源码网站服务器租赁合同

疑问:Mysql多事务默认情况下,同时修改同一条记录运行修改吗?是否要手动加上for update行锁。 猜想:MySQL 会自动对涉及的数据行加上写锁(排他锁),以确保数据的一致性和隔离性。这是在默认的事务…

2025十一集训——Day模拟赛

赛时: 四个题都很可做的样子, T3好像是原??? OK T1 简单二分,切了。 调 lowerbound 那里 +-1 的细节,8:50 成功过掉大样例。 开 T2。本文来自博客园,作者:zhangxiao666,转载请注明原文链接:https://www.cnb…

Qt纯代码实现智能安防集中管理平台/楼宇对讲管理系统/门禁管理/视频监控

一、前言说明 这个项目很多年前就完成的,属于一个定制的项目,最初做的事楼宇对讲相关的功能,后面陆续增加了门禁和视频监控,这些模块加起来,慢慢的形成了一个智能安防集中管理平台的模样,但是确切的说又不够标准…

在织梦网站做静态网页伦敦做网站

文章目录 一、Hazelcast简介1、Hazelcast概述2、Hazelcast之IMDG3、数据分区 二、Hazelcast配置1、maven坐标2、集群搭建(1)组播自动搭建 3、客户端4、集群分组5、其他配置 三、Hazelcast分布式数据结构1、IMap2、IQueue:队列3、MultiMap4、I…

长沙做网站推广代理记账公司注册需要什么条件

📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言 人工智能(AI)已经成为当今世界最具革命性的技术之一,它正在深刻改变各个行业&#x…

网站流量提升方法vps搭建asp网站

八爪鱼,被动收入,财务自由,现金流,现金流游戏,各银行利率,money,资产负债表,财务自由,资产管理,个人理财,管理个人资产,理财,打造被动收入,躺着赚钱,让钱为我打工

汉文博士词典库源文件已在 github 开放

无版权问题的词典源文件已从城通网盘转存至 Github: https://github.com/wmjordan/Hanbox.Dict 部分词典的编译配置文件需使用汉文博士 7.0 或更新的版本编译。

网站自己怎么制作做网站用asp还是php

3.1 表达式和语句 表达式一共分为三种: (1)变量或常量 运算符构成的计算表达式 (2)new 表达式,结果是一个数组或类的对象。(后面讲) (3)方法调用表达式&…

梧州市建设局网站数据来源网站怎么做脚注

问题描述: 我的团队一直在处理一个包含基于标准库的 SD 卡的项目。最近我们决定迁移到 HAL 并开始了。 幸运的是,我们项目的所有部分都尽可能地更改为 HAL,它们运行良好,但我们不知道为什么 SD 卡不能正常运行。 我们没有更改外设的配置时钟&…

读人形机器人30未来20年

读人形机器人30未来20年1. 长期技术可能性 1.1. AI与认知计算的进步1.1.1. 人形机器人进化的核心在于AI和认知计算的进步1.1.2. 未来的机器人将拥有比现今复杂得多的AI系统,能够进行细致入微的理解、基于情境的推理和…

Flutter + Ollama:开启本地AI的全平台新纪元 —— 从零剖析一款现代化AI客户端的技能奥秘

Flutter + Ollama:开启本地AI的全平台新纪元 —— 从零剖析一款现代化AI客户端的技能奥秘pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !importa…

wordpress站点改名推广方案框架

from: https://blog.csdn.net/dcrmg/article/details/52851913工业相机基础知识(一) CCD与CMOS 工业相机按照图像的传感器元件的不同分为CCD(Charge Coupled Device,电荷耦合元件)和CMOS(金属氧化物半导体元件&#xf…