Selenium、Pyppeteer使用后感受
一直用Selenium进行浏览器相关的操作,总感觉效率不高,使用过程比较慢,于是换Pyppeteer来实现,经过两天的折腾,最后还是放弃了Pyppeteer,原因如下:1、Pyppeteer初次使用下载Chromium极其慢
这对用户来说肯定是无法接受的,第一次下载就要半天才配置完成,不具备实用性。
虽然有通过修改源的解决办法,但程序打包后分发给用户这就是隐患
2、Pyppeteer设置的参数默认启用Chromium的下载文件夹进而有效,时而无效,根本没有Selenium稳定
file_path = '/tmp/文件名'
page = await browser.newPage()
cdp = await page.target.createCDPSession()
await cdp.send('Page.setDownloadBehavior', {'behavior': 'allow', 'downloadPath': file_path})
Pyppeteer这段默认下载文件夹时而有效,大部分时间是无效的。
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
chrome_options.add_experimental_option('excludeSwitches', ['enable-logging'])
chrome_options.add_argument('--log-level=3')
chrome_bin_local = os.getcwd() + "\\Chrome-bin\\chrome.exe"
chrome_options.binary_location = chrome_bin_local
prefs_chrome = {'profile.default_content_setting_values.automatic_downloads': 1,
'download.default_directory': os.getcwd() + "\\downfile\\"}
chrome_options.add_experimental_option('prefs', prefs_chrome)
chrome_Drv = webdriver.Chrome(options=chrome_options)
而Selenium这段代码绝不会出问题,这是实践检验了的,几个项目中都正常。问题就是速度慢,从获取链接到下载下来,基本上要20多秒,但稳定压倒一切。Selenium还可设置默认本地浏览器位置,解决了chrome与webdriver的版本匹配问题。
总结,如果是做产品,还是建议用Selenium,稳定第一位。一家之言,供大家参考了。
页:
[1]