51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 1063|回复: 1
打印 上一主题 下一主题

Python爬虫使用Selenium控制浏览器进行搜索操作

[复制链接]
  • TA的每日心情
    擦汗
    昨天 09:05
  • 签到天数: 1048 天

    连续签到: 1 天

    [LV.10]测试总司令

    跳转到指定楼层
    1#
    发表于 2021-11-18 13:39:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    首先需要安装selenium:
      第一种:可以自己下载selenium tar.gz包,下载到python目录下:解压到当前文件夹。
    在cmd命令行:进入到解压包中,进行安装。安装完成之后,如果是eclipse中,请 clean project之后,pydev才能识别新安装的包。

     第二种: 可以直接使用在命令窗口: pip install selenium进行安装。
      使用selenium模拟浏览器登录时,需要下载对应浏览器的内核:
      将chromedriver,放在chorme.exe启动的相同位置。


    python代码:
    1. # -*- coding:utf-8 -*-
    2.   from selenium import webdriver
    3.   import os
    4.   #引入chromedriver.exe
    5.   chromedriver="C:/Program Files (x86)/Google/Chrome/Application/chromedriver.exe"
    6.   os.environ["webdriver.chrome.driver"] = chromedriver
    7.   browser = webdriver.Chrome(chromedriver)
    8.   #设置浏览器需要打开的url
    9.   url = "www.baidu.com/"
    10.   browser.get(url)
    11.   #在百度搜索框中输入关键字"python"
    12.   browser.find_element_by_id("kw").send_keys("python")
    13.   #单击搜索按钮
    14.   browser.find_element_by_id("su").click()
    15.   #关闭浏览器
    16.   #browser.quit()
    复制代码
    以上是使用selenium进行模拟浏览器登录,需要打开浏览器,其实可以增加无头参数,不启动浏览器进行爬取操作。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?(注-册)加入51Testing

    x
    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

  • TA的每日心情

    2024-5-20 21:29
  • 签到天数: 996 天

    连续签到: 1 天

    [LV.10]测试总司令

    2#
    发表于 2021-11-18 15:02:46 | 只看该作者
    我经常这么干
    回复 支持 反对

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-11-19 08:50 , Processed in 0.065211 second(s), 24 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表