TA的每日心情 | 无聊 4 小时前 |
---|
签到天数: 528 天 连续签到: 1 天 [LV.9]测试副司令
|
本帖最后由 测试积点老人 于 2018-12-5 16:51 编辑
Selenium对网页的控制是基于各种前端元素的,在使用过程中,对于元素的定位是基础,只有准去抓取到对应元素才能进行后续的自动化控制,我在这里将对各种元素定位方式进行总结归纳一下。
WebDriver几种基本元素定位方式
find_element_by_id()
采用id属性进行定位。例如在百度页面中输入关键字 Selenium 进行搜索。百度部分关键源码如下:
- <span class="bg s_ipt_wr quickdelete-wrap">
- <span class="soutu-btn"></span>
- <input id="kw" class="s_ipt" autocomplete="off" maxlength="255" value="" name="wd">
- <a id="quickdelete" class="quickdelete" href="javascript:;" title="清空" style="top: 0px; right: 0px; display: none;"></a>
- </span>
- <span class="bg s_btn_wr">
- <input id="su" class="bg s_btn" type="submit" value="百度一下">
复制代码 可以看到输入框和百度一下的按钮都有id,那么定位代码如下:
- #coding=utf-8
- from selenium import webdriver
- import time
- from selenium.webdriver.common.by import By
-
- driver = webdriver.Chrome()
- driver.implicitly_wait(10)
- driver.get("http://www.baidu.com")
-
- driver.find_element_by_id("kw").send_keys("Selenium")
- driver.find_element_by_id("su").click()
-
- time.sleep(2)
- driver.quit()
复制代码 find_element_by_name()
find_element_by_class_name()
根据name元素和class的名字进行定位,这两种定位方式和id定位相似,在前端代码中,id、name和class一般都至少会有其中的一种,比如百度的搜索框具有name属性,我们可以用name定位搜索款,class定位百度一下的按钮:
- driver.find_element_by_name("wd").send_keys("Python")
- driver.find_element_by_class_name("s_btn").click()
复制代码 find_element_by_xpath()
xpath是XML路径语言,它可以用来确定xml文档中的元素位置,通过元素的路径来完成对元素的查找。HTML就是XML的一种实现方式,所以xpath是一种非常强大的定位方式。
xpath也分几种不同类型的定位方法。
一种是绝对路径定位。这种定位方式是利用html标签名的层级关系来定位元素的绝对路径,一般从<html>标签开始依次往下进行查找。
如百度搜索框的绝对路径xpath定位可以是这样的:
find_element_by_xpath("/html/body/div[1]/div[1]/div/div[1]/div/form/span[1]/input")
还有一种是利用元素属性来进行xpath定位,搜索框还可以利用id和name属性去定位:
find_element_by_xpath("//input[@id='kw']")
find_element_by_xpath("//*[@name='wd']")
其中的标签名input也可以用*来代替,而且只要是在该标签内,任意属性都可以,比如搜索框的maxlength属性:
find_element_by_xpath("//input[@maxlength='255']")
有的时候我们会发现绝对路径定位路径太长,而且光凭路径完全不可以猜测到其指向的具体页面元素,如果只有单纯的元素属性不一定可以每次查找的元素都可以又唯一的属性去方便定位,这个时候我们可以将这两种定位方式结合起来使用。
比如查找搜索框的时候发现其上级元素form又唯一的id方便定位,就可以先查找到form元素然后依次往下写路径:
find_element_by_xpath("//form[@id='form']/span/input")
这种定位方式的使用过程中,如果元素的单个属性无法确定其唯一性,可以用and连接多个属性去确定。
find_element_by_css_selector()
CSS属性定位可以比较灵活地选择控件的任意属性,定位方式也会比xpath快。
同样是那个百度搜索的例子,可以试一下:
- driver.find_element_by_css_selector(".s_ipt").send_keys("selenium")
- driver.find_element_by_css_selector("#su").click()
复制代码 find_element_by_tag_name ()
通过标签名去定位的方式一般是这样的:find_element_by_tag_name("input")
可见仅仅通过标签名去定位时,一般一种标签在一个页面里面会出现不止一次甚至大量出现,这种定位方式的作用不是很大,所以用的也就比较少。
find_element_by_link_text()
find_element_by_partial_link_text()
这两种定位方式是专门用于定位超链接的,也就是对应html页面中的<a>标签,括号里传的值就是a标签中的超链接文字,两者的区别在于一个是完整的超链接文字,一个是可以只写部分超链接文字。
比如点击百度首页中右上角的新闻超链接,可以这样去定位:
driver.find_element_by_link_text("新闻").click()
driver.find_element_by_partial_link_text("闻").click()
By定位
通过对上面8种基本元素定位方式的学习,在使用过程种可以根据实际的情况去选择对应的的定位方式,我们可以用By来设置定位策略,具体语法如下:
find_element(By.ID,"kw")
find_element(By.NAME,"wd")
find_element(By.CLASS_NAME,"s_ipt")
find_element(By.TAG_NAME,"input")
find_element(By.LINK_TEXT,u"新闻")
find_element(By.PARTIAL_LINK_TEXT,u"新")
find_element(By.XPATH,"//*[@class='bg s_btn']")
find_element(By.CSS_SELECTOR,"span.bg s_btn_wr>input#su")
上面这些使用的前提是需要导入By类:from selenium.webdriver.common.by import By
|
|