【第一部分】开篇:先认识 Xpath 的 4 种定位方法


跟你说,你总是靠那个 firebug,chrome 的 F12 啥的右击复制 xpath 绝对总有一天踩着地雷炸的你死活定位不到,这个时候就需要自己学会动手写 xpath,人脑总比电脑聪明,开始把 xpath 语法给我学起来!


第 1 种方法:通过绝对路径做定位(相信大家不会使用这种方式)

By.xpath("html/body/div/form/input")

By.xpath("//input")


第 2 种方法:通过元素索引定位

By.xpath("//input[4]")


第 3 种方法:使用 xpath 属性定位

By.xpath("//input[@id='kw1']")

By.xpath("//input[@type='name' and @name='kw1']")


第 4 种方法:使用部分属性值匹配(最强大的方法)

By.xpath("//input[starts-with(@id,'nice')

By.xpath("//input[ends-with(@id,'很漂亮')

By.xpath("//input[contains(@id,'那么美')]")


【说明】

starts-with 顾名思义,匹配一个属性开始位置的关键字。

contains 匹配一个属性值中包含的字符串。

text()匹配的是显示文本信息,此处也可以用来做定位用。


【举例】

//input[starts-with(@name,'name1')]     查找 name 属性中开始位置包含'name1'关键字的页面元素

//input[contains(@name,'na')]         查找 name 属性中包含 na 关键字的页面元素

<a href="http://www.baidu.com">百度搜索</a>,那么xpath 写法为 //a[text()='百度搜索']     或者    //a[contains(text(),"百度搜索")]



【第二部分】我一位同事在使用 selenium 定位的时候踩到的坑

上次我有一个同事,定位元素的时候,用火狐浏览器 firebug 工具,定位到这个 HTML 代码:

<span onlick="88_da_33_699999_x64_3.01.3730.spkg" name="delete" />  大约是这样,死活定位不到,然后用到了 xpath 属性的并列关系,and 关键字,才定位的到。


//*[contains(@onclick, 'x64_3.01.3730.spkg') and @name='delete']


【第三部分】切换 iframe 时遇到的几个鬼

(1)在切换 ifame 的时候,有时 iframe 是含有 id 的,就可以直接定位使用,但是当 iframe 没有 id 信息的时候,如下图,



当然实际情况中会遇到没有 id 属性和 name 属性为空的情况,这时候就需要先定位 iframe 元素对象,这里可以通过 tag 先定位到,也能达到同样效果。

如下代码:

iframe = driver.find_element_by_tag_name("iframe")

driver.switch_to_frame(iframe)

切换完了之后,就可以去正常定位 iframe 里面的元素,driver.find_element_by_tagname(table) 之类的,同时也可以用 xpath 的方式:例如 Xpath=//*[contains(@src, 'sysmanage/systemupgrade.action')] 之类的。


(2)如果有多个 iframe 标签,那你就要看看总共有 iframe 标签了,看看你所定位的 iframe 是数组中的第几个 iframe 元素(从 0 开始数起,基于JavaScript的),可以用 chrome 浏览器的 F12 的控制台(Console)就可以输入 document.getElementsByTagName('iframe').length 这句代码,即可打印出 iframe 的长度(也就是个数),然后按照从 0 开始数起。


【下面这张图片可能有点大,看不到最右边的 Console,右击图片->新窗口打开】




(3)当 iframe 上的操作完后,想重新回到主页面上操作元素,这时候,就可以用 switch_to_default_content() 方法返回到主页面。

如下代码:

iframe = driver.find_element_by_tag_name("iframe")

driver.switch_to_frame(iframe)

switch_to_default_content()


(4)如何判断元素是否在 iframe 上?
1.定位到元素后,切换到 firepath 界面。
2.看 firebug 工具左上角,如果显示 Top Window 说明没有 iframe。
3.如果显示 iframe#xxx 这样的,说明在 iframe 上,# 后面就是它的 id。


【第四部分】selenium 用javascript定位


因为 selenium 的内核引擎就是用 JavaScript 来驱动的,所以只要 selenium 自带的那些原始辣鸡方法出现定位不了的、点击不了的并发症一旦发作,就可以使用 JavaScript 大绝招,除了 JavaScript,还有jQuery大绝招,一个个来,你阵亡了,他来替补,滔滔江水永不休。


一、以下总结了 5 种js定位的方法
除了 id 是定位到的是单个 element 元素对象,其它的都是 elements 返回的是 list 对象
1.通过 id 获取
document.getElementById(“id”)
2.通过 name 获取

 document.getElementsByName(“Name”)
返回的是 list
3.通过标签名选取元素
document.getElementsByTagName(“tag”)
4.通过 CLASS 类选取元素
document.getElementsByClassName(“class”)
兼容性:IE8 及其以下版本的浏览器未实现 getElementsByClassName 方法
5.通过 CSS 选择器选取元素
document.querySelectorAll(“css selector")
兼容性:IE8 及其以下版本的浏览器只支持 CSS2 标准的选择器语法


【举例代码】

js = 'document.getElementById("helloId").click();'

driver.execute_script(js)


js1 = 'document.getElementsByClassName("helloName")[0].value = "王大明";'   //整个 HTML 文档里第一个使用 CSS 样式类的 class="helloName"属性,它的 value 属性的值设置为 “王大明”

driver.execute_script(js1)


【第五部分】selenium 用jquery定位【简直逆天,老天爷都惊呆了,眼睛瞪的滚圆】


JQuery 是 2006 年 1 月诞生的一个基于封装 JavaScript 的框架,你经常看到的美元符号带上一个圆括号 $('XXX'),其实就是 document.getElementBy 什么什么的这个 js 方法,至于 XXX 前面带.的话,就是document.getElementByClass,带 # 的话,就是document.getElementById。



 【看不清图,右键新窗口打开图片】

1.Id

inputTest="$('#smart_input').val('帅气的我还能再削')"

driver.execute_script(inputTest)

2.Class

inputTest="$('.usersearch').val('帅气的我还能再削')"

3. Type

inputTest="$(':text').val('帅气的我还能再削')"


4. 层级

inputTest="$('#searchForm>#smart_input').val('帅气的我还能再削')"

inputTest="$('#searchForm #smart_input ').val('帅气的我还能再削')"  【注意两个 id 选择器 “#searchForm #smart_input” 中间是一个空格】

inputTest="$('#searchForm>input:first').val('帅气的我还能再削')"

选择最后一个input 元素:

clickbutton="$('#searchForm>input:last').click()"

选择第几个input 元素

inputTest="$('#searchForm>input:eq(0)').val('帅气的我还能再削')"    从 0 开始算第一个

inputTest="$('#searchForm>input:nth-child(1)').val('帅气的我还能再削')"   当然也可以这样,nth-child 从 1 开始算第一个

知识链接:

1、nth-child(N):下标从 1 开始;eq(N):下标从 0 开始;

2、nth-child(N):选择多个元素;eq(N):选择一个元素。


 

5. 其他

#inputTest="$('input[name=query]').val('帅气的我还能再削')"

inputTest="$('input[id=smart_input]').val('帅气的我还能再削')"


-------------------------------------------------------------------------------------------------------------------------------



【附录 1】xpath 的语法使用基础

Xpath 的使用方法:

 例子 1:html/body/div[1]/div[2](如果不熟悉 html 的朋友们,需要自行百度 html。)

   该 xpath 表示 : 在 html 标签下 -> body 标签下 -> 第一个 div 标签下 -> 第二个 div 标签

  很好理解,继续

 

 例子 2:.//*[@id='content']/div[2]/ul

   这样会有人不理解了 .//*[@id='content'] 到底是什么意思呢?

    . 代表当前路径

    a//b 表示:在 a 标签下的子孙辈 b 标签

    * 可以是任何标签

    [@id='content'] 表示是 id 为 content

  所以:这个例子的意思是: id 为 content 的任何子标签下面 -> 第二个 div 标签下 -> ul 标签

  

Xpath 基础学习完毕,接下来开始进阶学习

  //p[text()='a']  :文本为 a 的 p 标签

  //p[text()='a']  : 文本包含 a 的 p 标签

  //a[@class='abc']   :class 为 a 的 p 标签 (当然咯。既然可以为 @class 就一定能用 @id ,为什么不联想下 @src@href呢?)

  //p[not(@class='a')]   :class 不为 a 的 p 标签

 

好了,进阶完毕,如果要使用更高阶的 Xpath 要先属性以上内容,然后联合 Selenium 使用

 

Xpath 和其他定位方式的比较:(主要是和 CSS 定位的对比)

  Xpath 的最大好处是能向上查找,不过缺点是速度过慢。


【附录 2】CSS 定位语法基础


CSS 定位速度快,功能多,但是不能向上查找,比 xpath 好用,执行效率比 xpath 来的快,曾经做过两种定位比较的测速,是本人认为最好用的定位方式。   大致用法总结:  下面都是精华哦
1、*:checked  选中 * 的 checked 元素
2、 li.refined.list.group.item(如果 class 中间有空格,可以.+.+.全写也可以只写任意一个)
    .checkbox[type^='check'][onclick*='Bebe'][checked$='ed'] +a
    (开头^=   包含 *=   结尾 $= )+a 是选中同级的后面的 a 3、 li a        :选中 li 标签的后代 a 5、 li>a       :选中 li 标签的子元素 a 4、 li,a        :选中 li 和 a 5、 li +a      :选中 li 同级的 下一个 a 6、 li ~a       :选中 li 同级的 下面所有的 a 7、 li>a:last-child  /  li>a:last-of-type  : 选中 li 下最后面一个 a 8、 li:not([class*='_'])    : li 中的 calss 不含 '_'        li:not(:nth-of-type(1))    : 不含第一个 li 的所有 li 9、 li>a:nth-child(n)   /  li>a:nth-of-type(n) :选中 li 下第 n 个 a       li>a:nth-last-child(n)   /  li>a:nth-last-of-type(n):选中 li 下,倒数第 n 个 a     如果 n = odd 表示奇数     如果 n = even 表示偶数
div h2:nth-child(n) : 当 div 的第 n 个子元素是 h2 的时候 div h2:nth-of-type(n):   div 下第 n 个 h2 子元素 10、 div[style]     : div 中包含 属性 style  11、 li>a:only-child      :li 下只有 1 个 a 的 a 标签

感谢这两位博主的三篇文章作为参考:

http://blog.csdn.NET/duff2016/article/details/54572718

http://www.cnblogs.com/zhongmeizhi/p/6296213.html

http://www.cnblogs.com/zhongmeizhi/p/6296266.html

最后感谢师傅悠悠的启蒙!


↙↙↙阅读原文可查看相关链接,并与作者交流