Selenium python+selenium 方法大全

测试人生路 · 2021年01月19日 · 最后由 朱远远 回复于 2022年05月09日 · 6027 次阅读

一、selenium 定位方法

1、WebDriver8 种基本元素定位方式

1)find_element_by_id() 根据 id 属性进行定位

2)find_element_by_name() 根据 name 元素进行定位

3)find_element_by_class_name() 根据 class 的名字进行定位

4)find_element_by_xpath() xpath 是 XML 路径语言,它可以用来确定 xml 文档中的元素位置,通过元素的路径来完成对元素的查找

5)find_element_by_css_selector() CSS 属性定位可以比较灵活地选择控件的任意属性,定位方式也会比 xpath 快

6)find_element_by_tag_name() 根据标签名进行定位

7)find_element_by_link_text() 根据完整的超链接文字进行定位

8)find_element_by_partial_link_text() 根据部分超链接文字进行定位

2、By 定位

by 定位需要需要导入 By 类:from selenium.webdriver.common.by import By

find_element(By.ID,"")
find_element(By.NAME,"")
find_element(By.CLASS_NAME,"")
find_element(By.TAG_NAME,"")
find_element(By.LINK_TEXT,u" ")
find_element(By.PARTIAL_LINK_TEXT,u" ")
find_element(By.XPATH,"")
find_element(By.CSS_SELECTOR,"")

3、elements 复数定位

八种基础的定位方法都有对应的复数形式

id 复数定位 find_elements_by_id()
name 复数定位 find_elements_by_name()
class 复数定位 find_elements_by_class_name()
tag 复数定位 find_elements_by_tag_name()
link 复数定位 find_elements_by_link_text()
partial_link 复数定位 find_elements_by_partial_link_text()
xpath 复数定位 find_elements_by_xpath()
css 复数定位 find_elements_by_css_selector()

4、JS 的 5 种定位方式

id 定位:document.getElementById()
name 定位:document.getElementsByName()
tag 定位:document.getElementsByTagName()
class 定位:document.getElementsByClassName()
css 定位:document.querySelectorAll()

二、其他 selenium 操作

1、常用库导入
1)from selenium import webdriver 导入 webdriver 模块

2)from selenium.webdriver import ActionChains 导入动作链类,动作链可以储存鼠标的动作,并一起执行

3)from selenium.webdriver.common.key import Key 键盘操作使用的是 Keys 类,一般配合 send_keys 使用

4)from selenium.webdriver.support.select import Select 下拉框的操作都交由 Select 类进行处理

5)from selenium.webdriver.common.by import By

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC 显示等待使用的类

2、基本操作

1)浏览器相关操作

创建浏览器对象  driver = webdriver.xxx()

窗口最大化    maximize_window()

获取浏览器尺寸  get_window_size()

设置浏览器尺寸  set_window_size()

获取浏览器位置  get_window_position()

设置浏览器位置  set_window_position(x,y)

关闭当前标签/窗口 close()

关闭所有标签/窗口  quit()

2)页面相关操作

请求某个 url      driver.get(url)

刷新页面操作     refresh()

回退到之前的页面   back()

前进到之后的页面   forward()

获取当前访问页面 url  current_url

获取当前浏览器标题  title

保存图片       get_screenshot_as_png()/get_screenshot_as_file(file)

网页源码       page_source

3、元素的操作

点击操作    element.click()

清空输入框   element.clear()

输入框输入数据 element.send_keys(data)

获取文本内容 (既开闭标签之间的内容)  element.text

获取属性值 (获取 element 元素的 value 属性的值)  element.get_attribute(value)

4、鼠标和键盘操作

鼠标操作需要导入类,见第一部分,然后创建对象 ActionChains(driver),键盘操作导入类

鼠标右击
el = driver.find_element_by_xxx(value)
context_click(el)

鼠标双击
el = driver.find_element_by_xxx(value)
ActionChains(driver).double_click(el).perform()

鼠标悬停
el = driver.find_element_by_xxx(value)
ActionChains(driver).move_to_element(el).perform()

常用键盘操作
send_keys(Keys.BACK_SPACE) 删除键(BackSpace)

send_keys(Keys.SPACE) 空格键 (Space)

send_keys(Keys.TAB) 制表键 (Tab)

send_keys(Keys.ESCAPE) 回退键(Esc)

send_keys(Keys.ENTER) 回车键(Enter)

send_keys(Keys.CONTROL,‘a’) 全选(Ctrl+A)

send_keys(Keys.CONTROL,‘c’) 复制(Ctrl+C)

send_keys(Keys.CONTROL,‘x’) 剪切(Ctrl+X)

send_keys(Keys.CONTROL,‘v’) 粘贴(Ctrl+V)

5、弹出框操作

进入到弹出框中  driver.switch_to.alert()

接收警告     accept()

关闭警告     dismiss()

发送文本到警告框 send_keys(data)

6、下拉框操作

将定位到的下拉框元素传入 Select 类中  selobj = Select(element)

通过索引选择,index 索引从 0 开始  select_by_index()

通过值选择 (option 标签的一个属性值)  select_by_value()

通过文本选择 (下拉框的值)  select_by_visible_text()

查看所有已选  all_selected_options

查看第一个已选  first_selected_option

查看是否是多选  is_multiple

查看选项元素列表  options

取消选择   deselect_by_index() /deselect_by_value()/ deselect_by_visible_text()

7、滚动条操作

js = "window.scrollTo(x,y) " x 为水平拖动距离,y 为垂直拖动举例

driver.execute_script(js)

js= “var q=document.documentElement.scrollTop=n” n 为从顶部往下移动滚动举例

driver.execute_script(js)

8、cookies 操作

获取所有 cookies  get_cookies()

获取 key 对应的值  get_cookie(key)

设置 cookies  add_cookie(cookie_dict)

删除指定名称的 cookie  delete_cookie(name)

删除所有 cookie  delete_all_cookies()

9、多标签/多窗口、多表单/多框架切换

多表单/多框架切换

直接使用 id 值切换进表单   driver.switch_to.frame(value)

定位到表单元素,再切换进入

el = driver.find_element_by_xxx(value)

driver.switch_to.frame(el)

跳回最外层的页面  driver.switch_to.default_content()

跳回上层的页面  driver.switch_to.parent_frame()

多标签/多窗口之间的切换

获取所有窗口的句柄   handles = driver.window_handlers

通过窗口的句柄进入的窗口  driver.switch_to.window(handles[n])

共收到 4 条回复 时间 点赞

支持一下

现在有一个爬虫问题,不知能不能解决。链接点击前这样http://112.112.113.114/dwjsGlhAction! addGsjsjView.action
点击后这样http://112.112.113.114/dwjsGlhAction! addGsjsjView.action?pTabid=show_gzlj&_:171962728655555怎样获得点击后问号后的字符串。望一起探讨。暂时没有发帖权限。

seleniumer 回复

以问号分割,拿索引为 1 的值

整理的非常棒

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册