python3+selenium4自动化测试-元素定位之find_element()实战技巧篇

妞妞牛波

1. 为什么find_element()是自动化测试的基石

刚开始接触Selenium自动化测试时，我总以为写脚本就是模拟人工操作。直到在实际项目中踩了坑才发现，元素定位才是整个自动化测试过程中最核心、最容易出问题的环节。想象一下，你让一个盲人去点击页面按钮，如果连按钮位置都描述不清楚，后续所有操作都是空谈。

find_element()方法就是帮我们解决这个"描述位置"问题的。我在电商项目中做过统计，约70%的自动化测试失败案例都是由于元素定位不稳定导致的。比如有个商品价格元素，开发同学今天用price作为ID，明天可能就改成product-price，如果不掌握灵活的定位策略，脚本就得天天跟着改。

这里分享个真实案例：我们需要抓取某新闻网站的实时热搜，但发现他们每次刷新页面时，热搜列表的div元素ID都会带随机后缀（像hot-list-5a3d2这种）。最初用ID定位的脚本平均运行3次就会失败，后来改用XPath结合contains语法才彻底解决。

2. 八大定位策略的实战进阶技巧

2.1 ID/NAME定位的防坑指南

虽然文档都说ID定位最可靠，但实际项目中我遇到更多的是这些情况：

动态生成的ID（如btn-submit-238492）
重复使用的ID（老项目特别常见）
根本没有ID属性

这时可以试试find_element(By.NAME, 'wd')，但要注意：

表单元素才可能有name属性
某些框架会自动添加data-testid这类属性
遇到iframe时需要先切换上下文

python复制# 实战中更健壮的写法
try:
    element = driver.find_element(By.ID, 'kw')
except NoSuchElementException:
    element = driver.find_element(By.NAME, 'wd')

2.2 CLASS定位的隐藏陷阱

新手最容易栽在复合class上。比如遇到class="btn primary large"时：

错误写法：find_element(By.CLASS_NAME, 'btn primary large')
正确姿势：任选其中一个独立class

我常用的技巧是配合CSS选择器：

python复制# 选择同时具有btn和primary类的元素
driver.find_element(By.CSS_SELECTOR, '.btn.primary')

2.3 链接文本定位的妙用

在测试后台管理系统时，发现个有趣现象：虽然按钮样式经常改，但文字提示通常很稳定。比如"保存草稿"按钮，用LINK_TEXT定位比用CLASS稳定得多：

python复制# 精确匹配
save_btn = driver.find_element(By.LINK_TEXT, "保存草稿")

# 模糊匹配（包含"保存"即可）
save_btn = driver.find_element(By.PARTIAL_LINK_TEXT, "保存")

注意：有些网站会用CSS隐藏文字，实际显示的是伪元素内容，这种情况需要改用其他定位方式

3. 应对动态元素的组合拳

3.1 CSS选择器的进阶玩法

当元素没有明显特征时，CSS选择器就像瑞士军刀。分享几个实战中高频使用的模式：

python复制# 属性包含特定值
driver.find_element(By.CSS_SELECTOR, '[id*="search"]')

# 属性以特定值开头
driver.find_element(By.CSS_SELECTOR, '[class^="btn-"]')

# 父子关系定位
driver.find_element(By.CSS_SELECTOR, 'ul.nav > li.active')

# 排除特定元素
driver.find_element(By.CSS_SELECTOR, 'input:not([disabled])')

最近在测试一个React项目时，发现元素经常带data-testid属性，这种用CSS定位特别方便：

python复制driver.find_element(By.CSS_SELECTOR, '[data-testid="submit-button"]')

3.2 XPath的精准打击

虽然官方说XPath性能较差，但在处理复杂结构时它无可替代。比如需要定位表格中"价格大于100"的那行：

python复制# 找到包含"立即购买"按钮的行
row = driver.find_element(By.XPATH, '//tr[.//button[contains(text(),"购买")]]')

# 定位同级相邻元素
next_btn = driver.find_element(By.XPATH, '//input[@id="username"]/following-sibling::button')

有个项目需要抓取商品详情，发现价格元素总是在商品名称元素的下一个div中，用XPath的following轴轻松解决：

python复制price = driver.find_element(By.XPATH, '//h3[contains(text(),"商品名称")]/following::div[1]')

4. 实战中的疑难杂症解决方案

4.1 处理iframe嵌套

第一次遇到iframe时我完全懵了，明明元素就在眼前却定位不到。后来才明白需要先切换上下文：

python复制# 切换到iframe内部
iframe = driver.find_element(By.TAG_NAME, 'iframe')
driver.switch_to.frame(iframe)

# 操作iframe内的元素
iframe_content = driver.find_element(By.ID, 'content')

# 记得切回主文档
driver.switch_to.default_content()

4.2 等待策略的黄金组合

元素定位失败经常是因为加载延迟。我的最佳实践是显式等待配合自定义条件：

python复制from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 等待元素可点击
element = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.XPATH, "//button[contains(@class,'submit')]"))
)

# 自定义等待条件
def has_class(element, class_name):
    def _predicate(driver):
        return class_name in driver.find_element(*element).get_attribute("class")
    return _predicate

WebDriverWait(driver, 10).until(has_class((By.ID, "status"), "active"))

4.3 阴影DOM的破解之道

现代前端框架大量使用阴影DOM，常规定位方法会失效。这时需要借助JavaScript执行：

python复制# 获取阴影根节点
shadow_host = driver.find_element(By.CSS_SELECTOR, '#shadow-host')
shadow_root = driver.execute_script('return arguments[0].shadowRoot', shadow_host)

# 在阴影DOM中查找元素
shadow_element = shadow_root.find_element(By.CSS_SELECTOR, '.inner-element')

5. 元素定位的性能优化

在大规模测试中发现，定位方式的性能差异很明显。经过实测对比（1000次定位平均耗时）：

定位方式	耗时(ms)	适用场景
ID	12	静态唯一标识
CSS_SELECTOR	18	简单到复杂场景
XPATH	25	复杂层级关系
CLASS_NAME	15	样式类定位
TAG_NAME	20	标签名定位

优化建议：

优先使用ID和CSS选择器
避免使用//开头的XPath
对重复使用的元素进行缓存
减少不必要的元素查找次数

python复制# 不好的写法：重复查找
driver.find_element(By.ID, 'btn').click()
driver.find_element(By.ID, 'btn').get_attribute('class')

# 优化写法：缓存元素
btn = driver.find_element(By.ID, 'btn')
btn.click()
btn.get_attribute('class')

6. 企业级项目的定位策略设计

在长期维护的自动化测试项目中，我总结出这套元素定位规范：

分层设计：
- 基础定位方法封装成独立类
- 页面对象继承基础定位方法
- 测试用例只调用页面对象
智能降级机制：

python复制def smart_find(locators):
    for by, value in locators.items():
        try:
            return driver.find_element(by, value)
        except NoSuchElementException:
            continue
    raise ElementNotFoundError

locators = {
    By.ID: 'submitBtn',
    By.XPATH: '//button[contains(text(),"提交")]',
    By.CSS_SELECTOR: '.btn-submit'
}
submit_btn = smart_find(locators)

版本适配方案：

python复制# 根据系统版本选择定位策略
if get_system_version() >= '2.0':
    locator = (By.CSS_SELECTOR, '.new-btn-style')
else:
    locator = (By.ID, 'old-submit-btn')

这套方案在我们金融项目中使脚本维护成本降低了60%，特别是当前端大改版时，通常只需要更新定位策略类就能快速适配。

已经到底了哦

精选内容

1 VINS-FUSION代码逐行解析：从ROS回调到IMU预积分的实战避坑指南 2 别再死记硬背了！用STM32CubeMX+FreeRTOS实战，5分钟搞懂任务栈溢出检测 3 FIR IP 多通道复用设计：动态系数加载与通道切换策略 4 域控制器测试如何‘一次设计，多车复用’？聊聊vTESTstudio的变体(Variant)与参数化实战 5 硬件工程师的宝藏资源：除了Ultra Librarian，这些网站也能白嫖高质量AD封装库 6 Ubuntu18.04下Realtek 2.5G网卡驱动的编译与持久化配置指南 7 从零实现高斯拟合：揭秘最小二乘法与参数优化的数学之美 8 保姆级教程：在Windows上用VLC拉取ROS里D435i相机的RTSP视频流（含避坑指南）9 从下载到跑通第一个程序：VS2019 + Eigen 3.4.0 完整配置流程实录 10 别再手动算效率了！用Python的DEApy库5分钟搞定CCR模型（附学校评价实战代码）