Python+Selenium电商自动化登录与下单实战-代码聚汇网

Python+Selenium电商自动化登录与下单实战

汤一白君

1. 项目概述

作为一名长期从事自动化测试开发的工程师，我经常需要处理各种Web自动化任务。今天要分享的是一个非常实用的Python+Selenium实战项目——自动登录电商平台并完成下单操作。这个项目看似简单，但其中包含了Web自动化的核心技术和诸多实战细节。

Selenium作为最流行的Web自动化工具之一，其优势在于能够模拟真实用户操作浏览器。不同于简单的HTTP请求，Selenium可以处理复杂的JavaScript渲染、动态元素加载以及各种交互式操作。在电商自动化场景中，这种特性尤为重要，因为现代电商网站大量使用了AJAX和前端框架。

2. 环境准备与配置

2.1 基础环境搭建

在开始编码前，我们需要准备好开发环境。我推荐使用以下配置：

Python 3.8+：这是目前最稳定的Python版本，对各类库的支持也最完善
PyCharm专业版：社区版虽然免费，但专业版提供了更好的Web开发支持
Selenium 3.141.0：这个版本经过长期验证，稳定性最佳

安装Selenium非常简单，只需执行：

bash复制pip install selenium==3.141.0

2.2 浏览器驱动配置

Chrome浏览器是最常用的自动化测试浏览器，我们需要配置对应的ChromeDriver。以下是详细步骤：

确认Chrome版本：
在浏览器地址栏输入chrome://version/，查看"Google Chrome"后面的版本号
下载匹配的ChromeDriver：
访问ChromeDriver官网，下载与你的Chrome版本最接近的驱动版本。不必追求完全一致，主版本号相同即可。
配置环境变量：
将下载的chromedriver.exe放到任意目录（建议放在项目根目录），然后将该路径添加到系统环境变量Path中。

重要提示：添加Path时务必小心，不要覆盖原有Path值。正确做法是点击"编辑"，然后在现有值后追加你的路径，用分号隔开。

验证驱动是否配置成功：

python复制from selenium import webdriver
driver = webdriver.Chrome()

如果能够正常启动浏览器窗口，说明配置正确。

3. 核心代码实现

3.1 基础框架搭建

我们先导入必要的模块并初始化浏览器：

python复制from selenium import webdriver
import time

# 初始化浏览器
driver = webdriver.Chrome()
driver.implicitly_wait(10)  # 设置隐式等待10秒

implicitly_wait是Selenium中非常重要的一个设置，它会在查找元素时自动等待指定时间，直到元素出现。这比硬编码的time.sleep更加优雅和高效。

3.2 页面访问与登录处理

电商网站通常有复杂的登录机制，我们需要处理多种情况：

python复制url = 'https://example.com/item.htm?id=12345'  # 替换为实际商品URL
driver.get(url)

try:
    # 尝试定位登录iframe
    iframe = driver.find_element_by_css_selector('iframe')
except:
    # 备用定位方式
    iframe = driver.find_element_by_css_selector('#baxia-dialog-content')
    
# 切换到iframe内部
driver.switch_to.frame(iframe)

# 点击二维码登录
driver.find_element_by_css_selector('.iconfont.icon-qrcode').click()

# 等待用户扫码登录
while True:
    print("请扫码登录...")
    if driver.title != "商品详情":
        break
    time.sleep(1)
print("登录成功!")

这里有几个关键点需要注意：

现代网站常用iframe嵌套登录框，必须使用switch_to.frame切换上下文
二维码登录是最稳定的方式，避免了账号密码直接暴露在代码中
通过检测页面标题变化来判断是否登录成功

3.3 商品选择与下单

商品选择和下单是自动化中最容易出问题的环节，需要完善的异常处理：

python复制try:
    # 主选择器方案
    driver.find_element_by_css_selector('.skuValueName').click()
    driver.find_element_by_css_selector('div>button>span').click()
except Exception as e:
    print(f"主方案失败: {e}, 尝试备用方案")
    # 备用选择器方案
    driver.find_element_by_css_selector('.tm-clear.J_TSaleProp li').click()
    driver.find_element_by_css_selector('#J_LinkBuy').click()
    time.sleep(1)
    driver.find_element_by_css_selector('.go-btn').click()

电商网站的前端结构经常变化，因此准备多套选择器方案是必要的。CSS选择器比XPath更简洁高效，推荐优先使用。

4. 高级技巧与优化

4.1 元素定位策略优化

在实际项目中，我总结了以下元素定位最佳实践：

优先使用CSS选择器：性能最好，语法简洁
避免绝对XPath：过于脆弱，随DOM变化容易失效
使用数据属性：如[data-testid="buy-button"]，这类属性最稳定
组合定位策略：如find_element(By.CSS_SELECTOR, '.class1.class2')

4.2 等待机制详解

正确的等待策略是自动化脚本稳定的关键：

隐式等待：全局设置，driver.implicitly_wait(10)
显式等待：针对特定条件

python复制from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, "myElement"))
)

固定等待：仅在特殊情况下使用time.sleep()

4.3 反检测策略

现代网站都有反爬虫和反自动化机制，我们需要采取一些规避措施：

修改WebDriver属性：

python复制driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": """
    Object.defineProperty(navigator, 'webdriver', {
        get: () => undefined
    })
    """
})

使用真实用户代理：

python复制options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36")

模拟人类操作：

python复制from selenium.webdriver.common.action_chains import ActionChains

actions = ActionChains(driver)
actions.move_to_element(element).pause(0.5).click().perform()

5. 常见问题与解决方案

5.1 元素定位失败

问题现象：NoSuchElementException或元素交互无效

排查步骤：

确认页面是否完全加载（检查Network面板）
验证选择器是否正确（使用浏览器开发者工具）
检查是否有iframe嵌套
查看元素是否在Shadow DOM中

解决方案：

python复制# 使用更健壮的定位方式
element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.CSS_SELECTOR, '.dynamic-element'))
)

5.2 验证码处理

应对策略：

尽量使用二维码登录避开验证码
商业解决方案如打码平台
设置cookie绕过（需先手动登录获取cookie）

Cookie设置示例：

python复制driver.get("https://example.com")
driver.add_cookie({
    'name': 'sessionid',
    'value': 'your_cookie_value',
    'domain': '.example.com'
})

5.3 性能优化技巧

禁用图片加载：

python复制chrome_options = webdriver.ChromeOptions()
prefs = {"profile.managed_default_content_settings.images": 2}
chrome_options.add_experimental_option("prefs", prefs)

使用无头模式：

python复制chrome_options.add_argument("--headless")

复用浏览器会话：

python复制# 首次启动时保存session信息
session_id = driver.session_id
executor_url = driver.command_executor._url

# 后续可以复用
driver = webdriver.Remote(command_executor=executor_url, desired_capabilities={})
driver.session_id = session_id

6. 项目扩展与进阶

这个基础项目可以进一步扩展为完整的电商自动化测试框架：

数据驱动测试：使用Excel或JSON管理测试数据
页面对象模式：将页面封装为类，提高代码复用性
集成测试报告：结合Allure生成美观的测试报告
分布式执行：使用Selenium Grid实现多浏览器并行测试

一个简单的页面对象示例：

python复制class LoginPage:
    def __init__(self, driver):
        self.driver = driver
        self.username_field = (By.ID, 'username')
        self.password_field = (By.ID, 'password')
    
    def login(self, username, password):
        self.driver.find_element(*self.username_field).send_keys(username)
        self.driver.find_element(*self.password_field).send_keys(password)
        self.driver.find_element(By.CSS_SELECTOR, '.submit-btn').click()

在实际项目中，我发现最关键的不仅是技术实现，更重要的是异常处理和稳定性保障。一个健壮的自动化脚本应该能够处理各种边界情况，比如网络延迟、元素加载超时、验证码出现等意外场景。