1. 问题分析
在京东上抢购商品老是失败,在提交订单时发现已经没货,由此确定京东已经抢到的标志是提交订单,有时好像是付款才算抢到成功。预售商品虽然可以加入购物车,但却是不可选的,因此在自动抢购过程中必须先勾选。
一般京东抢购的过程是:登录账号 → 进入购物车 → 选择抢购商品 → 点击去结算 → 点击提交订单 → 选择付款方式并付款。基于这种情况利用 python 代码实现自动登录京东账号,自动滑动验证码进行验证,自动勾选购物车商品并提交订单,剩下的付款操作手动进行。
2. 基础情况
以下环境满足其一即可:
已安装 python 解释器和 Pycharm 软件,已切换镜像源并绑定。
已安装 Anaconda 软件和 Pycharm 软件并绑定 Anaconda 自带的 python 解释器,已切换镜像源并绑定。
可以不限于以上两种开发环境配置方式。
3. 安装 selenium
selenium 是一个 python 自动化测试工具,利用 selenium 工具包可以对浏览器网页进行诸如点击和下载内容等操作,简单实用。
3.1 对于使用单独 python 解释器的情况,使用命令行 cd 进入解释器安装路径下的 Scripts 路径下,运行代码 pip install selenium 进行安装。
3.2 对于使用 Anaconda 自带 python 解释器的情况,打开 Anaconda Prompt,运行代码 activate root 进入基础环境(有些版本打开时就已经在基础环境 base 下就不用执行这一步),接下来再运行代码 pip install selenium 进行安装。
3.3 等待安装完成之后运行 python 进入交互式环境,运行代码 import selenium 不报错则表示安装成功。
4. 下载 Edge 浏览器驱动
可以不限于使用 Edge 浏览器,使用 Chrome,FireFox 等都是可以的,但需要下载对应的驱动。点击链接 https://developer.microsoft.com/ ... ge/tools/webdriver/进入 edge 驱动下载界面,勾选稳定版 x64 开始下载,此处根据自己电脑系统进行选择。
下载得到一个压缩包,右键点击解压到当前文件夹,将其中的 msedgedriver.exe 复制到自己当前的项目工程根路径下。
5. 登录网页京东5.1 先打开 edge 浏览器并最大化窗口,进入京东登录界面。 - <font size="3">driver = webdriver.Edge(executable_path='./msedgedriver.exe') # 打开 Edge 浏览器
- driver.maximize_window() # 最大化 Edge 浏览器窗口
- driver.get('https://passport.jd.com/new/login.aspx') # 京东登录界面链接
- </font>
复制代码5.2 选择账户登录选项,自动输入用户名和密码,最后点击登录。 - <font size="3">driver.find_element_by_link_text("账户登录").click() # 选择账户登录并点击
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("loginname").send_keys(username) # 找到用户名输入框并输入用户名
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("nloginpwd").send_keys(password) # 找到密码输入框输入密码
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("loginsubmit").click() # 找到登录并点击
- </font>
复制代码 6. 滑动验证登录由于京东的安全限制,点击登录之后需要进行滑动验证才能完成登录,滑动验证码本身由两幅图像组成,一个作为可滑动的小滑块,一个是缺失滑块结构的背景。 6.1 首先获取滑动验证码的两幅图像,灰度化处理后保存到本地。 - <font size="3">image_big_path = r'//div/div[@class="JDJRV-bigimg"]/img' # 滑动验证码大图(大背景)
- image_small_path = r'//div/div[@class="JDJRV-smallimg"]/img' # 滑动验证码小图(小滑块)
- image_big = driver.find_element_by_xpath(image_big_path).get_attribute("src") # 验证码背景图的完整路径
- image_small = driver.find_element_by_xpath(image_small_path).get_attribute("src") # 验证码滑块图的完整路径
- request.urlretrieve(image_big, 'background.jpg') # 下载验证码背景图到本地
- request.urlretrieve(image_small, 'slideblock.jpg') # 下载验证码滑块图到本地
- cv2.imwrite('background.jpg', cv2.imread('background.jpg', 0)) # 将验证码背景图读取为灰度图并覆盖原图
- slideblock = cv2.imread('slideblock.jpg', 0) # 将验证码滑块图读取为灰度图
- slideblock = abs(255 - slideblock) # 对验证码滑块图反灰化处理
- cv2.imwrite('slideblock.jpg', slideblock) # 保存处理后的验证码滑块图
- background = cv2.imread('background.jpg') # 读取验证码背景图(灰度)
- slideblock = cv2.imread('slideblock.jpg') # 读取验证码滑块图(灰度)
- </font>
复制代码6.2 再利用 opencv 中的模板匹配函数 matchTemplate 得到滑块图像在背景上的相似度矩阵。 - <font size="3">result = cv2.matchTemplate(background, slideblock, cv2.TM_CCOEFF_NORMED) # 模板匹配,获得滑块在背景上的相似度矩阵
- </font>
复制代码6.3 利用 numpy 中的元素索引函数 unravel_index 获取匹配度最大值在原相似度矩阵中的索引。 - <font size="3">_, distance = np.unravel_index(result.argmax(), result.shape) # 获得要移动的距离
- </font>
复制代码注意在该函数中索引坐标系与一般理解略有不同。 6.4 模拟人越来越快地移动滑块到指定位置。由于京东的安全管制,必须采取一定的滑块移动策略才能尽量不被检测出来非手动,实际实验中滑动验证正确的步数也是不确定的,大概 1~10 步左右。 - <font size="3">dist_finished = 0 # 已经移动的距离
- dist_remaining = distance # 剩余的距离
- dist_move = 5 # 每次移动的距离
- element = driver.find_element_by_xpath(button_slide) # 选取滑动验证码滑块
- ActionChains(driver).click_and_hold(element).perform() # 模拟鼠标在滑块上点击并保持
- # 模拟滑动开始和滑动结束时比较慢,中间阶段比较快
- while dist_remaining > 0:
- dist_move += dist_move # 不断加速地移动滑块
- # 每次移动滑块都带有正负偏差来模拟手动移动时的滑动不稳定
- ActionChains(driver).move_by_offset(dist_move, random.randint(-3, 3)).perform() # 模拟鼠标水平向右拖动滑块
- dist_remaining -= dist_move # 剩余距离减去已移动的距离
- dist_finished += dist_move # 已完成距离加上已移动的距离
- ActionChains(driver).move_by_offset(dist_remaining, random.randint(-3, 3)).perform() # 模拟鼠标水平回移拖动滑块修正
- ActionChains(driver).release(on_element=element).perform() # 模拟松开鼠标
- </font>
复制代码 7. 自动购买商品7.1 登录成功后点击我的购物车打开另一个浏览器页面。 - <font size="3">driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_link_text("我的购物车").click() # 找到我的购物车并点击
- </font>
复制代码7.2 全选购物车中的商品,点击结算并提交订单。 - <font size="3">driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_name('select-all').click() # 购物车全选
- time.sleep(0.5) # 等待 0.5 秒
- driver.find_element_by_link_text("去结算").click() # 找到去结算并点击
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("order-submit").click() # 找到提交订单并点击
- </font>
复制代码 8. 完整实现源码
- <font size="3">import cv2
- import time
- import random
- import datetime
- import numpy as np
- from urllib import request
- from selenium import webdriver
- from selenium.webdriver.common.action_chains import ActionChains
- # 移动滑动验证码中的滑块
- def checkMove(button_slide, distance):
- dist_finished = 0 # 已经移动的距离
- dist_remaining = distance # 剩余的距离
- dist_move = 5 # 每次移动的距离
- element = driver.find_element_by_xpath(button_slide) # 选取滑动验证码滑块
- ActionChains(driver).click_and_hold(element).perform() # 模拟鼠标在滑块上点击并保持
- # 模拟不断加速移动滑块
- while dist_remaining > 0:
- dist_move += dist_move # 不断 加速移动滑块
- # 每次移动滑块都带有正负偏差来模拟手动移动时的滑动不稳定
- ActionChains(driver).move_by_offset(dist_move, random.randint(-3, 3)).perform() # 模拟鼠标水平向右拖动滑块
- dist_remaining -= dist_move # 剩余距离减去已移动的距离
- dist_finished += dist_move # 已完成距离加上已移动的距离
- ActionChains(driver).move_by_offset(dist_remaining, random.randint(-3, 3)).perform() # 模拟鼠标水平回移拖动滑块修正
- ActionChains(driver).release(on_element=element).perform() # 模拟松开鼠标
- # 获取滑动验证码构成的两张图片并计算应移动的距离
- def getCheckImage():
- image_big_path = r'//div/div[@class="JDJRV-bigimg"]/img' # 滑动验证码大图(大背景)
- image_small_path = r'//div/div[@class="JDJRV-smallimg"]/img' # 滑动验证码小图(小滑块)
- button_slide = '//div[@class="JDJRV-slide-inner JDJRV-slide-btn"]' # 滑动验证码滑块按钮
- image_big = driver.find_element_by_xpath(image_big_path).get_attribute("src") # 验证码背景图的完整路径
- image_small = driver.find_element_by_xpath(image_small_path).get_attribute("src") # 验证码滑块图的完整路径
- request.urlretrieve(image_big, 'background.jpg') # 下载验证码背景图到本地
- request.urlretrieve(image_small, 'slideblock.jpg') # 下载验证码滑块图到本地
- cv2.imwrite('background.jpg', cv2.imread('background.jpg', 0)) # 将验证码背景图读取为灰度图并覆盖原图
- slideblock = cv2.imread('slideblock.jpg', 0) # 将验证码滑块图读取为灰度图
- slideblock = abs(255 - slideblock) # 对验证码滑块图反灰化处理
- cv2.imwrite('slideblock.jpg', slideblock) # 保存处理后的验证码滑块图
- background = cv2.imread('background.jpg') # 读取验证码背景图(灰度)
- slideblock = cv2.imread('slideblock.jpg') # 读取验证码滑块图(灰度)
- result = cv2.matchTemplate(background, slideblock, cv2.TM_CCOEFF_NORMED) # 模板匹配,获得滑块在背景上的相似度矩阵
- _, distance = np.unravel_index(result.argmax(), result.shape) # 获得要移动的距离
- return button_slide, distance
- # 滑动验证
- def slideIdentify():
- slideButton, distance = getCheckImage() # 获取滑块和滑块需要移动的距离
- print(f'本次滑块需要移动的距离为: {distance}') # 打印滑块需要移动的距离
- checkMove(slideButton, distance / 1.3) # 移动滑块,1.3 是一个实验修正值
- # 登录京东网页版
- def login(username, password):
- driver.get('https://passport.jd.com/new/login.aspx') # 京东登录界面链接
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_link_text("账户登录").click() # 找到账户登录并点击
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("loginname").send_keys(username) # 找到用户名输入框并输入用户名
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("nloginpwd").send_keys(password) # 找到密码输入框输入密码
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("loginsubmit").click() # 找到登录并点击
- while True:
- try:
- slideIdentify() # 进行滑动验证
- time.sleep(2) # 等待 3 秒
- except:
- print("登录成功")
- break
- # 定时购买东西
- def buy(buy_time):
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_link_text("我的购物车").click() # 找到我的购物车并点击
- total_windows = driver.window_handles # 所有打开的窗口
- driver.switch_to.window(total_windows[1]) # 句柄迁移到第二个窗口
- while True:
- current_time = datetime.datetime.now() # 获取当前日期时间
- if current_time.strftime('%Y-%m-%d %H:%M:%S') == buy_time: # 如果当前时间等于指定购买时间
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_name('select-all').click() # 购物车全选
- time.sleep(0.5) # 等待 0.5 秒
- driver.find_element_by_link_text("去结算").click() # 找到去结算并点击
- driver.implicitly_wait(2) # 隐式等待 2 秒
- driver.find_element_by_id("order-submit").click() # 找到提交订单并点击
- driver.implicitly_wait(2) # 隐式等待 2 秒
- print('current time : ' + current_time.strftime('%Y-%m-%d %H:%M:%S')) # 打印当前时间
- print('购买成功 !') # 购买成功
- if __name__ == '__main__':
- driver = webdriver.Edge(executable_path='./msedgedriver.exe') # 打开 Edge 浏览器
- driver.maximize_window() # 最大化 Edge 浏览器窗口
- login('你的用户名', '你的密码') # 登录京东
- buy('2021-08-14 12:00:00') # 定时购买
- </font>
复制代码 结 语网页自动化操作确实可以实现抢购商品,相比手动操作会更快,但仅靠上述代码想与某些专业抢购的服务器进行比较还是相去甚远。如果有需要可以尝试一下,就当是一个 python 实战项目学习。
|