51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 1035|回复: 2
打印 上一主题 下一主题

这段selenium爬虫程序问题出在哪里

[复制链接]
  • TA的每日心情
    无聊
    4 天前
  • 签到天数: 530 天

    连续签到: 2 天

    [LV.9]测试副司令

    跳转到指定楼层
    1#
    发表于 2022-1-21 09:59:04 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    1测试积点
    问题遇到的现象和发生背景

    爬到第二页就提示没有获得元素,第一页都是可以获取的,是怎么回事呢

    1. import time
    2. from selenium import webdriver
    3. import pandas as pd
    4. driver = webdriver.Edge("C:\Program Files (x86)\Microsoft\Edge\Application\msedgedriver.exe")
    5. driver.get('https://movie.douban.com/top250')
    6. driver.implicitly_wait(10)
    7. datas=[]

    8. while True:
    9.     #获取所有li
    10.     allLists = driver.find_elements_by_xpath('//*[@id="content"]/div[@class="grid-16-8 clearfix"]/div[@class="article"]/ol[@class="grid_view"]/li')

    11.     for eachList in allLists:
    12.         #第一页数据正常,爬取第二页时提示没有取到元素
    13.         rank = eachList.find_element_by_xpath('./div[@class="item"]/div[@class="pic"]/em').text
    14.         title = eachList.find_element_by_xpath('./div/div[2]/div[1]/a').text
    15.         rating = eachList.find_element_by_xpath('./div/div[2]/div[2]/div/span[2]').text
    16.         intro = eachList.find_element_by_xpath('./div/div[2]/div[2]/p[2]/span').text
    17.         NumberofPeople  = eachList.find_element_by_xpath('./div/div[2]/div[2]/div/span[4]').text
    18.         # print(rank)
    19.         datas.append({
    20.             '排名':rank,
    21.             '电影名称':title,
    22.             '评分':rating,
    23.             '介绍':intro,
    24.             '评价人数':NumberofPeople
    25.         })
    26.         if driver.find_element_by_xpath('//*[@id="content"]/div/div[1]/div[2]/span[3]/a'):
    27.              nextPage = driver.find_element_by_xpath('//*[@id="content"]/div/div[1]/div[2]/span[3]/a')
    28.              nextPage.click()
    29.              time.sleep(2)
    30.         else:
    31.             break


    32. df = pd.DataFrame(datas)
    33. df.to_excel('selenium豆瓣top250.xlsx',index = False)
    复制代码
    运行结果及报错内容我的解答思路和尝试过的方法我想要达到的结果

    导出所有数据到excel表格


    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    半小时前
  • 签到天数: 1522 天

    连续签到: 1 天

    [LV.Master]测试大本营

    2#
    发表于 2022-1-24 10:15:23 | 只看该作者
    看下换页以后地址换了没
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    3 小时前
  • 签到天数: 2819 天

    连续签到: 1 天

    [LV.Master]测试大本营

    3#
    发表于 2022-1-24 15:33:12 | 只看该作者
    确认是不是到了第二页
    回复

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-11-25 11:04 , Processed in 0.067969 second(s), 21 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表