51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

查看: 1055|回复: 4
打印 上一主题 下一主题

selenium爬取卫健委无法获取文本

[复制链接]
  • TA的每日心情
    无聊
    9 小时前
  • 签到天数: 407 天

    连续签到: 1 天

    [LV.9]测试副司令

    跳转到指定楼层
    1#
    发表于 2021-11-29 10:04:43 | 显示全部楼层 回帖奖励 |倒序浏览 |阅读模式
    1测试积点
    问题:可以抓取到相关元素,但无法抓取对应文本
    过程:
    图1为网页源码,图2为print输出,图3为对应页面
    尝试了text无法获取对应文本,查看is_displayed为true,并未隐藏,且通过print也可以看到相应元素已抓取到;
    尝试get_attribute("innerHTML"),只有登记号可以抓取到,其余字段输出为空值“”(不是none)



    代码如下:
    1. driver.find_element_by_partial_link_text("浏览").click()
    2. #切换当前页面标签
    3. driver.switch_to.window(driver.window_handles[1])
    4. #获取当前页面地址
    5. url = driver.current_url
    6. #获取页面信息
    7. allInfo = driver.find_elements_by_class_name("col-sm-8")
    8. print(allInfo)
    9. for info in allInfo:
    10.   print(info.get_attribute("innerHTML"))
    复制代码
    请问,如何才能抓取到对应字段内容,是中文的原因还是伪元素(after、befored)的原因?

    附件: 您需要 登录 才可以下载或查看,没有帐号?(注-册)加入51Testing
    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-5-6 21:04 , Processed in 0.072635 second(s), 23 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表