51Testing软件测试论坛

标题: selenium爬取卫健委无法获取文本 [打印本页]

作者: 测试积点老人 时间: 2021-11-29 10:04
标题: selenium爬取卫健委无法获取文本
问题：可以抓取到相关元素，但无法抓取对应文本
过程：
图1为网页源码，图2为print输出，图3为对应页面
尝试了text无法获取对应文本，查看is_displayed为true，并未隐藏，且通过print也可以看到相应元素已抓取到；
尝试get_attribute("innerHTML")，只有登记号可以抓取到，其余字段输出为空值“”（不是none）
[attach]135488[/attach]
[attach]135489[/attach]
[attach]135490[/attach]
代码如下：

driver.find_element_by_partial_link_text("浏览").click()
#切换当前页面标签
driver.switch_to.window(driver.window_handles[1])
#获取当前页面地址
url = driver.current_url
#获取页面信息
allInfo = driver.find_elements_by_class_name("col-sm-8")
print(allInfo)
for info in allInfo:
print(info.get_attribute("innerHTML"))

复制代码

请问，如何才能抓取到对应字段内容，是中文的原因还是伪元素（after、befored）的原因？

作者: my_option 时间: 2021-11-29 13:30
切换新窗口句柄应为
driver.switch_to.window(driver.window_handles[-1])
你改下试试

作者: 海海豚 时间: 2021-11-30 09:23
判断文本是否被隐藏 driver.find_element_by_xx().is_displayed()

作者: qqq911 时间: 2021-11-30 10:26
试试直接获取返回呢

作者: jingzizx 时间: 2021-11-30 17:35
改改试试

欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/)