selenium爬取卫健委无法获取文本

测试积点老人 发表于 2021-11-29 10:04:43

问题：可以抓取到相关元素，但无法抓取对应文本
过程：
图1为网页源码，图2为print输出，图3为对应页面
尝试了text无法获取对应文本，查看is_displayed为true，并未隐藏，且通过print也可以看到相应元素已抓取到；
尝试get_attribute("innerHTML")，只有登记号可以抓取到，其余字段输出为空值“”（不是none）

代码如下：
driver.find_element_by_partial_link_text("浏览").click()
#切换当前页面标签
driver.switch_to.window(driver.window_handles)
#获取当前页面地址
url = driver.current_url
#获取页面信息
allInfo = driver.find_elements_by_class_name("col-sm-8")
print(allInfo)
for info in allInfo:
print(info.get_attribute("innerHTML"))请问，如何才能抓取到对应字段内容，是中文的原因还是伪元素（after、befored）的原因？

my_option 发表于 2021-11-29 13:30:49

切换新窗口句柄应为
driver.switch_to.window(driver.window_handles[-1])
你改下试试

海海豚 发表于 2021-11-30 09:23:18

判断文本是否被隐藏 driver.find_element_by_xx().is_displayed()

qqq911 发表于 2021-11-30 10:26:47

试试直接获取返回呢

jingzizx 发表于 2021-11-30 17:35:35

改改试试

页: [1]

51Testing软件测试论坛 's Archiver

selenium爬取卫健委无法获取文本