51Testing软件测试论坛
标题:
python网页爬取
[打印本页]
作者:
测试积点老人
时间:
2022-4-1 13:13
标题:
python网页爬取
如何用Selenium模块爬取加载的Ajax数据,点击网页的下一页,便加载一些Ajax数据,网址一直不变
我想获取网页中所有Ajax加载的数据,已经基本判断出我想要的数据包类型。
[attach]137149[/attach]
[color=rgba(0, 0, 0, 0.75)]
后面8个jsp文件就是我想要的
from selenium import webdriver
from bs4 import BeautifulSoup
brower=webdriver.Chrome()
brower.get('http://faculty.hust.edu.cn/xklb.jsp?urltype=tree.TreeTempUrl&wbtreeid=1004%27)
text=brower.page_source
brower.close()
strtext=BeautifulSoup(text,'lxml')
for i in strtext.select('a'):
with open('华中.txt','w',encoding='utf-8') as file:
file.write(i)
复制代码
作者:
bellas
时间:
2022-4-2 09:37
等大神
作者:
qqq911
时间:
2022-4-2 11:53
模拟鼠标操作,获取全部信息
作者:
kallinr
时间:
2022-4-2 18:19
传递键鼠操作
欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/)
Powered by Discuz! X3.2