51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 1324|回复: 3
打印 上一主题 下一主题

python网页爬取

[复制链接]
  • TA的每日心情
    无聊
    4 天前
  • 签到天数: 530 天

    连续签到: 2 天

    [LV.9]测试副司令

    跳转到指定楼层
    1#
    发表于 2022-4-1 13:13:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    1测试积点
    如何用Selenium模块爬取加载的Ajax数据,点击网页的下一页,便加载一些Ajax数据,网址一直不变
    我想获取网页中所有Ajax加载的数据,已经基本判断出我想要的数据包类型。

    [color=rgba(0, 0, 0, 0.75)]后面8个jsp文件就是我想要的
    1. from selenium import webdriver
    2. from bs4 import BeautifulSoup
    3. brower=webdriver.Chrome()
    4. brower.get('http://faculty.hust.edu.cn/xklb.jsp?urltype=tree.TreeTempUrl&wbtreeid=1004%27)
    5. text=brower.page_source
    6. brower.close()

    7. strtext=BeautifulSoup(text,'lxml')
    8. for i in strtext.select('a'):
    9. with open('华中.txt','w',encoding='utf-8') as file:
    10. file.write(i)
    复制代码


    附件: 您需要 登录 才可以下载或查看,没有帐号?(注-册)加入51Testing
    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    昨天 10:15
  • 签到天数: 756 天

    连续签到: 1 天

    [LV.10]测试总司令

    2#
    发表于 2022-4-2 09:37:39 | 只看该作者
    等大神
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    3 天前
  • 签到天数: 1521 天

    连续签到: 5 天

    [LV.Master]测试大本营

    3#
    发表于 2022-4-2 11:53:22 | 只看该作者
    模拟鼠标操作,获取全部信息
    回复

    使用道具 举报

  • TA的每日心情
    慵懒
    前天 08:51
  • 签到天数: 668 天

    连续签到: 6 天

    [LV.9]测试副司令

    4#
    发表于 2022-4-2 18:19:50 | 只看该作者
    传递键鼠操作
    回复

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-11-25 07:21 , Processed in 0.065496 second(s), 22 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表