51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 1182|回复: 3
打印 上一主题 下一主题

QQ空间爬取报错问题!

[复制链接]
  • TA的每日心情
    无聊
    4 天前
  • 签到天数: 530 天

    连续签到: 2 天

    [LV.9]测试副司令

    跳转到指定楼层
    1#
    发表于 2022-3-21 10:35:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    1测试积点
    QQ空间爬取报错:urllib.error.URLError: <urlopen error [WinError 10061] 由于目标计算机积极拒绝,无法连接。>

    1. from lxml import etree
    2. from bs4 import BeautifulSoup
    3. from selenium import webdriver
    4. import time
    5. #使用 selenium

    6. driver = webdriver.PhantomJS(executable_path="D:\\GHOST/bin/phantomjs.exe")
    7. driver.maximize_window()

    8. #登录 QQ 空间
    9. def get_shuoshuo(qq):
    10.     driver.get('http://user.qzone.qq.com/{}/311'.format(qq))
    11.     time.sleep(6.6)
    12.     try:
    13.         driver.find_element_by_id('login_div')
    14.         a = True
    15.     except:
    16.         a = False
    17.     if a == True:
    18.         driver.switch_to.frame('login_frame')
    19.         time.sleep(3.3)
    20.         driver.find_element_by_id('switcher_plogin').click()
    21.         time.sleep(3.3)
    22.         driver.find_element_by_id('u').clear()
    23.         time.sleep(3.3)
    24.         driver.find_element_by_id('u').send_keys('你的QQ')
    25.         time.sleep(3.3)
    26.         driver.find_element_by_id('p').clear()
    27.         time.sleep(3.3)
    28.         driver.find_element_by_id('p').send_keys('你的QQ密码')
    29.         time.sleep(3.3)
    30.         driver.find_element_by_id('login_button').click()
    31.         time.sleep(6.6)

    32. driver.implicitly_wait(3)
    33. try:
    34.     driver.find_element_by_id('QM_OwnerInfo_Icon')
    35.     b = True
    36. except:
    37.     b = False

    38. if b == True:
    39.     driver.switch_to.frame('app_canvas_frame')
    40.     content = driver.find_elements_by_css_selector('.content')
    41.     stime = driver.find_elements_by_css_selector('.c_tx.c_tx3.goDetail')
    42.     for con,sti in zip(content,stime):
    43.         data = {
    44.             'time':sti.text,
    45.             'shuos':con.text
    46.         }
    47.         print(data)
    48.     pages = driver.page_source
    49.     soup = BeautifulSoup(pages,'lxml')

    50. cookie = driver.get_cookies()
    51. cookie_dict = []
    52. for c in cookie:
    53.     ck = "{0}={1};".format(c['name'],c['value'])
    54.     cookie_dict.append(ck)

    55. i = ''
    56. for c in cookie_dict:
    57.     i += c

    58. print('Cookies:',i)
    59. print("================完成================")
    60. driver.close()
    61. driver.quit()

    62. if __name__ == '__main__':
    63.     get_shuoshuo('目标的QQ号')
    复制代码



    附件: 您需要 登录 才可以下载或查看,没有帐号?(注-册)加入51Testing
    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    4 小时前
  • 签到天数: 1522 天

    连续签到: 1 天

    [LV.Master]测试大本营

    2#
    发表于 2022-3-22 10:18:07 | 只看该作者
    被反爬了
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    5 小时前
  • 签到天数: 669 天

    连续签到: 1 天

    [LV.9]测试副司令

    3#
    发表于 2022-3-22 10:18:39 | 只看该作者
    反扒
    回复

    使用道具 举报

  • TA的每日心情
    奋斗
    7 小时前
  • 签到天数: 2819 天

    连续签到: 1 天

    [LV.Master]测试大本营

    4#
    发表于 2022-3-22 14:54:56 | 只看该作者
    没连上。。。
    回复

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-11-25 14:40 , Processed in 0.068745 second(s), 22 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表