51Testing软件测试论坛

标题: QQ空间爬取报错问题! [打印本页]

作者: 测试积点老人    时间: 2022-3-21 10:35
标题: QQ空间爬取报错问题!
QQ空间爬取报错:urllib.error.URLError: <urlopen error [WinError 10061] 由于目标计算机积极拒绝,无法连接。>

  1. from lxml import etree
  2. from bs4 import BeautifulSoup
  3. from selenium import webdriver
  4. import time
  5. #使用 selenium

  6. driver = webdriver.PhantomJS(executable_path="D:\\GHOST/bin/phantomjs.exe")
  7. driver.maximize_window()

  8. #登录 QQ 空间
  9. def get_shuoshuo(qq):
  10.     driver.get('http://user.qzone.qq.com/{}/311'.format(qq))
  11.     time.sleep(6.6)
  12.     try:
  13.         driver.find_element_by_id('login_div')
  14.         a = True
  15.     except:
  16.         a = False
  17.     if a == True:
  18.         driver.switch_to.frame('login_frame')
  19.         time.sleep(3.3)
  20.         driver.find_element_by_id('switcher_plogin').click()
  21.         time.sleep(3.3)
  22.         driver.find_element_by_id('u').clear()
  23.         time.sleep(3.3)
  24.         driver.find_element_by_id('u').send_keys('你的QQ')
  25.         time.sleep(3.3)
  26.         driver.find_element_by_id('p').clear()
  27.         time.sleep(3.3)
  28.         driver.find_element_by_id('p').send_keys('你的QQ密码')
  29.         time.sleep(3.3)
  30.         driver.find_element_by_id('login_button').click()
  31.         time.sleep(6.6)

  32. driver.implicitly_wait(3)
  33. try:
  34.     driver.find_element_by_id('QM_OwnerInfo_Icon')
  35.     b = True
  36. except:
  37.     b = False

  38. if b == True:
  39.     driver.switch_to.frame('app_canvas_frame')
  40.     content = driver.find_elements_by_css_selector('.content')
  41.     stime = driver.find_elements_by_css_selector('.c_tx.c_tx3.goDetail')
  42.     for con,sti in zip(content,stime):
  43.         data = {
  44.             'time':sti.text,
  45.             'shuos':con.text
  46.         }
  47.         print(data)
  48.     pages = driver.page_source
  49.     soup = BeautifulSoup(pages,'lxml')

  50. cookie = driver.get_cookies()
  51. cookie_dict = []
  52. for c in cookie:
  53.     ck = "{0}={1};".format(c['name'],c['value'])
  54.     cookie_dict.append(ck)

  55. i = ''
  56. for c in cookie_dict:
  57.     i += c

  58. print('Cookies:',i)
  59. print("================完成================")
  60. driver.close()
  61. driver.quit()

  62. if __name__ == '__main__':
  63.     get_shuoshuo('目标的QQ号')
复制代码
[attach]136947[/attach]



作者: qqq911    时间: 2022-3-22 10:18
被反爬了
作者: kallinr    时间: 2022-3-22 10:18
反扒
作者: jingzizx    时间: 2022-3-22 14:54
没连上。。。




欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/) Powered by Discuz! X3.2