51Testing软件测试论坛

 找回密码
 (注-册)加入51Testing

QQ登录

只需一步,快速开始

微信登录,快人一步

手机号码,快捷登录

查看: 2502|回复: 5
打印 上一主题 下一主题

[讨论] 爬虫测试

[复制链接]
  • TA的每日心情
    擦汗
    2022-8-30 09:02
  • 签到天数: 2 天

    连续签到: 2 天

    [LV.1]测试小兵

    跳转到指定楼层
    1#
    发表于 2018-3-15 16:31:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    1. #coding=utf-8  
    2.   
    3. __doc__ = '''''
    4. 使用requests来简单的爬取图片,请求使用Referer,否则爬取不到正确的结果
    5. '''  
    6.   
    7. CHUNK = 1024  
    8.   
    9. import requests  
    10. import re  
    11. import os  
    12.   
    13. def download_images(x, y):  
    14.     URL_SEGMENT = '{0}/{1}'.format(x,y)  
    15.     URL_FORMAT = 'http://img.zngirls.com/gallery/%s/{0:03d}.jpg' % (URL_SEGMENT)  
    16.     URL_FORMAT0 = 'http://img.zngirls.com/gallery/%s/{0}.jpg' % (URL_SEGMENT)  
    17.   
    18.     i=0  
    19.     numbers = re.compile('\\d+/\\d+')  
    20.     rl = numbers.findall(URL_FORMAT0)  
    21.     if not rl:  
    22.         return  
    23.     dirname = rl[0].replace('/','-')  
    24.     if not os.path.isdir(dirname):  
    25.         os.makedirs(dirname)  
    26.   
    27.     while True:  
    28.         url = ''  
    29.         if i==0:  
    30.             url = URL_FORMAT0.format(i)  
    31.         else:  
    32.             url = URL_FORMAT.format(i)  
    33.   
    34.         print('url=', url)  
    35.         res = requests.get(url, headers={'Referer':'http://www.zngirls.com/g/13080/2.html',}, stream=True)  
    36.         if res.status_code != 200:  
    37.             break  
    38.   
    39.         filename = os.path.join(dirname,'{0:03d}.jpg'.format(i))  
    40.         with open(filename, mode='wb') as f:  
    41.             for chunk in res.iter_content(CHUNK):  
    42.                 f.write(chunk)  
    43.   
    44.         i += 1  
    45.   
    46. def main():  
    47.     download_images(21363, 18304)  
    48.   
    49. if __name__ == '__main__':  
    50.     main()  
    复制代码


    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏
    回复

    使用道具 举报

    本版积分规则

    关闭

    站长推荐上一条 /1 下一条

    小黑屋|手机版|Archiver|51Testing软件测试网 ( 沪ICP备05003035号 关于我们

    GMT+8, 2024-11-24 19:52 , Processed in 0.066966 second(s), 22 queries .

    Powered by Discuz! X3.2

    © 2001-2024 Comsenz Inc.

    快速回复 返回顶部 返回列表