51Testing软件测试论坛
标题:
requests 和 scrapy 在不同的爬虫应用中,各自有什么优势?
[打印本页]
作者:
测试积点老人
时间:
2021-5-21 13:34
标题:
requests 和 scrapy 在不同的爬虫应用中,各自有什么优势?
requests 是一个http框架,可以用来做爬虫
scrapy 是一个专业的爬虫框架
我是个python新手,研究怎么爬人家网站,朋友推荐我学requests,果然看了下文档,几分钟就能开始爬了
但是我看scrapy 这个爬虫框架,被很多人喜欢,我想这个东西一定有他的独特之处,
我目前使用requests爬的时候,先用其他方法得到cookies,然后把cookies共享给requests,然后爬网站的时候,用起来算很得心应手,但是爬过来的数据,我要自己写逻辑代码,进行解析,进行编码处理,进行入库
或许就是因为它只是一个http库吧!
然后我在思考,scrapy是一个框架,是不是在爬虫应用中,会比requests更好用呢
我要爬的网站有40多个, 如果我改用scrapy框架,
能给我带来多大的好处呢
分别会从哪些方面给我带来好处呢
请知友帮忙解答疑惑
作者:
qqq911
时间:
2021-5-24 10:32
这个比较看个人的习惯了
作者:
郭小贱
时间:
2021-5-24 11:30
scrapy是封装起来的框架,他包含了下载器,解析器,日志及异常处理,基于多线程, twisted的方式处理,对于固定单个网站的爬取开发,有优势,但是对于多网站爬取 100个网站,并发及分布式处理方面,不够灵活,不便调整与括展。
requests是一个HTTP库, 它只是用来,进行请求,对于HTTP请求,他是一个强大的库,下载,解析全部自己处理,灵活性更高,高并发与分布式部署也非常灵活,对于功能可以更好实现。
作者:
bellas
时间:
2021-5-24 13:37
来学习
作者:
jingzizx
时间:
2021-5-24 15:34
scrapy内部做了框架封装
作者:
litingting0214
时间:
2021-5-24 16:25
对哪个比较熟悉就用哪个
作者:
Miss_love
时间:
2021-5-31 15:57
看看
欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/)
Powered by Discuz! X3.2