51Testing软件测试论坛
标题:
scrapy爬虫框架简单实例
[打印本页]
作者:
悠悠小仙仙
时间:
2019-6-11 11:49
标题:
scrapy爬虫框架简单实例
本帖最后由 悠悠小仙仙 于 2019-6-11 14:41 编辑
声明:初学scrapy,总结学习内容。
目录
一、安装scrapy
二、创建工程
三、编写代码
3.1 item文件编写
3.1 spider文件编写
3.2 pipeline文件编写
3.3 setting文件修改
四、测试
一、安装scrapy
pip install scrapy
二、创建工程
scrapy startproject mySpider #创建scrapy工程
cd mySpider #进入工程目录
scrapy genspider itcast "www.itcast.cn" #创建爬虫(spider名不能与project名相同)
三、编写代码
3.1 item文件编写
items用于存储字段的定义。即爬取的内容存与item类中。
[attach]124913[/attach]
3.1 spider文件编写
[attach]124914[/attach]
3.2 pipeline文件编写
pipeline文件用于存储到文件中。
[attach]124915[/attach]
3.3 setting文件修改
其他配置暂且不用修改,只修改pipeline配置。
[attach]124916[/attach]
四、测试
scrapy crawl itcast #运行爬虫
作者:
Miss_love
时间:
2020-12-30 16:02
支持
欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/)
Powered by Discuz! X3.2