scrapy爬虫框架简单实例

悠悠小仙仙 · 发表于 2019-6-11 11:49:28

本帖最后由悠悠小仙仙于 2019-6-11 14:41 编辑

声明：初学scrapy，总结学习内容。

目录

一、安装scrapy

二、创建工程

三、编写代码

3.1 item文件编写

3.1 spider文件编写

3.2 pipeline文件编写

3.3 setting文件修改

四、测试

一、安装scrapy
pip install scrapy
二、创建工程
scrapy startproject mySpider                   #创建scrapy工程
cd mySpider                                           #进入工程目录
scrapy genspider itcast "www.itcast.cn"    #创建爬虫（spider名不能与project名相同）
三、编写代码
3.1 item文件编写
items用于存储字段的定义。即爬取的内容存与item类中。

3.1 spider文件编写

3.2 pipeline文件编写
pipeline文件用于存储到文件中。

3.3 setting文件修改
其他配置暂且不用修改，只修改pipeline配置。

四、测试
scrapy crawl itcast                      #运行爬虫

Miss_love · 发表于 2020-12-30 16:02:19

支持

		自动登录	找回密码
密码			(注-册)加入51Testing

scrapy爬虫框架简单实例

本帖子中包含更多资源

站长推荐 /1