关键单词释义
如果第一次接触爬虫代码,相信有几个单词大家很陌生,为了方便记忆我把他们归类到一起加深印象,你也可以拿出一张白纸试着努力回忆着。
1.爬虫协议库ulrlib、urllib.request
2.正则匹配库rb
3.发送请求方法request()
4.打开页面方法urlopen()
5.读取数据方法read()
6.正则表达式-所有图片【\S】*.jpg
7.匹配模式定义compile()
8.查找匹配findall()
9.循环遍历语句 for a in b
10.打开文件 并命名 with open()... as fb
11.写到... write*()
12.输出语句 print()
到现在为止可以把我上面的代码在pycharm中打开尝试着运行起来吧!
最后,有2个报错信息汇总供参考: 1. module 'urllib' has no attribute 'requset'
定位到当行语句,发现request 单词拼写错误。 2. 没有报错,但是图片没有下载成功
重新检查代码,发现正则表达式写的有错误,记住是大写的S修改完之后看效果。