import urllib #导入urllib包 import urllib.request#导入urllib包里的request方法 import re #导入re正则库 |
def load_page(url): request=urllib.request.Request(url)#发送url请求 response=urllib.request.urlopen(request)#打开url网址 data=response.read()#读取页面数据 return data#返回页面数据 |
def get_image(html): regx=r'http://[\S]*jpg' #定义正则匹配公式 pattern=re.compile(regx)#构造匹配模式,速度更快 get_image=re.findall(pattern,repr(html))#repr()将内容转化为字符串形式,findall列表形式展示正则表达式匹配的结果 num=1 #定义变量控制循环 for img in get_image: #定义变量遍历数组 image=load_page(img)#将图片路径传入加载函数 with open('F:\\photo\\%s.jpg'%num,'wb') as fb: #以只读方式打开图片并命名 fb.write(image) #写入内容 print('正在下载第%s张图片'%num) num=num+1 #变量递增 print("下载完成") |
#调用函数 url='http://p.weather.com.cn/2019/10/3248439.shtml' #传入url路径 html=load_page(url)#加载页面 get_image(html)#图片下载 |
欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/) | Powered by Discuz! X3.2 |