Python爬虫网页图片

xiaoxiao2021-02-28 122

python环境2.7

今天是学习python第二天，做了一个抓取网页图片的爬虫。代码很简练。

#coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" size=' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 return imglist html = getHtml("https://tieba.baidu.com/p/5052815069") print getImg(html) 其中getHtml（）是由地址获取类文件对象，然后通过正则表达式提取我们需要的图片下载链接。下边是循环保存图片，权威解释看知识库吧O(∩_∩)O~

下边是运行截图

下边是成功截图：

转载请注明原文地址: https://www.6miu.com/read-33829.html

技术

最新回复(0)