import requests
from lxml import etree
startUrl='http://www.xiaohuar.com/list-1-'
headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.108 Safari/537.36'
}
for i in range(10):url=requests.get(startUrl+str(i)+'.html',headers=headers).content.decode('gbk')story=etree.HTML(url)photo_name=story.xpath('//div[@class="img"]')try:for i in photo_name:name=i.xpath('./a/img/@alt')[0]photo=i.xpath('./a/img/@src')[0]photo='http://www.xiaohuar.com'+str(photo)img = requests.get(photo,headers=headers,stream=True).contentwith open('img/'+str(name)+'.jpg','wb') as f: //这里我用的是相对路径保存的图片,可自行修改为绝对路径,避免下载后找不到文档…… f.write(img)print("正在下载:",name)except:print('当前页面所有美眉图片下载完毕!')//如有不清楚的地方可发信息给我询问http://www.dukaijie.com
上一篇:阿里,似乎又有了新的可能 7月5日,腾讯旗下音频平台企鹅 FM 发布下线公告,公告称,由于业务调整 ,企鹅FM很遗憾要和大家说再见了。即日起,企鹅FM将关闭用户注册及充值功能,并在…