python-爬取壁纸

代理池的，防止IP 被封

找到图片真实地址

现在看到的只是图片的预览地址 (previews)

1.检查：

2.鼠标变为箭头时查看网页源代码

关于怎样在源代码中找到图片的真实地址 ???

为什么在源代码界面 ctrl f 时候搜索的是 .png ???

首先图片地址是以 .jpg .png .jpeg 结尾

真实的图片地址是：

"contentUrl":"https://img3.wallspic.com/crops/0/5/0/6/7/176050/176050-old_paria_utah-paria-kanab-paria_river-towers_of_the_virgin-6319x4324.jpg"

用正则表达式匹配，只匹配高像素源图片

(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)

如果是下面的内容，则会连缩略图也匹配到

(r'"contentUrl":"(.*?)"',req)

最终代码：

import requests
import reurl = 'https://wallspic.com/cn/album/ji_shu/for_desktop'response = requests.get(url = url).textcontentUrl = re.findall(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)
j = 0
for i in contentUrl:j += 1Content = requests.get(url = i).contentprint(i)with open(f'Wallspic-{j}.jpg', mode = 'wb') as f:f.write(Content)print(f'[+] 壁纸{j}保存完成！')

最终结果是以.jpg的形式输出的

也可以以 .png的形式输出，.png是益处多多

Desktop Wallpapers - Download HD Desktop Backgrounds

https://wall.alphacoders.com/by_sub_category.php?id=170792&name=Black+Wallpapers

下载的慢可能是网速的原因，需要翻墙；或者给 idea 配置代理，

刷新电脑本地的线路，保持畅通。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

import requests
import redef download_wallpapers(start_page, end_page):for page in range(start_page, end_page+1):url = f'https://wallspic.com/cn/album/dianying/popular?page={page}'response = requests.get(url=url).textcontentUrl = re.findall(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)j = 0for i in contentUrl:j += 1Content = requests.get(url = i).contentprint(i)with open(f'p-{page}-{j}.jpg', mode = 'wb') as f:f.write(Content)print(f'[+] 壁纸{page}-{j}保存完成！')
# 下载第1页到第55页的壁纸
download_wallpapers(1, 55)

这段代码的作用是从wallspic.com网站下载电影壁纸，具体解读如下：

导入requests和re模块：

import requests
import re

定义一个函数download_wallpapers，该函数接受两个参数：起始页码start_page和结束页码end_page。

def download_wallpapers(start_page, end_page):

使用for循环遍历从start_page到end_page的所有页码。

for page in range(start_page, end_page+1):

构造每个页面的URL，并使用requests.get()方法获取页面的HTML文本。

url = f'https://wallspic.com/cn/album/dianying/popular?page={page}'
response = requests.get(url=url).text

使用正则表达式从HTML文本中提取出所有壁纸的下载链接。

contentUrl = re.findall(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)

使用for循环遍历所有壁纸的下载链接，并使用requests.get()方法下载每个壁纸。

for i in contentUrl:Content = requests.get(url = i).content

将每个壁纸保存到本地，并打印出保存完成的信息。

with open(f'p-{page}-{j}.jpg', mode = 'wb') as f:f.write(Content)print(f'[+] 壁纸{page}-{j}保存完成！')

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/216689.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python-爬取壁纸

相关文章

恢复出厂设置后在 Android 上恢复照片的 6 种常用方法

Unity中Shader URP的安装与设置

UI设计中的肌理插画是什么样的？

第一个“hello Android”程序

计算机视觉（P2）-计算机视觉任务和应用

【虹科分享】基于Redis Enterprise，LangChain，OpenAI 构建一个电子商务聊天机器人

vue中预览pdf的方法

Python编程进阶：轻松掌握多线程和多进程

HarmonyOS4.0从零开始的开发教程12给您的应用添加弹窗

智慧路灯杆如何实现雪天道路安全监测

跨境电商如何利用跨境客服软件提升销售额

STM32的看门狗(WDG)

5G工业物联网网关，比4G工业网关强在哪里？

postman脚本生成可执行文件（6）

桌面便签软件哪个好用?可以放在桌面上的便签软件使用哪个

three.js(一)

从零开始：VuePress2 + GitHub Pages 搭建你的第一个免费博客网站

Linux的基本指令和权限的知识

Android Studio中配置Flutter插件，创建小项目“hello world”

文件系统理解