【背景】
有一些非常不错的资源网站,比如一些MP3资源网站。资源很丰富,但是每一个资源都不大,一个一个下载费时费力,想用Python快速实现可复用的批量下载程序。
【思路】
获得包含资源链接的静态页面,用beautifulsoup分析页面,获得所有MP3资源的实际地址,然后下载。通过提前获得资源列表长度可以在程序中实时获得下载进度。
【问题】
分析网页时,要注意排除那些不是下载资源的链接,比如指向上级文件夹的链接就不应该放到下载的处理步骤中,这些都需要编程来实现,但是逻辑很明确简单,不用担心学不会。
【准备工作】
创建一个名为"file downloader"的文件夹
创建一个名为"grab_file.py"的Py文件
安装模块:pip install bs4
安装模块:pip install requests
【代码】
from bs4 import<