《Python网络安全项目实战》项目5 编写网站扫描程序

项目目标：
任务5.1 暴力破解网站目录和文件位置
- 任务描述
- 任务分析
- 任务实施
- 相关知识
- 任务评价
任务5.2 制作网页JPG爬虫
- 任务分析
- 任务实施
- 相关知识
- 任务评价
- 任务拓展

WEB网站安全渗透测试过程中需要进行目录扫描和网站爬行，网上可以找到一些不错的工具软件，但是对于别人写的工具是否安全可靠有待商榷，所以我们如果能够写出自己的网站扫描和爬行程序，对于我们的工作会有极大的帮助。
使用Python的标准网络模块编写网络工具软件非常方便，这里我们使用Python完成网站扫描程序的编写。

项目目标：

 熟悉使用Python进行网站扫描程序的编写。

任务5.1 暴力破解网站目录和文件位置

任务描述

当我们通过sql注入等方式得到网站的数据库时，由于后台一般是隐藏起来的，所以我们想要登陆后台的话，还是要手工或者以暴力破解的方式找到后台。

任务分析

对一个站点目录和文件进行扫描，那么就需要用Python3环境下requests模块。扫描目录主要是对网站地址发出请求，若网站存在这个地址则会返回状态码200，如果不存在则会返回404，如果是没有权限访问，或者是其他一些情况，都会有相应的状态码，我们主要是需要访问成功的状态码和地址就可以了。
Requests 是使用 Apache2 Licensed 许可证的 HTTP 库, 支持 HTTP 连接保持和连接池，支持使用cookie 保持会话，支持文件上传，支持自动确定响应内容的编码，支持国际化的 URL 和 POST 数据自动编码。本次任务要扫描的WWW服务器就搭建在本机上，我们在本机搭建了一个Discuz网站，计划扫描的网址是：http://127.0.0.1/Discuz/upload。
pathlist.txt是预先准备的字典文件，包含网站常用文件路径的字符串列表。
应用字典碰撞的原理，使用上万条字典条目进行碰撞。字典中包括常用网站的含有路径的文件名，获得有反馈的条目记录，其中就体现出了常用网站的目录结构。

任务实施

实验环境：windows 7、phpstudy、php5.4.45、apache、mysql5.0.10。
【步骤1】：建立pathlist.txt,我们将这些文件夹的名字保存进一个TXT文件中，建立一个目录字典，再加一些这个目录中没有的文件名扩展程序可查找文件范围，如图5-1-1所示。
在这里插入图片描述

图5-1-1 建立字典文件
【步骤2】：对网站的请求我们需要用requests模块中的一些方法，所以在写之前需要引用requests模块，如图5-1-2所示。
在这里插入图片描述

图5-1-2 引用requests模块
【步骤3】：我们需要对一个网站进行扫描，那么就需要一个网站的地址，和一个扫描的字典，如图5-1-3所示。
在这里插入图片描述

图5-1-3 定义变量接收网址和字典
【步骤4】：因为我们要将字典与网站路径结合形成一个新的url，每形成一个新的url，就对这个url进行一次请求，所以我们用for来实现，如图5-1-4所示。
在这里插入图片描述

图5-1-4 对地址进行请求，并返回状态码
【步骤5】：在接收到每个地址返回的状态码之后，我们需要对这些信息进行判断和输出，如图5-1-5所示。
在这里插入图片描述

图5-1-5 对结果进行判断打印
【步骤6】：在编写完python程序之后，我们对程序进行测试，在本地安装phpstudy，打开phpstudy的安装目录，www文件夹是用来放置web站点文件的，如图5-1-6所示。
在这里插入图片描述

图5-1-6 phpstudy目录
【步骤7】：打开www文件夹，我们将Discuz站点放置进来，如图5-1-7所示。
在这里插入图片描述

图5-1-7 所有网站主目录
【步骤8】：Discuz需要在web界面去安装一下，一路下一步就可以安装完成，打开Discuz的目录，所有的网站文件都会放在upload文件夹中，如图5-1-8所示。
在这里插入图片描述

图5-1-8 Discuz站点安装目录
【步骤9】：Discuz网站的目录中有一些文件和文件夹，这些都是我们需要用python来扫描的，如图5-1-9所示。
在这里插入图片描述

图5-1-9 Discuz网站主目录
【步骤10】：做完这些，我们启动我们的phpstudy，看到apache和mysql成功运行，就可以了，如果启动不成功，则重试一次，如图5-1-10所示。
在这里插入图片描述

图5-1-10 启动运行phpstudy
【步骤11】：看网站是否可以打开，打开浏览器，输入6，如图5-1-11所示。
在这里插入图片描述

图5-1-11 访问Discuz网站
【步骤12】：运行我们之前写好的python脚本，扫描搭建好的站点，扫描结果列出了我们需要的网站目录，如图5-1-12所示。
在这里插入图片描述

图5-1-12 运行脚本显示结果
【步骤13】：用netstat -an命令查看本地的网络连接端口，如图5-1-13所示。
在这里插入图片描述

图5-1-13 查看网络连接

任务评价

在这里插入图片描述

合计 50
任务拓展
Time模块的主要功能是什么？

任务5.2 制作网页JPG爬虫

任务描述

在我们日常上网浏览网页的时候，经常会看到一些好看的图片，我们就希望把这些图片保存下载，或者用户用来做桌面壁纸，或者用来做设计的素材。
常规的做法就是通过鼠标右键，选择另存为。但有些图片鼠标右键的时候并没有另存为选项，还有办法就通过就是通过截图工具截取下来，但这样就降低图片的清晰度。
这里可以通过python来实现这样一个简单的爬虫功能，把我们想要的图片爬取并下载到本地。下面就看看如何使用python来实现这样一个功能。