TryHackMe 第3天 | Pre Security (中)

该学习路径讲解了网络安全入门的必备技术知识,比如计算机网络、网络协议、Linux命令、Windows设置等内容。上一篇中简短介绍了计算机网络相关的知识,本篇博客将记录 网络协议 部分。

How the web works?

DNS in detail

DNS (Domain name system,域名解析系统),它为我们提供了一种简单的方式去与互联网上的设备进行通信。

在网络中,数据包要依照 IP 地址来寻找目的地,对于设备而言,IP 地址非常清晰。但对于人类而言,如果要记住每一个想访问的页面的 IP 地址,似乎有点不太现实。因此人们采用域名来代替 IP 地址,日后人们只需要记住域名就可以,域名和 IP 地址之间的转换工作就交给 DNS 处理。这就是 DNS 的作用。

Domain hierarchy

域名也有对应的层次结构,如下图所示:

在域名中, 层级大小从右往左逐渐递减。按照图上内容,我们可以总结出域名的各层结构:

  • TLD (Top-level domain),顶级域名,位于域名最右边。最常见的顶级域名就是 .com。顶级域名一般有两种类型,gTLD ( generic TLD,通用顶级域名) 和 ccTLD (country code TLD,国家代码顶级域)。
  • Second-level domain,二级域名。以 baidu.com 为例,baidu 就是二级域名。在注册域名时,二级域名只能使用 63 个字符,且只能使用 a-z 0-9 和 连字符 “-”(不能以连字符开头或结尾,也不能有连续连字符)。
  • Subdomain,子域名。子域名位于二级域名左侧。以 pan.baidu.com 为例,pan 就是子域名。子域名和二级域名一样,只能使用 63 个字符,且只能使用 a-z 0-9 和 连字符 “-” 构成。子域名没有个数限制,但是必须保证整体的域名长度控制在 253 个字符以内。
DNS record type

DNS 不仅仅适用于网站,因为它还存在多种类型的 DNS record (DNS 记录)。

  • A record,该记录是 IPv4 地址解析结果
  • AAAA record,该记录是 IPv6 地址解析结果
  • CNAME record,该记录会解析到另一个域名上,也称 别名记录。比如 tryhackme 有一个商城子域名 store.tryhackme.com,它的 CNAME 记录为 shops.shopify.com,那么 DNS 的解析顺序就是 store.tryhackme.com --> shops.shopify.com --> shops.shopify.com 的 IP 地址。
  • MX record,该记录会解析到收件人域名的邮箱服务器。这样我们的邮件才能知道该发往何处。
  • TXT record,该记录是自由文本字段,可以存储任何基本文本的数据。该记录有多种用途,最常见的是列出有权代表域名发送电子邮件的服务器,这有助于打击垃圾邮件和识别是否为伪造身份的邮件。
DNS request

DNS 请求过程如下图所示:

  1. 请求域名时,计算机首先会查看本地缓存。若本地缓存存在,则直接使用;不存在就会向 Recursive DNS (递归DNS) 服务器发出请求。
  2. Recursive DNS 服务器通常由 ISP 提供,但也可以自行选择。收到请求后,递归 DNS 服务器也会先查询其本地缓存。若本地缓存中存在,则直接返回结果,请求结束;若无法找到,则会从 Root DNS (根 DNS) 服务器中进行寻找。
  3. 根 DNS 服务器是互联网的 DNS 主心骨,它们的工作是根据请求将其重定向到正确的 TLD (顶级域名) 服务器上。比如要访问 www.tryhackme.com,根 DNS 服务器会将其转给 .com 顶级域名服务器去处理。
  4. TLD 服务器保存的是能正确回应 DNS 请求的 Authoritative server (权威服务器)的记录。权威服务器也被称为域名的 nameserver (名称服务器)。一个域名通常会有多个名称服务器,以便在其中一个出现故障时作为备份。
  5. 权威 DNS 服务器负责存储特定域名的 DNS record,也负责对域名的 DNS record进行更新。根据记录的 record 类型不同,DNS record 会被发送回递归 DNS 服务器,在那里进行本地缓存,以便将来的请求,然后再将 DNS record 转发给发起请求的计算机。

HTTP in detail

HTTP (Hypertext transfer protocol),超文本传输协议。它是一套用于与网络服务器通信的规则,用于传输网页数据(包括 HTML、图像、视频等)。

HTTPS (Hypertext transfer protocol secure),是 HTTP 的安全版本。HTTPS 的数据经过加密,因此它能阻止别人看到你发送和接受的数据,也可以确保你在与正确的网络服务器沟通而不是和冒充的服务器。

Requests & responses

当我们访问网站时,浏览器需要向网络服务器发起 requests (请求),然后服务器再给我们 responses (响应)。

但在请求时,我们需要告诉浏览器访问这些资源的具体方式和它们所在的地点,这就是 URL (Uniform resource locator,统一资源定位器) 的作用所在。下图展示了 URL 的所有功能,但注意,不是所有的请求都会用到这些功能:

  • Scheme,它表明用何种协议访问资源,如 HTTP、HTTPS、FTP
  • User,有些服务需要认证身份,可以在 URL 中输入用户名和密码
  • Host (Domain),我们想访问的域名或 IP 地址
  • Port,我们想连接的端口号
  • Path,我们想访问的资源名字或位置
  • Query string,额外信息位,比如 /blog?id=1 就表示要访问 /blog 路径,且希望获得 id=1 的文章。
  • Fragment,对请求的实际页面上的某个位置的引用。通常用于内容较长的页面,可以直接链接到页面的某一部分。
HTTP methods

HTTP methods 是客户端发起 HTTP 请求时预期的一个操作。HTTP methods 有很多方法,但更常见的还是 GET 和 POST 方法。

  • GET,用于从 Web 服务器上获取资源
  • POST,用于向 Web 服务器提交数据,并可能创建新的记录
  • PUT,向 Web服务器提交数据以进行信息更新
  • DELETE,从 Web 服务器上删除信息或记录
HTTP status codes

当 Web 服务器响应了我们的 HTTP 请求时,它会发送一个 HTTP 响应数据包,其中就包含了 status codes (状态码)。这些状态码用于告知客户端请求的结果及可能的处理方式,一般可以分为五种:

  • 1xx,information response。告知客户端其请求的一部分已被接受,接下来应该继续发送请求的其余部分。
  • 2xx,success。告知客户端请求成功。
  • 3xx,redirection。告知客户端请求重定向到另一个资源。
  • 4xx,client errors。告知客户端请求出现了问题。
  • 5xx,server errors。告知客户端,服务器在处理请求时出现了问题。

常见的状态码如下表所示:

200 - OK请求成功
201 - Created资源已创建 (例如新用户或新的博文)
301 - Moved permanently将浏览器重定向到一个新网页,或告诉搜索引擎该网页已转移到其他地方
302 - Found与 301 类似,但不同的是该状态码表示暂时性的更改,在不久的将来可能会再次更改
400 - Bad request告诉浏览器请求中出现了错误或丢失了某些内容
401 - Not authorised未进行身份授权前,不允许查看该资源
403 - Forbidden无论用户是否登录,都没有权限访问该资源
404 - Page not found资源不存在
405 - Method not allowed资源不允许使用该请求方式请求
500 - Internal server error服务器在处理请求时遇到某种错误,无法正确处理
503 - Service unavailable服务器由于超负荷或正在进行维护,无法处理请求
Headers

Headers 信息分为 请求 headers 和 响应 headers。前者通常由客户端发送给 Web 服务器;后者是 Web 服务器对于客户端请求的响应。

常见的 请求 headers 包含:

  • Host,一些 Web 服务器上会托管多个网站,通过该信息可以告诉服务器要访问的网站,否则就是访问服务器的默认网站。
  • User-Agent,客户端的浏览器软件和版本号,告知服务器你使用的浏览器软件有助于它为你的浏览器正确格式化网站。
  • Content-Length,向 Web 服务器发送数据时,该信息会告诉服务器该请求有多少数据,这样服务器能确保不会丢失任何数据。
  • Accept-Encoding,告诉 Web 服务器浏览器支持哪些类型的压缩方法,以便在互联网上传输数据时将数据压缩得更小。
  • Cookie,发送给 Web 服务器以让服务器记住关于用户的信息。

常见的 响应 headers 包含:

  • Set-Cookie,每次请求时需要发送回 Web 服务器的要存储的数据。
  • Cache-Control,再次请求之前,响应内容在浏览器缓存中的存储时间。
  • Content-Type,告知客户端返回的数据类型,如 HTML、图像、视频等。通过该信息,浏览器就能知道如何处理这些数据。
  • Content-Encoding,确定了压缩数据的方法。
Cookies

Cookies 是存储在用户电脑上的一小段数据,当用户从 Web 服务器上收到 Set-Cookie 头信息时,Cookie 就被保存下来了。之后,每一次请求都会向 Web 服务器发送这个 Cookie 数据。由于 HTTP 是无状态的,所以 Cookie 可以用于提示 Web 服务器用户的身份、用户是否登陆过、用户的个人设置等。

Cookie 示意图

Cookie 可以用于多种目的,但最常用于网站验证。Cookie 的值通常不是明文,而是不易被人猜到的唯一密文。

How websites work

当我们访问一个网页时,浏览器会向 Web 服务器发送请求,请求有关我们正在访问的页面的信息。网站由两个主要部分组成:

  • Front end (前端),用户侧,这是浏览器渲染网站的方式
  • Back end (后端),服务器侧,处理用户请求并响应

前端页面由 HTML、JavaScript、CSS 三部分组成。HTML 用于构建网站并定义其结构,JavaScript 用于实现交互功能,CSS 用来让网站更加漂亮。首先简单介绍 HTML。

HTML

HTML 是网站的编程语言,元素 (也被称为 标签)是 HTML 页面的组成部分,他告诉浏览器如何显示内容。比如下面就是一段 HTML 代码:

<!DOCTYPE html> <!-- 定义页面是 HTML5 文档-->
<html> <!-- HTML 页面的根元素 --><head> <!-- 该元素包含有关页面的信息 --><title>Page Title</title></head><body> <!-- 该元素定义 HTML 文档的正文 --><h1>Example Heading</h1> <!-- 大标题元素--><p>Example paragraph..</p> <!-- 段落元素 --></body>
</html>

元素也可以包含一些属性,比如 class 属性,这样可以被用来为元素设计样式。一个元素可以有多个属性,每个属性都有自己独特的用途。

元素还可以拥有 唯一的 id属性,这是元素的唯一标识。id属性一般用于样式设计和 JavaScript 识别。

JavaScript

JavaScript (JS) 是世界上最流行的编程语言之一,可以让网页实现交互,如果没有 JS,那么网页就不会有互动元素。

JS 添加在页面源代码中,用 <script> 标记,也可以通过 src 属性远程包含。

Sensitive data exposure

假如网站没有适当保护终端用户的敏感明文信息时,就会发生敏感数据泄露。

如上图所示,通过开发者工具查看源代码后,发现其中出现了未被删除的敏感信息。这些情况往往是开发人员之前用于测试,但后面忘记删除导致。这种敏感数据泄露可能会被攻击者利用,扩大攻击面。

因此,在进行安全检查时,第一步就是查看源代码,看看是否有敏感信息泄露的问题。

HTML injection

HTML 注入指页面上显示未经过滤的用户输入时发生的漏洞。如果网站未对用户输入进行消毒和过滤,而该输入被用于该页面,则攻击者就可以在该网页中注入 HTML 代码。

如上图所示,网页并未对用户输入进行任何过滤。假设攻击者构建了一段恶意 HTML 或 JS 代码就会被直接执行。

上图可能还体现不出危害,那我们假设这样一个场景,网页在登录界面有 HTML 注入漏洞。攻击者可以构造一个恶意的表单提交元素 <form>,这样恶意表单会被执行。后面普通用户使用该表单进行登录时,其用户名和密码就被传输给攻击者了。

因此防止 HTML 注入漏洞的规则就是决不相信用户输入。为防止恶意输入,开发人员应该在使用用户输入前就对其内容进行过滤消毒。

Putting it all together

根据前面的介绍,可以总结出浏览器访问一个网页时它会进行的操作:

  1. 当我们请求网页时,电脑需要知道对应 Web 服务器的 IP 地址。这是需要使用 DNS 来获取。
  2. 获得 IP 地址后,将使用 HTTP 协议与服务器发起对话,请求网页资源。
  3. 服务器收到请求,将 HTML、JS、CSS、图像等信息响应回去。
  4. 浏览器收到这些信息,将其正确地格式化,显示出来。
Other components

在访问一个网页时,涉及到的技术绝对不止上述步骤所提到的。接下来会简要介绍几个可能会存在的技术。

Load balancers

Load balancers,负载均衡。当一个网站的流量相当巨大或者服务器要运行一个高可用性的应用程序时,一台服务器可能无法胜任。此时就可以架设多个服务器进行负载均衡,其一是可以确保高流量网站能处理负载,其二是当服务器反应迟钝时可以提供故障切换。

负载均衡在收到请求时会使用不同算法来确定选择哪个服务器处理请求,这些算法包括 round-robin (轮询算法,将请求依次发送到每个服务器) 和 weighted (加权算法,检查服务器当前处理的请求数,将请求发送给最不繁忙的服务器)。

负载均衡还会对每台服务器进行定期检查,确保它们运行正常,这叫做 health check。当服务器响应不当或没有响应,负载均衡将停止发送流量,直至服务器再次做出适当响应。

CDN

CDN (Content delivery networks),内容分发网络。CDN 允许托管网站上的静态文件到世界各地的服务器上。当用户请求网站时,CDN 会计算距离用户最近的服务器物理位置,并将请求发送到该服务器上。这有效地减少了网站访问时间。

Databases

数据库用于存储网站中的用户信息,Web 服务器可以与数据库通信,进而可以存储和调用其中的数据。常见的数据库有 MySQL、MSSQL、MongoDB、Postgres 等。

WAF

WAF (Web application firewall),网络应用防火墙。它位于网络请求到 Web 服务器之间,主要目的就是保护 Web 服务器免受黑客攻击或 DDos攻击。它能分析网络请求中常见的攻击技术,分析请求是否来自真正的浏览器而不是机器人。

How web servers work
Web server

Web 服务器是一种软件,它侦听传入的连接,然后利用 HTTP 协议向客户端传送网络内容。常见的 Web 服务器软件有 Apache、Nginx、IIS 和 NodeJS。Web 服务器本质上也是从软件设置中定义的根目录上传输文件。比如我们要请求一张图片,实际上 Web 服务器就在本地路径 /var/www/html/picture.jpg (假设是这个路径) 上将该图片传输过去。

Virtual host

虚拟主机。Web 服务器可以托管具有不同域名的多个网站,这就是基于 虚拟主机 技术做到的。Web 服务器会检查 HTTP 请求头中的 Host 字段,并将其与虚拟主机进行匹配,若匹配成功,则会提供正确的网站;不匹配的话则提供默认网站。

Static & dynamic content

静态内容就是永不改变的内容,如图片、JS代码、CSS、HTML等。这些文件都是直接从 Web 服务器发送而来,不会对其进行任何更改。

动态内容指可以随不同请求而改变的内容。比如博客首页会根据文章热度改变展示的博文,博客的搜索页面也会根据不同的搜索词显示不同结果。这些内容的更改都由后端完成,我们无法知道后端做了什么。

Scripting & backend languages

后端语言可以与数据库交互、调用外部服务、处理用户传入的数据等,这些正是网站与用户互动的关键所在。常见后端语言有 PHP、Python、Ruby、NodeJS、Perl 等。

在客户侧是看不到任何的后端语言代码的,因为它在后台完成活动。不过虽然看不到后端代码,但它们仍然会给 Web 程序带来安全问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/429151.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java面试篇-AOP专题(什么是AOP、AOP的几个核心概念、AOP的常用场景、使用AOP记录操作日志、Spring中的事务是如何实现的)

文章目录 1. 什么是AOP2. AOP的几个核心概念3. AOP的常用场景4. 使用AOP记录操作日志4.1 准备工作4.1.1 引入Maven依赖4.1.2 UserController.java4.1.3 User.java4.1.4 UserService.java 4.2 具体实现&#xff08;以根据id查询用户信息为例&#xff09;4.2.1 定义切面类&#x…

SkyWalking 环境搭建部署

架构简介 skywalking agent : 和业务系统绑定在一起,负责收集各种监控数据skywalking oapservice : 是负责处理监控数据的,比如接受skywalking agent的监控数据,并存储在数据库中;接受skywalking webapp的前端请求,从数据库查询数据,并返回数据给前端。Skywalking oapserv…

华为HarmonyOS地图服务 7- 在地图上绘制标记

场景介绍 本章节将向您介绍如何在地图的指定位置添加标记以标识位置、商家、建筑等。 点标记用来在地图上标记任何位置,例如用户位置、车辆位置、店铺位置等一切带有位置属性的事物。Map Kit提供的点标记功能(又称 Marker)封装了大量的触发事件,例如点击事件、长按事件、…

【RabbitMQ】消息分发、事务

消息分发 概念 RabbitMQ队列拥有多个消费者时&#xff0c;队列会把收到的消息分派给不同的消费者。每条消息只会发送给订阅该队列订阅列表里的一个消费者。这种方式非常适合扩展&#xff0c;如果现在负载加重&#xff0c;那么只需要创建更多的消费者来消费处理消息即可。 默…

linux网络编程5

24.9.21学习目录 一.TCP1.TCP流程2.TCP相关函数3.三次握手 一.TCP 1.TCP流程 服务器流程&#xff1a; 创建套接字socket&#xff08;&#xff09;将套接字与服务器网络信息结构体绑定bind&#xff08;&#xff09;将套接字设置为监听状态listen&#xff08;&#xff09;阻塞等…

进程间的通信4 共享内存

共享内存 1.共享内存简介 共享内存是将分配的物理空间直接映射到进程的用户虚拟地址空间中&#xff0c;减少数据在内核空间缓存共享内存是一种效率较高的进程间通讯的方式在 Linux 系统中通过 ipcs -m 查看所有的共享内存 共享内存模型图 2.共享内存的创建 1.函数头文件 #…

Java算法专栏

专栏导读 在当今这个技术日新月异的时代&#xff0c;Java算法作为软件开发的核心&#xff0c;对于提升程序性能和解决复杂问题至关重要。本“Java算法”专栏旨在帮助读者深入理解Java编程语言中的算法原理和应用&#xff0c;通过实战案例和深入分析&#xff0c;使读者能够掌握…

Java汽车销售管理

技术架构&#xff1a; springboot mybatis Mysql5.7 vue2 npm node 功能描述&#xff1a; 针对汽车销售提供客户信息、车辆信息、订单信息、销售人员管理、财务报表等功能&#xff0c;提供经理和销售两种角色进行管理 效果图&#xff1a;

Python基础学习(3)

目录 一&#xff0c;函数 1&#xff0c;函数的定义 2&#xff0c;函数的参数 1&#xff0c;默认值 2&#xff0c;传参 3&#xff0c;返回值 4&#xff0c;变量的作用域 5&#xff0c;函数的调用 二&#xff0c;常用数据结构 1&#xff0c;列表 列表的定义 列表的特性…

【Geoserver使用】REST API调用(工作空间部分)

文章目录 前言一、Geoserver REST API(GeoServer Workspace)二、GeoServer Workspace接口使用1.GET请求 /workspaces2.POST请求 /workspaces3.GET请求 /workspaces/{workspaceName}4.PUT /workspaces/{workspaceName}5.DELETE /workspaces/{workspaceName} 总结 前言 根据Geos…

C++ | Leetcode C++题解之第423题从英文中重建数字

题目&#xff1a; 题解&#xff1a; class Solution { public:string originalDigits(string s) {unordered_map<char, int> c;for (char ch: s) {c[ch];}vector<int> cnt(10);cnt[0] c[z];cnt[2] c[w];cnt[4] c[u];cnt[6] c[x];cnt[8] c[g];cnt[3] c[h] - …

YOLOv10 简介

YOLOv10&#xff0c;由清华大学的研究人员基于 Ultralytics Python 包构建&#xff0c;引入了一种全新的实时目标检测方法&#xff0c;该方法解决了以往 YOLO 版本中后处理和模型架构方面的不足。通过消除非极大值抑制&#xff08;NMS&#xff09;并优化各种模型组件&#xff0…

【解决】chrome 谷歌浏览器,鼠标点击任何区域都是 Input 输入框的状态,能看到输入的光标

chrome 谷歌浏览器&#xff0c;鼠标点击任何区域都是 Input 输入框的状态&#xff0c;能看到输入的光标 今天打开电脑的时候&#xff0c;网页中任何文本的地方&#xff0c;只要鼠标点击&#xff0c;就会出现一个输入的光标&#xff0c;无论在哪个站点哪个页面都是如此。 我知道…

十四、运算放大电路

运算放大电路 1、理想运算放大器的概念。运放的输入端虚拟短路、虚拟断路之间的区别; 2、反相输入方式的运放电路的主要用途&#xff0c;以及输入电压与输出电压信号的相位 3、同相输入方式下的增益表达式(输入阻抗、输出阻抗)

Redis-01 入门和十大数据类型

Redis支持两种持久化方式&#xff1a;RDB持久化和AOF持久化。 1.RDB持久化是将Redis的数据以快照的形式保存在磁盘上&#xff0c;可以手动触发或通过配置文件设置定时触发。RDB保存的是Redis在某个时间点上的数据快照&#xff0c;可以通过恢复RDB文件来恢复数据。 2.AOF持久化…

55. QTableWidget的基本使用

1. 说明 在软件界面开发中,基本上离不开数据的展示以供客户查看一些比较关注的信息,比如公司做一个员工个人信息管理系统,需要一个界面能够展示员工个人基本信息,实现这种效果可以采用多种形式,其中比较简单的一种是使用QT提供的QTableWidget控件,这个控件已经封装了一些…

LeetCode 面试经典150题 190.颠倒二进制位

复习知识&#xff1a;正数的原码、反码、补码相同&#xff0c;负数的反码在其原码的基础上, 符号位不变&#xff0c;其余各个位取反&#xff0c;负数的补码是在其原码的基础上, 符号位不变, 其余各位取反, 最后1 (即在反码的基础上1)。 题目&#xff1a;颠倒给定的 32 位无符号…

Springboot3 + MyBatis-Plus + MySql + Uniapp 商品加入购物车功能实现(最新教程附源码)

Springboot3 MyBatis-Plus MySql Uniapp 商品加入购物车功能实现&#xff08;针对上一篇sku&#xff09; 1、效果展示2、后端代码2.1 model2.2 mapper server serverImpl 参照上一篇自动生成2.3 controller 3、前端代码3.1 index.js3.2 shop-info.vue3.3 ShopBottomButton.v…

计算机毕业设计hadoop+spark+hive新能源汽车销售数据分析系统 二手车销量分析 新能源汽车推荐系统 可视化大屏 汽车爬虫 机器学习

《HadoopSparkHive新能源汽车销售数据分析系统》开题报告 一、选题背景与意义 1.1 选题背景 随着全球对环境保护意识的增强和能源结构的转型&#xff0c;新能源汽车市场迅速崛起。新能源汽车的销售数据不仅反映了市场趋势和消费者偏好&#xff0c;还为企业决策、政府监管和政…

【玉米田】

题目 代码 #include <bits/stdc.h> using namespace std; typedef long long LL;const int mod 1e8; const int M 1 << 12; LL f[13][M]; int g[13]; vector<int> state; vector<int> p[M]; int n, m; bool check(int x) {return !(x & x <&…