SpringCloudGateway--Sentinel限流、熔断降级

一、概览

二、安装Sentinel

三、微服务整合sentinel

四、限流

1、流控模式

①直接

②关联

③链路

2、流控效果

①快速失败

②Warm Up

③排队等待

五、熔断降级

1、慢调用比例

2、异常比例

3、异常数

一、概览

SpringCloudGateway是一个基于SpringBoot2.x的API网关，它可以帮助实现路由、过滤、容错等功能，同时也是微服务架构中不可或缺的一部分。在这篇博客中，将会了解到如何使用Sentinel实现SpringCloudGateway的限流、熔断降级。

Sentinel是一个轻量级的流量控制框架，它可以帮助我们实现熔断降级、限流等功能，同时也可以与SpringCloudGateway无缝集成。通过使用Sentinel，可以有效地保护微服务架构免受故障和异常的影响。

二、安装Sentinel

官方提供了UI控制台，下载地址：https://github.com/alibaba/Sentinel/releases

将下载好的jar包放到任意非中文路径目录，使用java命令启动，可以修改Sentinel的默认端口、账户、密码；server.port默认8080，sentinel.dashboard.auth.username默认sentinel，sentinel.dashboard.auth.password默认sentinel。

比如我这里放到D盘的Jar文件夹，启动时换成2500端口，命令如下：

java -Dserver.port=25000 -jar  D:\Jar\sentinel-dashboard-1.8.2.jar

启动之后访问：http://localhost:25000/，账户密码都是sentinel，第一次启动后界面是空白的，因为还没有进行相关微服务项目的整合。

三、微服务整合sentinel

SpringCloudGateWay项目参考：SpringCloudGateway--自动路由映射与手动路由映射_雨欲语的博客-CSDN博客，源码下载地址：

GitHub - dengyifanlittle/littledyf-test: my-test

添加依赖：

        <!-- https://mvnrepository.com/artifact/com.alibaba.cloud/spring-cloud-starter-alibaba-sentinel --><dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-sentinel</artifactId><version>2020.0.RC1</version></dependency>

添加配置文件：

spring:cloud:sentinel:transport:# 服务监控端口dashboard: localhost:25000# 默认 8719，如果8719被占用了会自动从 8719 开始依次 +1 扫描，直至找到未被占用的端口port: 8719

四、限流

启动项目，访问：http://localhost:9999/service/nacos/test，这时再刷新sentinel界面，里面便有数据了

流控规则页面新增：

资源名：指需要进行流控的资源名称。例如，如果我们需要对某个 API 接口进行流控，那么这个 API 接口的地址就是这个规则的资源名。

针对来源：指需要进行流控的请求来源，可以是单个 IP 地址、应用程序、用户等。例如，我们可以为某个 IP 地址创建一个流控规则，或者为某个应用程序创建一个流控规则，填写微服务名，默认 default（不区分来源）。

         阈值类型/单位阈值：指流控的阈值类型和具体的阈值。阈值类型可以是并发线程数、QPS（每秒请求数）等，具体的阈值则取决于阈值类型。例如，如果阈值类型为并发线程数，那么阈值可以是 100，表示最多只能有 100 个并发线程在访问这个资源

        是否集群：指这个流控规则是否应用于整个集群，如果是，则表示该规则将应用于整个集群范围内的所有实例。如果不是，则表示规则只应用于当前实例。

        流控模式：指当超过阈值时，Sentinel 会采取的流控策略。有三种模式，分别为直接流控模式、关联流控模式、链路流控模式。

①直接流控模式：当资源超过阈值时，直接拒绝请求。这是一种比较常见的流控模式，适用于对请求处理能力要求比较高的场景，如秒杀系统。

②关联流控模式：当资源超过阈值时，拒绝请求的同时，还会对关联的资源进行流控。这种流控模式适用于有些资源的请求频率较低，但是对资源的请求能力有较大的影响的场景，如数据库或者缓存。

③链路流控模式：当资源超过阈值时，不仅会对当前请求进行流控，还会对整个请求链路上的资源进行流控。这种流控模式适用于分布式系统中的场景，例如微服务架构下的请求链路。

        流控效果：指当流控规则触发时，Sentinel 采取的具体流控效果。

①快速失败：在快速失败的流控效果下，当请求被拒绝后，Sentinel会立即返回错误信息，告诉请求方请求被拒绝。这种流控效果适用于对响应时间要求比较高的场景，例如秒杀系统或高并发的API接口。

②Warm Up：在Warm Up的流控效果下，当系统初次启动或资源被重新分配时，Sentinel会允许一部分请求通过，以减缓流控策略的限制，等待系统稳定后再进行全面的流控。这种流控效果适用于需要短时间内承受高流量的场景，例如系统升级或重启。

③排队等待：在排队等待的流控效果下，当请求被拒绝后，Sentinel会将请求放入等待队列中，等待资源可用后再进行处理。这种流控效果适用于对响应时间要求不是很高的场景，例如消息队列或后台任务。

1、流控模式

①直接

新增流控规则，流控模式选择直接模式，阈值类型QPS，单机阈值1：

使用jemeter进行测试，线程数量、现成启动时间、运行次数分别设置为1、1、4：

可以看到有一个成功，三个失败，且失败信息是sentinel默认：

删除原有规则，新增流控规则，流控模式选直接，阈值类型选择并发线程数，单机阈值设置为2，微服务中只启动一个service即可，并修改其中代码：

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;/*** @Author dengyifan* @create 2023/11/1 17:02* @description*/@RestController
@RequestMapping("/nacos")
public class NacosTestController {@GetMapping("/test")public String test() throws InterruptedException {Thread.sleep(2000);return "8088";}
}

并发线程数表示1秒内访问该API接口的线程数，当排队的线程数达到设定的阈值的时候就会进行限流操作，这种通常是出现在访问接口响应很慢的时候，因此代码里面主动休眠2秒模拟。jmeter模拟测试时线程数设置为10，其余为1：

可以看到返回结果中成功两次，其余8次失败，并返回sentinel默认错误信息：

如果将sentinel的流控规则删除，则全部成功：

②关联

新增流控规则，流控模式选择关联，阈值类型选择QPS，单机阈值设置为2，关联资源填写另外的访问接口：

在我们的微服务中新增两个接口：

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;/*** @Author dengyifan* @create 2023/11/1 17:02* @description*/@RestController
@RequestMapping("/nacos")
public class NacosTestController {@GetMapping("/test-one")public String testOne() {return "8088-one";}@GetMapping("/test-two")public String testTwo() {return "8088-two";}
}

在jmeter中线程组设置为1、1、10：

设置两个http请求，分别设置为test-one和test-two：

启动测试，可以发现模拟test-one的接口两个成功，8个失败，模拟test-two的接口10个全部成功，因为设置了关联模式，并且test-one关联了test-two接口，当test-two接口的访问超过2的时候，就会让test-one的处于失败状态。这种：

③链路

对于链路模式，比如A路径会访问到资源C，B路径也会访问到资源C，此时配置链路模式，入口资源设置为A，当访问A达到一定限制就会触发限流，B没有配置，则不会触发。

配置文件增加：

sentinel.web-context-unify=false

在gateway项目中新建Controller和Service：

import com.littledyf.service.SentinelTestService;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;/*** @Author dengyifan* @create 2023/11/9 10:41* @description*/
@RestController
@RequestMapping("/test")
public class SentinelTestController {@Autowiredprivate SentinelTestService sentinelTestService;@GetMapping("/test-sentinel")public String testSentinel() {return sentinelTestService.testSentinel();}
}

import com.alibaba.csp.sentinel.annotation.SentinelResource;
import org.springframework.stereotype.Service;/*** @Author dengyifan* @create 2023/11/9 10:42* @description*/
@Service
public class SentinelTestService {@SentinelResource("sentinel")public String testSentinel() {return "test sentinel";}
}

其中@SentinelResource("sentinel")是手动设置资源名，sentinel只会扫描controller层的资源，service通过注解设置。

新增链路流控：

jmeter添加测试：

启动测试查看结果可发现4次里面3次失败：

2、流控效果

①快速失败

之前流控模式都是使用快速失败，即直接失败，抛出异常。

②Warm Up

warm up是指预热，比如一些秒杀环节，之前系统流量不高，当秒杀开启突然升高，这个时候开启预热模式，让通过的流量缓慢增加，能够达到设定阈值为止，这样能够很好的保护系统。

其中会有一个默认1的coldFactor，该值为3，请求QPS从threshold/3开始，经过设置的预热时间后达到设定的阈值，比如我们现在进行以下设置：

即刚开始有5/3个，后面经过3秒后达到设定的阈值5。

jmeter设置：

启动后可以看到前几秒都有失败的，经过3秒后，就稳定达到5个成功：

③排队等待

排队等待即让请求均匀通过，其实跟漏桶算法是对应的，选择排队等待，必须要将类型设置为QPS，否则是无效的：

jmeter设置：

效果：

五、熔断降级

新增熔断规则界面：

资源名：指需要进行流控的资源名称。例如，如果我们需要对某个 API 接口进行流控，那么这个 API 接口的地址就是这个规则的资源名。

熔断策略：表示触发熔断的条件

①慢调用比例

②异常比例

③异常数

最大RT：当资源的响应时间超过设定的阈值，则统计计数

比例阈值：表示触发熔断的比例阈值，当某个熔断策略的比例超过该阈值，触发熔断

熔断时长：表示触发熔断后，保持熔断状态的时间，一般是为了避免熔断状态过早结束，导致系统负载过高

最小请求数：表述触发熔断的最小请求数，当某个资源的请求数不足该值时，不触发熔断

统计时长：表示熔断策略统计的时间范围，例如最近10秒内的统计数据

1、慢调用比例

为了模拟慢调用，在接口中进行1000毫秒的休眠达到响应慢的作用：


import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;/*** @Author dengyifan* @create 2023/11/1 17:02* @description*/@RestController
@RequestMapping("/nacos")
public class NacosTestController {@GetMapping("/test")public String test() throws InterruptedException {Thread.sleep(1000);return "8088";}
}

熔断设置：

jmeter设置：

结果：

刚运行完之后，在5秒内继续运行，可以看到结果都是失败状态，都被熔断处理了。

2、异常比例

代码修改成会出现异常的情况：

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;/*** @Author dengyifan* @create 2023/11/1 17:02* @description*/@RestController
@RequestMapping("/nacos")
public class NacosTestController {@GetMapping("/test")public String test() throws Exception {String s = null;if (s.equals("1")){return "1";}return "8088";}
}

新增熔断规则，熔断策略选择异常比例：