【SpringCloud-11】SCA-sentinel

sentinel是一个流量控制、熔断降级的组件，可以替换第一代中的hystrix。 hystrix用起来没有那么方便：

1、要在调用方引入hystrix，没有ui界面进行配置，需要在代码中进行配置，侵入了业务代码。

2、还要自己搭建监控平台dashboard。

而sentinel就很方便，在微服务引入依赖就可以。对于控制台，下载jar包启动运行即可。

下载地址：https://github.com/alibaba/Sentinel/releases

启动：jar -jar sentinel-dashboard-1.7.1.jar &

访问：ip:端口/#/dashboard/home

基本使用：

微服务引入sentinel依赖：

        <!-- Sentinel支持采用 Nacos 作为规则配置数据源，引入该适配依赖 --><dependency><groupId>com.alibaba.csp</groupId><artifactId>sentinel-datasource-nacos</artifactId></dependency>

yml配置：

server:port: 8098
spring:application:name: lagou-service-autodelivercloud:nacos:discovery:server-addr: 127.0.0.1:8848,127.0.0.1:8849,127.0.0.1:8850sentinel:transport:dashboard: 127.0.0.1:8080 # sentinel dashboard/console 地址port: 8719   #  sentinel会在该端口启动http server，那么这样的话，控制台定义的一些限流等规则才能发送传递过来，#如果8719端口被占用，那么会依次+1management:endpoints:web:exposure:include: "*"# 暴露健康接口的细节endpoint:health:show-details: always
#针对的被调用方微服务名称,不加就是全局生效
lagou-service-resume:ribbon:#请求连接超时时间ConnectTimeout: 2000#请求处理超时时间##########################################Feign超时时长设置ReadTimeout: 3000#对所有操作都进行重试OkToRetryOnAllOperations: true####根据如上配置，当访问到故障请求的时候，它会再尝试访问一次当前实例（次数由MaxAutoRetries配置），####如果不行，就换一个实例进行访问，如果还不行，再换一次实例访问（更换次数由MaxAutoRetriesNextServer配置），####如果依然不行，返回失败信息。MaxAutoRetries: 0 #对当前选中实例重试次数，不包括第一次调用MaxAutoRetriesNextServer: 0 #切换实例的重试次数NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RoundRobinRule #负载策略调整
logging:level:# Feign日志只会对日志级别为debug的做出响应com.lagou.edu.controller.service.ResumeServiceFeignClient: debug

微服务启动后，就可以在控制台查看监控情况。

sentinel流量控制：

在sentinel后台进行配置。

资源名：默认请求路径
针对来源：填写微服务名称，默认default（不区分来源）
阈值类型/单机阈值：
QPS：每秒钟请求数量。
线程数：线程处理请求的时候，如果说业务逻辑执⾏时间很⻓，流量洪峰来临时，会耗费很多线程资源，最终可能服务雪崩。
是否集群：是否集群限流
流控模式：
直接：资源调⽤达到限流条件时，直接限流
关联：关联的资源调⽤达到阈值时候限流⾃⼰。⽐如⽤户注册接⼝，需要调⽤身份证校验接⼝，如果身份证校验接⼝请求达到阈值，可以对⽤户注册接⼝进⾏限流。
链路：只记录指定链路上的流量。比如两条链路都调用了nodeA，可以配置只限制某条链路的请求。
流控效果：
快速失败：直接失败，抛出异常
Warm Up：根据冷加载因⼦（默认3）的值，从阈值/冷加载因⼦，经过预热时⻓，才达到设置的QPS阈值。这样可以防止突然暴增导致服务不可用，比如秒杀。
排队等待：匀速排队，让请求匀速通过，阈值类型必须设置为QPS，否则⽆效。
例如， QPS 配置为 5 ，则代表请求每 200 ms 才能通过⼀个，多出的请求将排队等

待通过。超时时间代表最⼤排队时间，超出最⼤排队时间的请求将会直接被拒绝。

排队等待模式下， QPS 设置值不要超过 1000 （请求间隔 1 ms ）。

sentinel服务降级：

Sentinel 降级在调用某个资源出现不稳定状态时（例如调⽤超时或异常⽐例升⾼），对这个资源的调⽤进⾏限制，让请求快速失败，避免影响到其它的资源⽽导致级联错误。当资源被降级后，在接下来的降级时间窗⼝之内，对该资源的调⽤都⾃动熔断。

另外，sentinel不会像hystrix，在时间窗内对每一次请求都尝试自我修复，而是明确在时间窗后才恢复。它的熔断策略是：

RT（平均响应时间）：
RT超过500ms的调用是慢调用，统计最近10000ms内的请求，如果请求量超过10次，且慢调用比例>=0.5，则触发熔断，熔断时长为5秒。
异常比例：
异常比例或异常数：统计指定时间内的调用，如果调用次数超过指定请求数，并且出现异常的比例达到设定的比例阈值（或超过指定异常数），则触发熔断

自定义兜底逻辑：

以上的配置，发生降级后，会抛出降级的相关异常。可以自定义兜底逻辑。

    @GetMapping("/checkState/{userId}")@SentinelResource(value = "findResumeOpenState",blockHandlerClass = SentinelHandlersClass.class,blockHandler = "handleException",fallbackClass = SentinelHandlersClass.class,fallback = "handleError")public Integer findResumeOpenState(@PathVariable Long userId) {return resumeService.findDefaultResumeByUserId(userId);}

如上，使用@SentinelResource来指定。

value：指定资源，用方法名。
blockHandlerClass：指定sentinel规则异常后，兜底逻辑所在的类。
blockHandler：指定sentinel规则异常后，兜底逻辑所在的方法。

以上的配置是针对抛出sentinel异常，可能在代码中还会抛出java异常，所以还可以定义异常的降级方法。

fallbackClass：指定java异常后，兜底逻辑所在的类。
fallback：指定java异常后，兜底逻辑所在的方法。

兜底方法：

public class SentinelHandlersClass {// 整体要求和当时Hystrix一样，这里还需要在形参最后添加BlockException参数，用于接收异常// 注意：方法是静态的public static Integer handleException(Long userId, BlockException blockException) {return -100;}public static Integer handleError(Long userId) {return -500;}}

基于 Nacos 实现 Sentinel 规则持久化：

在dashboard后台配置的规则，都是在内存中。如果微服务停掉就会消失，所以，生产环境下，可以持久化到nacos配置中心，让微服务从nacos获取规则。

微服务引入依赖：

        <!-- Sentinel支持采用 Nacos 作为规则配置数据源，引入该适配依赖 --><dependency><groupId>com.alibaba.csp</groupId><artifactId>sentinel-datasource-nacos</artifactId></dependency>

在yml中配置nacos数据源（sentinel下的datasource）

server:port: 8098
spring:application:name: lagou-service-autodelivercloud:nacos:discovery:server-addr: 127.0.0.1:8848,127.0.0.1:8849,127.0.0.1:8850sentinel:transport:dashboard: 127.0.0.1:8080 # sentinel dashboard/console 地址port: 8719   #  sentinel会在该端口启动http server，那么这样的话，控制台定义的一些限流等规则才能发送传递过来，#如果8719端口被占用，那么会依次+1# Sentinel Nacos数据源配置，Nacos中的规则会自动同步到sentinel流控规则中datasource:# 数据源自己取名，这里定义了两个：flow和degrade，代表流控和降级# 自定义的流控规则数据源名称flow:nacos: #类型要指定为nacos，因为sentinel还可以持久化到其他类型中server-addr: ${spring.cloud.nacos.discovery.server-addr}data-id: ${spring.application.name}-flow-rulesgroupId: DEFAULT_GROUPdata-type: jsonrule-type: flow  # 类型来自RuleType类# 自定义的降级规则数据源名称degrade:nacos:server-addr: ${spring.cloud.nacos.discovery.server-addr}data-id: ${spring.application.name}-degrade-rulesgroupId: DEFAULT_GROUPdata-type: jsonrule-type: degrade  # 类型来自RuleType类
management:endpoints:web:exposure:include: "*"# 暴露健康接口的细节endpoint:health:show-details: always
#针对的被调用方微服务名称,不加就是全局生效
lagou-service-resume:ribbon:#请求连接超时时间ConnectTimeout: 2000#请求处理超时时间##########################################Feign超时时长设置ReadTimeout: 3000#对所有操作都进行重试OkToRetryOnAllOperations: true####根据如上配置，当访问到故障请求的时候，它会再尝试访问一次当前实例（次数由MaxAutoRetries配置），####如果不行，就换一个实例进行访问，如果还不行，再换一次实例访问（更换次数由MaxAutoRetriesNextServer配置），####如果依然不行，返回失败信息。MaxAutoRetries: 0 #对当前选中实例重试次数，不包括第一次调用MaxAutoRetriesNextServer: 0 #切换实例的重试次数NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RoundRobinRule #负载策略调整
logging:level:# Feign日志只会对日志级别为debug的做出响应com.lagou.edu.controller.service.ResumeServiceFeignClient: debug

配置文件中指定好dataid后，就需要去nacos配置管理中配置了（注意：命名空间，分组，dataid等要和yml中对应上），
- 流控规则：
- ```
[{"resource":"findResumeOpenState","limitApp":"default","grade":1,"count":1,"strategy":0,"controlBehavior":0,"clusterMode":false}
]
```
  所有属性来⾃源码FlowRule类
  - resource：资源名称
  - limitApp：来源应⽤
  - grade：阈值类型 0 线程数 1 QPS
  - count：单机阈值
  - strategy：流控模式，0 直接 1 关联 2 链路
  - controlBehavior：流控效果，0 快速失败 1 Warm Up 2 排队等待
  - clusterMode：true/false 是否集群
- 降级规则
  - ```
  [{"resource":"findResumeOpenState","grade":2,"count":1,"timeWindow":5}
  ]
```
- 所有属性来⾃源码 DegradeRule 类
  - resource：资源名
  - grade ：降级策略 0 RT 1 异常⽐例 2 异常数
  - count ：阈值
  - timeWindow ：时间窗