.NET Core + Spring Cloud:熔断降级

在微服务架构下,服务之间彼此隔离,服务之间的调用通过网络请求,在众多服务中,可能因为网络或服务本身的原因引起某些接口异常是很常见的现象,接口超时或报错在实际情况下偶发也属正常,但如果短时间内不断的出现并积压,就可能引起服务崩溃。

Hystrix 是 Spring Cloud 中的核心组件,它提供了熔断、隔离、降级、请求缓存、监控等功能,能够在依赖的服务出现问题时保证系统依然可用。

如下图,当 Dependenccy I 发生故障时,通过 Hystrix 的配置策略决定作出何种响应,如限流拒绝请求、接口异常超过阈值快速返回失败、接口超时发起重试等。

services

创建 .NET Core Hystrix 服务

基于 .NET Core + Spring Cloud:API 网关 的所有服务,对 client-service 进行熔断降级测试。

eureka

修改 client-service :

  1. NuGet 添加引用,MetricsEventsCore 主要对 stream 的监测使用(后面会说明)

    1
    2
    Install-Package Steeltoe.CircuitBreaker.HystrixCore
    Install-Package Steeltoe.CircuitBreaker.Hystrix.MetricsEventsCore
  2. 创建 HystrixCommand

    之前是通过构造函数注入BaseService ,直接调用 BaseService 中的方法,现在需要对 BaseService 中的方法进行熔断降级,就需要定义HystrixCommand(本质上是一个代理模式),通过重写 HystrixCommand 的 RunAsync 来调用 _baseService.GetValueAsync()。使用 Steeltoe Hystrix 时,需要为每个方法创建一个 HystrixCommand,这个实在有些繁琐,希望后续版本会优化。IHystrixCommandOptions 为 Command 的策略配置参数,未设置则使用默认值,可在配置文件进行设置覆盖,参考:Command Settings

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    public class GetValueCommand : HystrixCommand<string>
    {
    private readonly IBaseService _baseService;

    public GetValueCommand(IHystrixCommandOptions options,
    IBaseService baseService) : base(options)
    {
    _baseService = baseService;
    }

    public async Task<string> GetValueAsync()
    {
    return await ExecuteAsync();
    }

    protected override async Task<string> RunAsync()
    {
    return await _baseService.GetValueAsync();
    }

    /// <summary>
    /// 熔断降级执行方法
    /// </summary>
    /// <returns></returns>
    protected override async Task<string> RunFallbackAsync()
    {
    return await Task.FromResult("调用 GetValueAsync 接口异常,服务异常,请稍候再试");
    }
    }
  3. Startup.cs ConfigureServices 方法中添加:

    1
    2
    3
    4
    5
    // Add Steeltoe Hystrix Command
    services.AddHystrixCommand<GetValueCommand>("base-service", Configuration);

    // Add Hystrix Metrics to container
    services.AddHystrixMetricsStream(Configuration);
  4. Startup.cs Configure方法中添加:

    1
    2
    // Start Hystrix metrics stream service
    app.UseHystrixMetricsStream();

搭建 Hystrix Dashboard

在进行测试之前,为了更加形象查看效果,我们借助 Hystrix Dashboard 来监控。

  1. 在 IntelliJ IDEA 中新建项目,选 Spring Initializr 完成项目创建

  2. 在 pom.xml 添加 hystrix-dashboard 和 eureka-client 的依赖,我们将会把 Hystrix Dashboard 注册到 Eureka Server

    1
    2
    3
    4
    5
    6
    7
    8
    9
    <dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
    </dependency>

    <dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-eureka-client</artifactId>
    </dependency>
  3. 在启动类上添加 EnableHystrixDashboard 注解

    1
    2
    3
    4
    5
    6
    7
    @EnableHystrixDashboard
    @SpringBootApplication
    public class EurekaServiceApplication {
    public static void main(String[] args) {
    SpringApplication.run(EurekaServiceApplication.class, args);
    }
    }
  4. 修改 application.yml 配置文件

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    spring:
    application:
    name: hystrix-dashboard-service

    server:
    port: 6500

    eureka:
    instance:
    hostname: server1
    client:
    service-url:
    defaultZone: http://server1:8001/eureka/,http://server2:8002/eureka/,http://server3:8003/eureka/
  5. 启动服务,访问:http://server1:8001/,可以发现 Hystrix Dashboard 已在 6500 端口启动

    eureka

  6. 访问:http://server1:6500/hystrix

    hystrix dashboard

    这时我们需要输入 client-service(http://server1:6001/hystrix/hystrix.stream) 的 stream 地址进行监测。

    hystrix dashboard

测试

正常情况请求 http://server1:5555/client-service/api/values/getvalue 接口没问题:

success

我们可以针对某个 HystrixCommand 配置参数覆盖默认值,在 appsettings.json 添加如下配置,GetValueCommand 执行超时时间为 10ms,所以会存在偶发的 Timeout ,Timeout 时会返回 Fallback 方法结果:

1
2
3
4
5
6
7
8
9
10
11
12
13
"hystrix": {
"command": {
"GetValueCommand": {
"execution": {
"isolation": {
"thread": {
"timeoutInMilliseconds": 10
}
}
}
}
}
}

timeout

fallback

当 Fallback 次数触发了 熔断阈值,会进入 Short-Circuited 状态:

short circuited

当把 base-service 服务全部杀掉,请求会进入 Failure 状态:

failure

Steeltoe 的 Circuit Breaker 还支持 Request Cache、Request Logging、Thread Pool 等,更多请参考 官方文档

参考链接

如果对你有帮助就好