使用Envoy将gRPC转码为HTTP/JSON

2023年 7月 10日 44.1k 0

本文为翻译文章,点击查看原文。

试用gRPC构建服务时要在.proto文件中定义消息(message)和服务(service)。gRPC支持多种语言自动生成客户端、服务端和DTO实现。在读完这篇文章后,你将了解到使用Envoy作为转码代理,使gRPC API也可以通过HTTP/JSON的方式访问。你可以通过github代码库中的Java代码来测试它。有关gRPC的介绍请参阅blog.jdriven.com/2018/10/grpc-as-an-alternative-to-rest/。

为什么要对gRPC服务进行转码?

一旦有了一个可用的gRPC服务,可以通过向服务添加一些额外的注解(annotation)将其作为HTTP/JSON API发布。你需要一个代理来转换HTTP/JSON调用并将其传递给gRPC服务。我们称这个过程为转码。然后你的服务就可以通过gRPC和HTTP/JSON访问。大多数时候我更倾向使用gRPC,因为使用遵循“契约”生成的类型安全的代码更方便、更安全,但有时转码也很有用:

  • web应用程序可以通过HTTP/JSON调用与gRPC服务通信。github.com/grpc/grpc-web是一个可以在浏览器中使用的JavaScript的gRPC实现。这个项目很有前途,但还不成熟。
  • 因为gRPC在网络通信上使用二进制格式,所以很难看到实际发送和接收的内容。将其作为HTTP/JSON API发布,可以使用cURL或postman等工具更容易地检查服务。
  • 如果你使用的语言gRPC不支持,你可以通过HTTP/JSON访问它。
  • 它为在项目中更平稳地采用gRPC铺平了道路,允许其他团队逐步过渡。
  • 创建一个gRPC服务:ReservationService

    让我们创建一个简单的gRPC服务作为示例。在gRPC中,定义包含远程过程调用(rpc)的类型和服务。你可以随意设计自己的服务,但是谷歌建议使用面向资源的设计(源代码:cloud.google.com/apis/design/resources),因为用户无需知道每个方法是做什么的就可以容易地理解API。如果你创建了许多不固定格式的rpc,用户必须理解每种方法的作用,从而使你的API更难学习。面向资源的设计还可以更好地转换为HTTP/JSON API。

    在本例中,我们将创建一个会议预订服务。该服务称为ReservationService,由创建、获取、获取列表和删除预订4个操作组成。服务定义如下:

    //reservation_service.proto
    
    syntax = "proto3";
    
    package reservations.v1;
    option java_multiple_files = true;
    option java_outer_classname = "ReservationServiceProto";
    option java_package = "nl.toefel.reservations.v1";
    
    import "google/protobuf/empty.proto";
    
    service ReservationService {
    
        rpc CreateReservation(CreateReservationRequest) returns (Reservation) {  }
        rpc GetReservation(GetReservationRequest) returns (Reservation) {  }
        rpc ListReservations(ListReservationsRequest) returns (stream Reservation) {  }
        rpc DeleteReservation(DeleteReservationRequest) returns (google.protobuf.Empty) {  }
    
    }
    
    message Reservation {
        string id = 1;
        string title = 2;
        string venue = 3;
        string room = 4;
        string timestamp = 5;
        repeated Person attendees = 6;
    }
    
    message Person {
        string ssn = 1;
        string firstName = 2;
        string lastName = 3;
    }
    
    message CreateReservationRequest {
        Reservation reservation = 2;
    }
    
    message CreateReservationResponse {
        Reservation reservation = 1;
    }
    
    message GetReservationRequest {
        string id = 1;
    }
    
    message ListReservationsRequest {
        string venue = 1;
        string timestamp = 2;
        string room = 3;
    
        Attendees attendees = 4;
    
        message Attendees {
            repeated string lastName = 1;
        }
    }
    
    message DeleteReservationRequest {
        string id = 1;
    }
    

    通常的做法是将操作的入参封装在请求对象中。这会在以后的操作中添加额外的字段或选项时更加容易。ListReservations操作返回一个Reservations列表。在Java中,这意味着你将得到Reservations对象的一个迭代(Iterator)。客户端甚至可以在服务器发送完响应之前就开始处理它们,非常棒。

    如果你想知道这个gRPC服务在Java中是如何被使用的,请查看 ServerMain.java 和 ClientMain.java实现。

    使用HTTP选项标注服务进行转码

    在每个rpc操作的花括号中可以添加选项。Google定义了一个java option,允许你指定如何将操作转换到HTTP请求(endpoint)。在reservation_service.proto中引入 ‘**google/api/annotations.proto’**即可使用该选项。默认情况下这个import是不可用的,但是你可以通过向build.gradle添加以下编译依赖来实现它:

    compile "com.google.api.grpc:proto-google-common-protos:1.13.0-pre2"
    

    这个依赖将由protobuf解压并生成几个.proto文件放入构建目录中。现在可以把google/api/annotations.proto引入你的.proto文件中并开始说明如何转换API。

    转码GetReservation操作为GET方法

    让我们从GetReservation操作开始,我已经添加了GetReservationRequest到代码示例中:

      message GetReservationRequest {
           string id = 1;
       }
    
       rpc GetReservation(GetReservationRequest) returns (Reservation) {
           option (google.api.http) = {
               get: "/v1/reservations/{id}"
           };
       }
    

    在选项定义中有一个名为“get”的字段,设置为“/v1/reservation /{id}”。字段名对应于HTTP客户端应该使用的HTTP请求方法。get的值对应于请求URL。在URL中有一个名为id的路径变量,这个变量会自动映射到输入操作中同名的字段。在本例中,它将是GetReservationRequest.id。

    发送 GET /v1/reservations/1234 到代理将转码到下面的伪代码:

    var request = GetReservationRequest.builder().setId(“1234”).build()
    var reservation = reservationServiceClient.GetReservation(request)
    return toJson(reservation)
    

    HTTP响应体(response body)将返回预订的所有非空字段的JSON形式。

    记住:转码不是由gRPC服务完成的。单独运行这个示例不会将其发布为HTTP JSON API。前端的代理负责转码。我们稍后将对此进行配置。

    转码CreateReservation操作为POST方法

    现在来考虑CreateReservation操作。

    message CreateReservationRequest {
       Reservation reservation = 2;
    }
    
    rpc CreateReservation(CreateReservationRequest) returns (Reservation) {
       option(google.api.http) = {
          post: "/v1/reservations"
          body: "reservation"
       };
    }
    

    这个操作被转为POST请求*/v1/reservation*。选项中的body字段告诉转码器将请求体转成CreateReservationRequest中的字段。这意味着我们可以使用以下curl调用:

    curl -X POST \
        http://localhost:51051/v1/reservations \
        -H 'Content-Type: application/json' \
        -d '{
        "title": "Lunchmeeting",
        "venue": "JDriven Coltbaan 3",
        "room": "atrium",
        "timestamp": "2018-10-10T11:12:13",
        "attendees": [
           {
               "ssn": "1234567890",
               "firstName": "Jimmy",
               "lastName": "Jones"
           },
           {
               "ssn": "9999999999",
               "firstName": "Dennis",
               "lastName": "Richie"
           }
        ]
    }'
    

    响应包含同样的对象,只不过多了一个生成的id字段。

    转码带查询参数过滤的ListReservations

    查询集合资源的一种常见方法是提供查询参数作为过滤器。ListReservations的gRPC服务就有此功能。它接收到一个包含可选字段的ListReservationRequest,用于过滤预订集合。

    message ListReservationsRequest {
        string venue = 1;
        string timestamp = 2;
        string room = 3;
    
        Attendees attendees = 4;
    
        message Attendees {
            repeated string lastName = 1;
        }
    }
    
    rpc ListReservations(ListReservationsRequest) returns (stream Reservation) {
       option (google.api.http) = {
           get: "/v1/reservations"
       };
    }
    

    在这里,转码器将自动创建ListReservationsRequest,并将查询参数映射到ListReservationRequest的内部字段。没有指定的字段都取默认值,对于字符串来说是""。例如:

    curl http://localhost:51051/v1/reservations?room=atrium
    

    字段room设置为atrium并映射到ListReservationRequest里,其余字段设置为默认值。还可以提供以下子消息字段:

    curl "http://localhost:51051/v1/reservations?attendees.lastName=Richie"
    

    attendees.lastName是一个repeated的字段,可以被设置多次:

    curl  "http://localhost:51051/v1/reservations?attendees.lastName=Richie&attendees.lastName=Kruger"
    

    gRPC服务将会知道ListReservationRequest.attendees.lastName是一个有两个元素的列表:Richie和Kruger. Supernice。

    运行转码器

    是时候让这些运行起来了。Google cloud支持转码,即使运行在Kubernetes (incl GKE) 或计算引擎中。更多信息请参看cloud.google.com/endpoints/docs/grpc/tutorials。

    如果你不在Google cloud中运行,或者是在本地运行,那么可以使用Envoy。它是一个由Lyft创建的非常灵活的代理。它也是istio.io中的主要组件。在这个例子中我们将使用它。

    为了转码我们需要:

  • 一个gRPC服务的项目,在.proto文件中包含转码选项。
  • 从.proto文件中生成的.pd文件包含gRPC服务描述。
  • 使用该定义,配置Envoy作为gRPC服务的HTTP请求代理。
  • 使用docker运行Envoy。
  • 步骤 1

    我已经创建了如上描述的项目并发布在github上。你可以从这里clone: github.com/toefel18/transcoding-grpc-to-http-json。然后构建它:

    # Script will download gradle if it’s not installed, no need to install it :)
    ./gradlew.sh clean build    # windows: ./gradlew.bat clean build
    

    提示:我创建了脚本自动执行步骤2到4,脚本在项目github.com/toefel18/transcoding-grpc-to-http-json的根目录下。这将节省你的开发时间。步骤2到4详细的解释了它是如何工作的。

    ./start-envoy.sh
    

    步骤 2

    然后我们需要创建.pb文件。我们需要先下载预编译的protoc可执行文件:github.com/protocolbuffers/protobuf/releases/latest(为你的平台选择正确的版本,例如针对Mac的protoc-3.6.1-osx-x86_64.zip),然后解压到你的路径,很简单。

    在transcoding-grpc-to-http-json目录下运行下面的命令生成Envoy可以理解的文件 reservation_service_definition.pb (别忘了先构建项目并导入 reservation_service.proto需要的.proto文件)。

    protoc -I. -Ibuild/extracted-include-protos/main --include_imports \
                   --include_source_info \
                   --descriptor_set_out=reservation_service_definition.pb \
                   src/main/proto/reservation_service.proto
    

    这个命令可能看起来很复杂,但实际上非常简单。-I代表include,protoc寻找.proto文件的目录。–descriptor_set_out表示包含定义的输出文件,最后一个参数是我们要处理的原始文件。

    步骤 3

    我们快要完成了,在运行Envoy之前,最后一件事是创建配置文件。Envoy的配置文件以yaml描述。你可以使用Envoy做很多事情,但是现在让我们专注于转码我们的服务。我从[Envoy的网站](https://www.envoyproxy.io/docs/envoy/latest/configuration/http_filters/grpc_json_transcoder_filter#config-http-filters-grpc-json- transcocoder)中获取了一个基本的配置示例,并使用#标记了感兴趣的部分。

    admin:
      access_log_path: /tmp/admin_access.log
      address:
        socket_address: { address: 0.0.0.0, port_value: 9901 }         #1
    
    static_resources:
      listeners:
      - name: main-listener
        address:
          socket_address: { address: 0.0.0.0, port_value: 51051 }      #2
        filter_chains:
        - filters:
          - name: envoy.http_connection_manager
            config:
              stat_prefix: grpc_json
              codec_type: AUTO
              route_config:
                name: local_route
                virtual_hosts:
                - name: local_service
                  domains: ["*"]
                  routes:
                  - match: { prefix: "/", grpc: {} }
                    #3 see next line!
                    route: { cluster: grpc-backend-services, timeout: { seconds: 60 } }
              http_filters:
              - name: envoy.grpc_json_transcoder
                config:
                  proto_descriptor: "/data/reservation_service_definition.pb" #4
                  services: ["reservations.v1.ReservationService"]            #5
                  print_options:
                    add_whitespace: true
                    always_print_primitive_fields: true
                    always_print_enums_as_ints: false
                    preserve_proto_field_names: false                        #6
              - name: envoy.router
    
      clusters:
      - name: grpc-backend-services                  #7
        connect_timeout: 1.25s
        type: logical_dns
        lb_policy: round_robin
        dns_lookup_family: V4_ONLY
        http2_protocol_options: {}
        hosts:
        - socket_address:
            address: 127.0.0.1                       #8
            port_value: 53000
    

    我已经在配置文件中添加了一些标记来强调我们感兴趣的部分:

    • #1 admin接口的地址。你也可以在这里获取prometheus的测量数据去查询服务是怎样执行的。
    • #2 HTTP API的可用地址。
    • #3 将请求路由到后端服务的名称。步骤 #7 定义这个名字。
    • #4 我们之前生成的.pb描述符文件的路径。
    • #5 转码的服务。
    • #6 Protobuf字段名通常包含下划线。设置该选项为false会将字段名转换为驼峰式。
    • #7 集群定义了上游服务(在步骤#3中Envoy代理的服务)。
    • #8 可连接后端服务的地址和端口。我使用了127.0.0.1/localhost。

    步骤 4

    我们现在准备运行Envoy。最简单的方式是通过Docker镜像。这需要先安装Docker。如果你还没有,请先安装docker 。

    有两个Envoy需要的资源,配置文件和.pb描述文件。我们可以先把文件导入容器以便Envoy启动时找到他们。运行下面github代码库根目录的命令:

    sudo docker run -it --rm --name envoy --network="host" \
      -v "$(pwd)/reservation_service_definition.pb:/data/reservation_service_definition.pb:ro" \
      -v "$(pwd)/envoy-config.yml:/etc/envoy/envoy.yaml:ro" \
      envoyproxy/envoy
    

    如果Envoy成功启动将会看到下面的日志:

    [2018-11-10 14:55:02.058][000009][info][main] [source/server/server.cc:454] starting main dispatch loop
    

    注意,我在docker run命令中将-network设置为“host”。这意味着在本地可以访问正在运行的容器,而不需要额外的网络配置。根据页面 docs.docker.com/docker-for-mac/networking/的建议,应该更改步骤#8中Envoy配置的IP地址为host.docker.internal 或 gateway.docker.internal。

    通过HTTP访问服务

    如果一切顺利,你现在可以使用curl命令来访问服务。Linux下你可以直接连接localhost,但是在windows或者Mac下你可能需要通过虚拟机或docker容器的IP地址连接。有很多方法可以配置docker,这里使用localhost。

    通过HTTP创建预订

    curl -X POST http://localhost:51051/v1/reservations \
              -H 'Content-Type: application/json' \
              -d '{
                "title": "Lunchmeeting2",
                "venue": "JDriven Coltbaan 3",
                "room": "atrium",
                "timestamp": "2018-10-10T11:12:13",
                "attendees": [
                    {
                        "ssn": "1234567890",
                        "firstName": "Jimmy",
                        "lastName": "Jones"
                    },
                    {
                        "ssn": "9999999999",
                        "firstName": "Dennis",
                        "lastName": "Richie"
                    }
                ]
            }'
    

    输出:

     {
            "id": "2cec91a7-d2d6-4600-8cc3-4ebf5417ac4b",
            "title": "Lunchmeeting2",
            "venue": "JDriven Coltbaan 3",
    ...
    

    通过HTTP获取预订

    使用上面创建的ID:

    curl http://localhost:51051/v1/reservations/ENTER-ID-HERE!
    

    输出应该和创建结果一致。

    通过HTTP获取预订列表

    对于这个例子可能需要以不同的字段多次执行CreateReservation来验证过滤器的行为。

    curl "http://localhost:51051/v1/reservations"
    
    curl "http://localhost:51051/v1/reservations?room=atrium"
    
    curl "http://localhost:51051/v1/reservations?room=atrium&attendees.lastName=Jones"
    

    响应结果是Reservations的数组。

    删除预订

    curl -X DELETE http://localhost:51051/v1/reservations/ENTER-ID-HERE!
    

    返回头

    gRPC会返回一些HTTP头。有些可以在调试的时候帮到你:

    • grpc-status:这个值是io.grpc.Status.Code的序数,它能帮助查看gRPC的返回状态。
    • grpc-message:一旦出现问题返回的错误信息。

    更多信息请查看github.com/grpc/grpc/blob/master/doc/PROTOCOL-HTTP2.md

    缺陷

    1. 如果路径不存在响应很奇怪

    Envoy工作的很好,但在我看来有时候会返回不正确的状态码。比如当我获取一个合法的预订:

    curl http://localhost:51051/v1/reservations/ENTER-ID-HERE!
    

    返回状态码200,没错,但如果我这样做:

    curl http://localhost:51051/v1/reservations/ENTER-ID-HERE!/blabla
    

    Envoy会返回:

    415 Unsupported Media Type
    Content-Type is missing from the request
    

    我期望返回404而不是上面解释的错误信息。这有一个相关的问题:github.com/envoyproxy/envoy/issues/5010

    解决: Envoy将所有请求路由到gRPC服务,如果服务中不存在该路径,gRPC服务本身就会响应该错误。解决方案是在Envoy的配置中添加’ gRPC:{} ‘,使其仅转发在gRPC服务中实现了的请求:

     name: local_route
                virtual_hosts:
                - name: local_service
                  domains: ["*"]
                  routes:
                  - match: { prefix: "/" , grpc: {}}  # <--- this fixes it
                    route: { cluster: grpc-backend-services, timeout: { seconds: 60 } }
    

    2. 有时候在查询集合时,即使服务器有错误响应,依然会返回空资源‘[]’

    我提交了这一问题给Envoy开发者: github.com/envoyproxy/envoy/issues/5011

    部分解决方案: 其中一部分是已知的转码限制,因为状态和头是先发送的。在一个响应中转换器首先发送一个200状态码,然后对流进行转码。

    即将到来的特性

    将来还可以在响应体中返回响应消息的子字段,以便你不想返回完整的响应体。这可以通过HTTP选项中的“response_body”字段完成。如果你想在HTTP API中裁剪包装的对象这是非常合适的。

    结语

    我希望这篇文章对将gRPC API转码HTTP/JSON提供了一个很好的概述。

    相关文章

    KubeSphere 部署向量数据库 Milvus 实战指南
    探索 Kubernetes 持久化存储之 Longhorn 初窥门径
    征服 Docker 镜像访问限制!KubeSphere v3.4.1 成功部署全攻略
    那些年在 Terraform 上吃到的糖和踩过的坑
    无需 Kubernetes 测试 Kubernetes 网络实现
    Kubernetes v1.31 中的移除和主要变更

    发布评论