如何基于 ACK Serverless 快速部署 AI 推理服务-每日运维

作者：元毅

随着 AI 浪潮的到来，各种 AI 应用层出不穷，众所周知 AI 应用对 GPU 资源强烈依赖，但 GPU 很昂贵，如何降低 GPU 资源使用成本成为用户首要问题。而 AI 与 Serverless 技术结合，完全可以达到按需使用资源，降低资源成本的目的。

那么在云原生场景下，是否有这样开箱即用、标准、开放的方案呢？答案是有。我们在 ACK Serverless 中提供 Knative + KServe 的方案，可以帮助用户快速部署 AI 推理服务，按需使用，在无请求时支持 GPU 资源自动缩容到 0，大幅节省 AI 应用场景下资源使用成本。

关于 ACK Serverless

容器服务 Serverless 版 ACK Serverless 是一款基于阿里云弹性计算基础架构之上，同时完全兼容 Kubernetes 生态，安全、可靠的容器产品。通过 ACK Serverless，您无需管理和维护 k8s 集群即可快速创建 Kubernetes 容器应用，支持多种 GPU 资源规格，并且根据应用实际使用的资源量进行按需付费。

Knative 与 KServe

Knative 是一款基于 Kubernetes 之上的开源 Serverless 应用架构，提供基于请求的自动弹性、缩容到 0 以及灰度发布等功能。通过 Knative 部署 Serverless 应用可以做到专注于应用逻辑开发，资源按需使用。

而 KServe 提供了一个简单的 Kubernetes CRD，可以将单个或多个经过训练的模型部署到模型服务运行时，例如 TFServing、TorchServe、Triton 等推理服务器。这些模型服务运行时能够提供开箱即用的模型服务，KServe 提供基本 API 原语，让您轻松构建自定义模型服务运行时。基于 Knative 使用 InferenceService 部署推理模型后，您将获得以下 Serverless 能力：

缩容到 0
基于 RPS、并发数、CPU/GPU 指标自动弹性
多版本管理
流量管理
安全认证
开箱即用可观测性

KServe 模型服务控制面主要由 KServe Controller 负责，用于协调 InferenceService 自定义资源并创建 Knative Service 服务，可以实现根据请求流量实现自动缩放，以及在未收到流量时缩小到零。

基于 KServe 快速部署第一个推理服务

在本文中，我们将部署一个带有预测能力的 InferenceService 推理服务，该推理服务将使用 iris（鸢尾花）数据集训练的 scikit-learn 模型。该数据集具有三个输出类别：Iris Setosa（山鸢尾，索引：0）、Iris Versicolour（杂色鸢尾花，索引：1）和 Iris Virginica（弗吉尼亚鸢尾，索引：2）。最后您可以向部署的模型发送推理请求，以便预测对应的鸢尾植物类别。

前提条件

已开通 ACK Serverless [ 1]
部署 KServe [ 2]

当前阿里云 Knative 支持一键部署 KServe。支持 ASM、ALB、MSE 以及 Kourier 等网关能力。

创建 InferenceService 推理服务

kubectl apply -f -  POST /v1/models/sklearn-iris:predict HTTP/1.1

> Host: sklearn-iris-predictor-default.default.example.com

> User-Agent: curl/7.84.0

> Accept: */*

> Content-Length: 76

> Content-Type: application/x-www-form-urlencoded

>

* Mark bundle as not supporting multiuse

如何基于 ACK Serverless 快速部署 AI 推理服务

关于 ACK Serverless

Knative 与 KServe

基于 KServe 快速部署第一个推理服务

前提条件

创建 InferenceService 推理服务

相关文章

发布评论取消回复

大树

社区版oceanbase安装

oracle 查询改写

ORA-00600 internal error code, arguments [25026]

如何基于 ACK Serverless 快速部署 AI 推理服务

关于 ACK Serverless

Knative 与 KServe

基于 KServe 快速部署第一个推理服务

前提条件

创建 InferenceService 推理服务

相关文章

发布评论 取消回复

大树

社区版oceanbase安装

oracle 查询改写

ORA-00600 internal error code, arguments [25026]

发布评论取消回复