SaaS多租户可伸缩的数据隔离方案

2023年 7月 14日 40.3k 0

一、SaaS背景

SaaS 是一个全球性趋势,在 SaaS 领域也诞生了众多全球化的公司。现在越来越多的公司开始去做Saas了,作为技术er来讲最重要的是保证系统的数据隔离性、稳定性、安全性、扩展性。其中,数据隔离一个就是我们首要要解决的第一问题,随着数据量的增加,数据库的扩展性是一个技术卡点。相对于应用服务器层的水平扩展,数据库层的水平扩展更难实现。笔者就数据隔离问题提出一些解决思路、以及具体的解决方案,以便你在设计SaaS系统时有一个参考。

二、解决方案

1.共享数据库、共享数据表

image.png

在项目的初期,或者Saas租户数据不是很大的情况下,这个方案是实施最快、复杂度最低的一个。这个方案只需要在每个表里面添加一个tenant_id列,每次写入、查询的时候都带上tenantId,就很轻松的实现了数据隔离。
由于所有的租户相同类型数据都是存放在同一张表里面的,当数据达到千万级别时会导致查询性能直线下降。

2.共享数据库、不同的数据表

图片.png

由于前面这种方案有一个致命的问题,就是相同数据存储在同一个表里,数据的查询性能受到极大限制。于是乎,优秀的开发工程师们想到了另外一个方案:使用相同的database,但是租户的数据可以存放在不同的表里面,这样就解决了呀(可以一个租户对应一套表,也可以将多个租户对应一套表)。

Schema隔离使用PostgreSQL来实现非常简单,因为他天生支持这种方式,具体可以去PostgreSQL了解。

虽解决了单表数据容量的问题,随着租户的用户量越来多时,我们的查询请求呈线性增长,此时我们可以通过数据库的主从方式来解决。但是当租户的写入请求变大时,这个方案的性能瓶颈就卡在主库了。此外,这种模式没办法去解决部分大流量租户吸血问题(突入起来的流量暴增),导致影响其他租户的使用体验。

3.独立数据库(每个租户一个数据库,多个租户对应一个数据库)

为了解决前面提到的问题,架构师们将问题向上抽象了一下,将问题提升到db这层来解决。这里面有细分两种方案:

1).每一个租户一个数据库

图片.png
这个隔离方案很安全、数据互相不受影响、性能也不受影响,但是成本相当昂贵,这个适用于超级有钱的大户使用。

2).通过规则,将一群租户统一放在一个数据库里(推荐)

图片.png

通过规则,我们可以通过后台配置设定规则,将一批租户的数据存放在一个数据库中,将流量大的租户单独隔离出来,这样就完美解决了租户前面提到的大表问题、部分大流量租户吸血问题,让他们实现请求、存储隔离。
这个方案相比前面的几种方案,在扩展性、隔离性、安全性上的表现都是最优的,但是实现复杂度较大。

4.综合对比

对比.png

三、实操

1.隐藏陷阱

如果应用规模进一步扩大,租户数量在持续增加,应用服务器层和数据库层都在持续地水平扩展。再增加新的服务器的话,该架构还是存在一丝隐患的。由于数据库连接是一种创建成本较高且较为稀缺的资源,而上述架构中的每台应用服务器需要连接到每台数据库服务器上。这样,当应用服务器数量扩展到一定数量时,数据库服务器的连接数将可能成为系统的瓶颈。
出现这个问题的原因是,尽管应用服务器层和数据库层已经分别实现了水平扩展,但是由于其彼此之间没有任何对应关系,导致所有的应用服务器要与所有的数据库服务器关联(以m 台应用服务器和n 台数据库服务器为例,它们之间的关联有 mxn 个,也是就是每台应用服务器至少要有n个数据库链接 )。

2. 解决

要解决这个问题,只需对上面的架构做出微小的调整。所有的应用服务器不应该是完全平等的,应该与数据库服务器对应。也就是说,不同的租户可能不仅有不同的应用服务器,还有可能有不同的数据库服务器。每组应用服务器都仅连接对应的数据库服务器。调整后的整体架构模型如下:
图片.png

3.具体实现

要实现将同一应用的不同实例链接到不同的数据库节点上,我们需要通个配置规则,在应用启动的时候,读取配置文件内容,然后获取该节点链接数据库的配置信息。这个配置文件,可以是项目本地也可以使用配置中心来实现,推荐使用配置中心来完成,因为这个在分布式上很有优势且可以做成可视化界面操作。

我们用项目本地文件为例子来实现:
application.yml

#数据库配置
node.mapping: 127.0.0.1,db-1;192.168.12.1,db-2;

spring:
  datasource:
   node:
     -
        db-1:
        username: abc
        password: abc@123
        url: jdbc:mysql://xxxx:3306/xxx?useUnicode=true&characterEncoding=UTF-8&useSSL=false
        driver-class-name: com.mysql.jdbc.Driver 
     -
        db-2:
        username: 2b
        password: 2p
        url: 2u
        driver-class-name: com.mysql.jdbc.Driver 
server:
  port: 9999

spring.application.name: tenants-test

dataSource核心配置:

package com.example.config;

import lombok.Data;

/**
 * @author 
 *
 */

@Data
public class DataSourceInfo {
    private String nodeName;
    private String url;
    private String username;
    private String password;
}
@Data
@ConfigurationProperties(prefix = "spring.datasource")
@Configuration
public class CustomerDataSourceProperties {

    private List node;

}
package com.example.config;

import com.alibaba.druid.pool.DruidDataSource;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.context.properties.EnableConfigurationProperties;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

import javax.sql.DataSource;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * 
 */

@EnableConfigurationProperties(value = CustomerDataSourceProperties.class)
@Configuration
public class MultiTenantConfiguration {

    /**
     * node.mapping : 192.168.1.2,mysql1;192.168.1.2,mysql2; spring.data.driver.mysql1: xxx data.url.mysql1: xxx
     * data.username.mysql1: xxx data.password.mysql1: xxx
     *
     * @param
     * @return
     */

    @Autowired
    private CustomerDataSourceProperties customerDataSourceProperties;

    @Bean
    public DataSource getDataSource(@Value("${node.mapping}") String dataMapping) {
        String dbName = getDbInfo(dataMapping);
        Map dataSourceInfoMap = getAllDataSourceInfo();
        DataSourceInfo dataSourceInfo = dataSourceInfoMap.get(dbName);

        DruidDataSource druidDataSource = new DruidDataSource();
        druidDataSource.setUrl(dataSourceInfo.getUrl());
        druidDataSource.setUsername(dataSourceInfo.getUsername());
        druidDataSource.setPassword(dataSourceInfo.getPassword());
        druidDataSource.setDriverClassName("com.mysql.jdbc.Driver");
        return druidDataSource;
    }

    private Map getAllDataSourceInfo() {
        List data = customerDataSourceProperties.getNode();
        Map dataSourceInfos = new HashMap();
        for (Map map : data) {
            DataSourceInfo dataSourceInfo = new DataSourceInfo();
            map.forEach((key, value) -> {
                if ("username".equalsIgnoreCase(key)) {
                    dataSourceInfo.setUsername(value);
                } else if ("password".equalsIgnoreCase(key)) {
                    dataSourceInfo.setPassword(value);
                } else if ("url".equalsIgnoreCase(key)) {
                    dataSourceInfo.setUrl(value);
                } else if (key.startsWith("db-")) {
                    dataSourceInfo.setNodeName(key);
                }
            });
            dataSourceInfos.put(dataSourceInfo.getNodeName(), dataSourceInfo);
        }
        return dataSourceInfos;
    }

    private String getDbInfo(String dataMapping) {
        String ip = "127.0.0.1";
        String[] dataMappingArray = dataMapping.split(";");
        for (String mapping : dataMappingArray) {
            String[] kvArray = mapping.split(",");
            if (ip.equalsIgnoreCase(kvArray[0])) {
                return kvArray[1];
            }
        }

        return null;
    }
}

我们将应用程序的节点ip和数据库进行配置绑定,这里在k8s环境下会有问题,因为每次pod重启ip会发生改变。在云原生场景下,我们可以通过hostname和数据库进行映射方式来解决。

应用层和数据库层的水平扩展只是应用可伸缩性的一部分,上面提到的几种实现伸缩性的方案,也仅仅是 SaaS 应用中最常用的方案。对于更大型、更复杂的应用,可能需要更为通用的分布式解决方案。这些方案不仅仅适用于 SaaS 应用,而且普遍适用于大型互联网应用。

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论