如何新增配置项?

2024年 5月 7日 43.0k 0

本专题第一篇文章已经介绍过配置项的基本用法,一些对源码感兴趣的同学,可能会想知道配置项是如何实现的,甚至想自己新增一个配置项来完成自定义的功能。

本文将通过探究“如何新增配置项”这一问题,结合配置项的源码实现,讲解配置项的定义、初始化、内部访问和同步机制。

如何新增配置项?

要新增一个配置项,首先在 src/share/parameter/ob_parameter_seed.ipp 文件中,按照下面的格式定义配置项。

// 定义一个集群级别的、INT类型的配置项,动态生效
DEF_INT(cpu_count, OB_CLUSTER_PARAMETER, "0", "[0,]",
        "the number of CPU\\'s in the system. "
        "If this parameter is set to zero, the number will be set according to sysconf; "
        "otherwise, this parameter is used. Range: [0,+∞) in integer",
        ObParameterAttr(Section::OBSERVER, Source::DEFAULT, EditLevel::DYNAMIC_EFFECTIVE));

// 定义一个租户级别的、TIME类型的配置项,动态生效,并附带一个合法性检查类 ObConfigStaleTimeChecker
DEF_TIME_WITH_CHECKER(max_stale_time_for_weak_consistency, OB_TENANT_PARAMETER, "5s",
                      common::ObConfigStaleTimeChecker,
                      "[5s,)",
                      "the max data stale time that cluster weak read version behind current timestamp,"
                      "no smaller than weak_read_version_refresh_interval, range: [5s, +∞)",
                      ObParameterAttr(Section::TENANT, Source::DEFAULT, EditLevel::DYNAMIC_EFFECTIVE));

其中每个参数的含义如下:

参数 说明 举例
配置项宏 定义配置的宏,可以选择附带合法性检查函数 DEF_XXX、DEF_XXX_WITH_CHECKER
配置项名 配置项的名字 一般格式:xxx_xxx_xxx
生效范围 租户配置项 or 集群配置项 OB_CLUSTER_PARAMETER、OB_TENANT_PARAMETER
默认值 默认值必须在取值范围中 "0", "True", "100ms", "20GB", "random"
取值范围 布尔类型和字符串类型不需要取值范围 "[0,]", "[0M,]", "[1s, 180s]"
描述 介绍该配置项的功能和注意事项 "enable xxx"
配置项属性 ① Section:所属模块;
② Source:来源;
③ EditLevel:生效方式;
① OBSERVER、TENANT、TRANS
② DEFAULT
③ DYNAMIC_EFFECTIVE、STATIC_EFFECTIVE

DEF_XXX 宏最终展开是一个类的声明,并同时定义一个对象,对象名就是配置项名。

比如 DEF_TIME_WITH_CHECKER 宏,最终展开是一个 ObConfigTimeItem 类,重载 operator= 操作符让该类可以像基础数据类型一样进行赋值操作。

#define _DEF_PARAMETER_CHECKER_EASY(access_specifier, param, scope, name, def, checker, args...) \
access_specifier:                                                                          \
  class ObConfig ## param ## Item ## _ ## name                                 \
      : public common::ObConfig ## param ## Item                               \
  {                                                                            \
   public:                                                                     \
    ObConfig ## param ## Item ## _ ## name()                                   \
        : common::ObConfig ## param ## Item(                                   \
            local_container(), scope, #name, def, args)                        \
    {                                                                          \
      add_checker(OB_NEW(checker, g_config_mem_attr));                         \
    }                                                                          \
    template <class T>                                                         \
    ObConfig ## param ## Item ## _ ## name& operator=(T value)                 \
    {                                                                          \
      common::ObConfig ## param ## Item::operator=(value);                     \
      return *this;                                                            \
    }                                                                          \
  } name;

ObConfigTimeItemXxx 继承的是一个 ObConfigIntegralItem 类,所以 time 类型的数据本质上是一个 int64_t 变量。

class ObConfigTimeItem
  : public ObConfigIntegralItem
{
public:
  ......

  static const uint64_t VALUE_BUF_SIZE = 32UL;
  char value_str_[VALUE_BUF_SIZE];
  char value_reboot_str_[VALUE_BUF_SIZE];
};

ObConfigIntegralItem 类重载了操作符 operator const int64_t &() const,在代码中访问该类对象的对象名时,实际上返回的是对象的 value_值。

class ObConfigIntegralItem
  : public ObConfigItem
{

  // get_value() return the real-time value
  int64_t get_value() const { return value_; }
  // get() return the real-time value if it does not need reboot, otherwise it return initial_value
  int64_t get() const { return value_; }
  operator const int64_t &() const { return value_; }

private:
  int64_t value_;

配置项定义完成后,重新编译部署 OBServer,就可以对这个配置项进行查询和修改了。不过现在这个配置项没有任何功能,还需要在代码中用起来才能生效。

配置项初始化

集群配置项 ObServerConfig

集群配置项在 OBServer 启动时进行初始化,首先会从配置项的定义中获取默认值,然后从持久化配置文件中获取历史值(非首次启动),最后从 OBServer 的执行参数中获取最新值。它们的优先级是:执行参数 > 持久化配置文件 > 默认值。

配置项对象构造

集群配置项定义在 ObServerConfig 类中,通过在 ObConfigManager 类中定义了一个 ObServerConfig 实例,当 OBServer 启动时,它们及其成员变量的构造函数就会被调用。

class ObServerConfig : public ObCommonConfig
{
public:
  friend class ObServerMemoryConfig;
  int init(const ObSystemConfig &config);
  static ObServerConfig &get_instance();

#undef OB_CLUSTER_PARAMETER
#define OB_CLUSTER_PARAMETER(args...) args
#include "share/parameter/ob_parameter_seed.ipp"
#undef OB_CLUSTER_PARAMETER
}

每个配置项都有默认值,在配置项的构造函数中会将 value_ 置为默认值。

以下是相关函数的调用流程,以及关键函数的代码解析。有的函数只是省略了参数列表,不代表没有参数。

  • ObConfigTimeItem::ObConfigTimeItem()
  • ObConfigIntegralItem::init()
  • ObConfigItem::init()
  • ObConfigItem::set_value(const char *str)
  • ObConfigIntegralItem::set(const char *str)

其中 str 就是一开始定义的配置项默认值,将 str 中的字符串转化为对应类型的数据,然后赋值给 value_。

inline bool ObConfigIntegralItem::set(const char *str)
{
  bool valid = true;
  const int64_t value = parse(str, valid);
  if (valid) {
    value_ = value;
  }
  return valid;
}

配置文件解析

当集群配置项都构造完成后,再从持久化的配置文件中 etc/observer.config.bin 加载配置项。(在 OBServer 初次启动时,配置文件为空,所以不会执行这一步)

  • ObServer::init()
  • ObServer::init_config()
  • ObConfigManager::load_config(const char *path)
  • ObServerConfig::deserialize_with_compat()
  • OB_DEF_DESERIALIZE(ObServerConfig)

先调用 ObCommonConfig::deserialize() 函数解析集群配置项,再调用 OTC_MGR.deserialize() 函数解析租户配置项。

OB_DEF_DESERIALIZE(ObServerConfig)
{

    } else if (OB_FAIL(ObCommonConfig::deserialize(buf, data_len, pos))) {
      LOG_ERROR("deserialize cluster config failed", K(ret));
    } else if (OB_FAIL(OTC_MGR.deserialize(buf, data_len, pos))){
      LOG_ERROR("deserialize tenant config failed", K(ret));
    }
  • OB_DEF_DESERIALIZE(ObCommonConfig)
  • ObCommonConfig::add_extra_config()

将文件中集群配置项的值加载到内存数据结构中。

int ObCommonConfig::add_extra_config(const char *config_str,
                                     int64_t version /* = 0 */ ,
                                     bool check_name /* = false */,
                                     bool check_unit /* = true */)
{
    ......
    while (OB_SUCC(ret) && OB_NOT_NULL(token)) {
      if (strncmp(token, "enable_production_mode=", 23) == 0) {
    ......
        } else if (OB_ISNULL(pp_item = container_.get(ObConfigStringKey(name)))) {
        ......
        if (OB_FAIL(ret) || OB_ISNULL(pp_item)) {
        } else if (check_unit && !(*pp_item)->check_unit(value)) {
          ret = OB_INVALID_CONFIG;
          LOG_ERROR("Invalid config value", K(name), K(value), K(ret));
        } else if (!(*pp_item)->set_value(value)) {
          ret = OB_INVALID_CONFIG;
          LOG_ERROR("Invalid config value", K(name), K(value), K(ret));
        } else if (!(*pp_item)->check()) {
          ret = OB_INVALID_CONFIG;
          const char* range = (*pp_item)->range();
          if (OB_ISNULL(range) || strlen(range) == 0) {
            LOG_ERROR("Invalid config, value out of range", K(name), K(value), K(ret));
          } else {
            _LOG_ERROR("Invalid config, value out of %s (for reference only). name=%s, value=%s, ret=%d", range, name, value, ret);
          }
        } else {
          (*pp_item)->set_version(version);
          LOG_INFO("Load config succ", K(name), K(value));
        }

执行参数解析

当配置文件中的数据加载完成后,再解析 OBServer 执行命令中的配置项参数。

  • ObServer::init_config()

其中 config_.add_extra_config(opts_.optstr_, start_time_) 函数将参数解析为配置项的值,然后加载到配置项结构中。最后调用 dump2file() 函数,将前面解析出来的配置项全部持久化到"etc/observer.config.bin"文件中。

int ObServer::init_config()
{
  int ret = OB_SUCCESS;
  bool has_config_file = true;

  // set dump path
  const char *dump_path = "etc/observer.config.bin";
  config_mgr_.set_dump_path(dump_path);
  if (OB_FILE_NOT_EXIST == (ret = config_mgr_.load_config())) {
    has_config_file = false;
    ret = OB_SUCCESS;
  }
  ......
  if (opts_.optstr_ && strlen(opts_.optstr_) > 0) {
    if (OB_FAIL(config_.add_extra_config(opts_.optstr_, start_time_))) {
      LOG_ERROR("invalid config from cmdline options", K(opts_.optstr_), KR(ret));
    }
  }
  ......
    if (is_arbitration_mode()) {
      // arbitration mode, dump config params to file directly
      if (OB_FAIL(config_mgr_.dump2file())) {
        LOG_ERROR("config_mgr_ dump2file failed", KR(ret));
      } else {
        LOG_INFO("config_mgr_ dump2file success", KR(ret));
      }

如果是用 OBD 部署集群,OBServer 第一次启动时,命令中会带上"xxx.yaml"文件中的启动参数。例如:

/data/user/observer1/bin/observer -p 23400 -P 23401 -z zone1 -c 1 -d /data/user/observer1/store -i lo -r 127.0.0.1:23401:23400 -o __min_full_resource_pool_memory=268435456,major_freeze_duty_time=Disable,datafile_size=20G,memory_limit=10G,system_memory=5G,cpu_count=24,stack_size=512K,cache_wash_threshold=1G,workers_per_cpu_quota=10,schema_history_expire_time=1d,net_thread_count=4,minor_freeze_times=10,enable_separate_sys_clog=False,enable_merge_by_turn=False,syslog_io_bandwidth_limit=10G,enable_async_syslog=False

集群第一次部署完成之后,"etc/observer.config.bin"文件才会被创建,之后重启 OBServer 就可以不带参数了,进程会从该文件中读取修改后的配置项。

租户配置项 ObTenantConfig

创建租户时初始化

租户级别配置项首先在创建租户时进行初始化,在代码中是一个 ObTenantConfig 对象。

(不只这一条调用路径,但最终会调用 add_tenant_config() 函数)

  • ObRpcNotifyTenantServerUnitResourceP::process()
  • ObTenantNodeBalancer::notify_create_tenant(oceanbase::obrpc::TenantServerUnitConfig const&)
  • ObTenantNodeBalancer::check_new_tenant(oceanbase::share::ObUnitInfoGetter::ObTenantConfig const&, long)
  • ObMultiTenant::create_tenant(oceanbase::omt::ObTenantMeta const&, bool, long)
  • ObTenantConfigMgr::add_tenant_config(uint64_t tenant_id)

申请一个新的 ObTenantConfig 对象,调用 init() 初始化,然后添加到 config_map_中。

int ObTenantConfigMgr::add_tenant_config(uint64_t tenant_id)
{
  int ret = OB_SUCCESS;
  ObTenantConfig *const *config = nullptr;
  DRWLock::WRLockGuard guard(rwlock_);
  if (is_virtual_tenant_id(tenant_id)
      || OB_NOT_NULL(config = config_map_.get(ObTenantID(tenant_id)))) {
    if (nullptr != config) {
      ObTenantConfig *new_config = *config;
      new_config->set_deleting(false);
    }
  } else {
    ObTenantConfig *new_config = nullptr;
    new_config = OB_NEW(ObTenantConfig, SET_USE_UNEXPECTED_500("TenantConfig"), tenant_id);
    if (OB_NOT_NULL(new_config)) {
      if(OB_FAIL(new_config->init(this))) {
        LOG_WARN("new tenant config init failed", K(ret));
      } else if (OB_FAIL(config_map_.set_refactored(ObTenantID(tenant_id),
                                                               new_config, 0))) {
        LOG_WARN("add new tenant config failed", K(ret));
      }
  ......

因为 ObTenantConfig 引入了租户配置项的定义,因此在构造 ObTenantConfig 对象时就完成了配置项的构造。

class ObTenantConfig : public ObCommonConfig
{

#undef OB_TENANT_PARAMETER
#define OB_TENANT_PARAMETER(args...) args
#include "share/parameter/ob_parameter_seed.ipp"
#undef OB_TENANT_PARAMETER
};

重启时初始化

在 OBServer 重新启动时,已有租户的配置项也会进行初始化。

  • OB_DEF_DESERIALIZE(ObServerConfig)

调用 OTC_MGR.deserialize() 函数。

OB_DEF_DESERIALIZE(ObServerConfig)
{

    } else if (OB_FAIL(ObCommonConfig::deserialize(buf, data_len, pos))) {
      LOG_ERROR("deserialize cluster config failed", K(ret));
    } else if (OB_FAIL(OTC_MGR.deserialize(buf, data_len, pos))){
      LOG_ERROR("deserialize tenant config failed", K(ret));
    }
  • OB_DEF_DESERIALIZE(ObTenantConfigMgr)

读取文件中租户配置项,根据 tenant_id 获取 config,然后将buf中的配置项解析到 config 中。

OB_DEF_DESERIALIZE(ObTenantConfigMgr)
{
  int ret = OB_SUCCESS;
  if (data_len == 0 || pos >= data_len) {
  } else {
    while(OB_SUCC(ret) && pos < data_len) {
      ......
            ObTenantConfig *config = nullptr;
            if (OB_FAIL(config_map_.get_refactored(ObTenantID(tenant_id), config))) {
              if (ret != OB_HASH_NOT_EXIST || OB_FAIL(add_tenant_config(tenant_id))) {
                LOG_ERROR("get tenant config failed", K(tenant_id),  K(ret));
                break;
              }
              ret = config_map_.get_refactored(ObTenantID(tenant_id), config);
            }
            if (OB_SUCC(ret)) {
              pos = saved_pos;
              ret = config->deserialize(buf, data_len, pos);
            }
    ......

在代码中查询配置项

外部查询

当用户使用"show ..."类型的命令时,OBServer 内部有统一的处理函数:ObShowResolver::resolve()。查询配置项的命令会被解析为 T_SHOW_PARAMETERS 类型,通过查询 __all_virtual_tenant_parameter_stat 表获取配置项的值。

int ObShowResolver::resolve(const ParseNode &parse_tree)
{
    ......
      case T_SHOW_PARAMETERS: {
        ......
          if (params_.show_seed_) {
            char local_ip[OB_MAX_SERVER_ADDR_SIZE] = "";
            if (OB_UNLIKELY(true != GCONF.self_addr_.ip_to_string(local_ip, sizeof(local_ip)))) {
              ret = OB_CONVERT_ERROR;
            } else {
              GEN_SQL_STEP_1(ObShowSqlSet::SHOW_PARAMETERS_SEED);
              GEN_SQL_STEP_2(ObShowSqlSet::SHOW_PARAMETERS_SEED, REAL_NAME(OB_SYS_DATABASE_NAME, OB_ORA_SYS_SCHEMA_NAME), REAL_NAME(OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME, OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_ORA_TNAME),
                             local_ip, GCONF.self_addr_.get_port());
            }
          } else if (OB_SYS_TENANT_ID == show_tenant_id) {
            GEN_SQL_STEP_1(ObShowSqlSet::SHOW_PARAMETERS);
            GEN_SQL_STEP_2(ObShowSqlSet::SHOW_PARAMETERS,
                REAL_NAME(OB_SYS_DATABASE_NAME, OB_ORA_SYS_SCHEMA_NAME),
                REAL_NAME(OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME, OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_ORA_TNAME),
                show_tenant_id);
          } else {
            GEN_SQL_STEP_1(ObShowSqlSet::SHOW_PARAMETERS);
            GEN_SQL_STEP_2(ObShowSqlSet::SHOW_PARAMETERS,
                REAL_NAME(OB_SYS_DATABASE_NAME, OB_ORA_SYS_SCHEMA_NAME),
                REAL_NAME(OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME, OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_ORA_TNAME),
                show_tenant_id);
          }
}

// 最终查询的虚拟表为 __all_virtual_tenant_parameter_stat
const char *const OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME = "__all_virtual_tenant_parameter_stat";

查询该虚拟表需要先初始化一个 ObAllVirtualTenantParameterStat 对象,然后调用 inner_open() 函数,再循环调用 inner_get_next_row() 函数遍历虚拟表。

  • ObVirtualTableIterator::get_next_row(common::ObNewRow*&)
  • ObAllVirtualTenantParameterStat::inner_get_next_row(common::ObNewRow*&)

其中 inner_sys_get_next_row() 函数获取集群配置项,inner_tenant_get_next_row() 函数获取租户配置项,最后根据查询条件进行筛选,返回满足条件的配置项。

int ObAllVirtualTenantParameterStat::inner_get_next_row(ObNewRow *&row)
{
  int ret = OB_SUCCESS;
  if (OB_UNLIKELY(!inited_)) {
    ret = OB_NOT_INIT;
    SERVER_LOG(WARN, "not inited", K(inited_), KR(ret));
  } else if (show_seed_) {
    ret = inner_seed_get_next_row(row);
  } else {
    if (OB_SUCC(inner_sys_get_next_row(row))) {
    } else if (OB_ITER_END == ret) {
      ret = inner_tenant_get_next_row(row);
    }
  }
  return ret;
}
  • ObAllVirtualTenantParameterStat::inner_sys_get_next_row(common::ObNewRow*&)

从 GCONF 中获取集群配置项。

int ObAllVirtualTenantParameterStat::inner_sys_get_next_row(common::ObNewRow *&row)
{
  /*cluster parameter does not belong to any tenant*/
  return fill_row_(row, sys_iter_, GCONF.get_container(), NULL);
}

  // 集群配置项迭代器也就是 GCONF 中一个 hashmap 的迭代器
  sys_iter_ = GCONF.get_container().begin();
  • ObAllVirtualTenantParameterStat::inner_tenant_get_next_row(common::ObNewRow *&row)

从 tenant_config_中获取租户配置项。

int ObAllVirtualTenantParameterStat::inner_tenant_get_next_row(common::ObNewRow *&row)
{
    // 租户配置项迭代器也就是 tenant_config_ 中一个 hashmap 的迭代器
    if (cur_tenant_idx_ < 0 // first come-in
        // current tenant is over
        || (tenant_config_.is_valid() && tenant_iter_ == tenant_config_->get_container().end())) {
      // find next valid tenant
      while (OB_SUCC(ret) && ++cur_tenant_idx_ < tenant_id_list_.count()) {
        uint64_t tenant_id = tenant_id_list_.at(cur_tenant_idx_);
        tenant_config_.set_config(TENANT_CONF(tenant_id));
        if (tenant_config_.is_valid()) {
          tenant_iter_ = tenant_config_->get_container().begin();
      ......
    }
    ......
    } else {
      const uint64_t tenant_id = tenant_id_list_.at(cur_tenant_idx_);
      if (OB_FAIL(fill_row_(row,
          tenant_iter_,
          tenant_config_->get_container(),
          &tenant_id))) {
        SERVER_LOG(WARN, "fill row fail", KR(ret), K(tenant_id), K(tenant_config_->get_tenant_id()),
            K(cur_tenant_idx_), K(tenant_id_list_));
      }

内部获取

集群配置项

因为配置项重载了操作符 operator &(),所以集群配置项直接通过 GCONF.xxx 的形式访问即可。

#include "share/config/ob_server_config.h"

GCONF.enable_sql_audit 

在代码中有需要的地方,可以用“if (GCONF.enable_xxx)”来控制分支的走向,或者用“GCONF.xxx_time”来进行时间的计算,这样就可以把配置项使用起来了。

租户配置项

访问租户配置项需要先调用 OTC_MGR.read_tenant_config() 函数获取租户的 config,然后从 config 中获取指定的配置项。以租户配置项 max_stale_time_for_weak_consistency 为例,为其封装一个取值函数。

  • ObWeakReadUtil::max_stale_time_for_weak_consistency(const uint64_t tenant_id, int64_t ignore_warn)

如果获取租户 config 成功,则从 config 中获取配置项的值,否则返回配置项的默认值并打印日志。

int64_t ObWeakReadUtil::max_stale_time_for_weak_consistency(const uint64_t tenant_id, int64_t ignore_warn)
{
  int64_t max_stale_time = 0;

  OTC_MGR.read_tenant_config(
      tenant_id,
      oceanbase::omt::ObTenantConfigMgr::default_fallback_tenant_id(),
      /* success */ [&max_stale_time](const omt::ObTenantConfig &config) mutable {
        max_stale_time = config.max_stale_time_for_weak_consistency;
      },
      /* failure */ [tenant_id, ignore_warn, &max_stale_time]() mutable {
        max_stale_time = DEFAULT_MAX_STALE_TIME_FOR_WEAK_CONSISTENCY;
        if (IGNORE_TENANT_EXIST_WARN != ignore_warn && REACH_TIME_INTERVAL(1 * 1000 * 1000L)) {
        TRANS_LOG_RET(WARN, OB_ERR_UNEXPECTED, "tenant not exist when get max stale time for weak consistency,"
                  " use default max stale time instead",
                  K(tenant_id), K(max_stale_time), K(lbt()));
        }
      }
  );


  return max_stale_time;
}
  • ObTenantConfigMgr::read_tenant_config()

从 config_map_中获取 tenant_id 对应的config,成功则调用 SuccessFunctor,失败则调用 FailureFunctor。

int ObTenantConfigMgr::read_tenant_config(
    const uint64_t tenant_id,
    const uint64_t fallback_tenant_id,
    const SuccessFunctor &on_success,
    const FailureFunctor &on_failure) const
{
  int ret = OB_SUCCESS;
  ObTenantConfig *config = nullptr;
  DRWLock::RDLockGuard guard(rwlock_);
  if (OB_FAIL(config_map_.get_refactored(ObTenantID(tenant_id), config))) {
    if (fallback_tenant_id > 0 && OB_INVALID_ID != fallback_tenant_id) {
      if (OB_FAIL(config_map_.get_refactored(ObTenantID(fallback_tenant_id), config))) {
        LOG_WARN("failed to get tenant config", K(fallback_tenant_id), K(ret), K(lbt()));
      }
    } else {
      LOG_WARN("failed to get tenant config", K(tenant_id), K(ret));
    }
  }
  if (OB_SUCC(ret) && OB_NOT_NULL(config)) {
    on_success(*config);
  } else {
    on_failure();
    LOG_WARN("fail read tenant config", K(tenant_id), K(ret));
  }
  return ret;
}

在代码中修改配置项

外部修改

修改集群配置项

系统租户执行修改集群配置项命令时,内部会向 __all_sys_parameter 表中插入一条记录(该表只记录增量数据),实际执行的是以下sql命令。

select config_version, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, section, scope, source, edit_level from __all_sys_parameter
INSERT INTO __all_sys_parameter (zone, svr_type, svr_ip, svr_port, name, data_type, value, info, config_version, gmt_modified, section, scope, source, edit_level) VALUES ('', 'observer', 'ANY', 0, 'cpu_count', 'varchar', '9', '', 1689734424757370, usec_to_time(1689734424757370), 'OBSERVER', 'CLUSTER', 'DEFAULT', 'DYNAMIC_EFFECTIVE') ON DUPLICATE KEY UPDATE data_type = 'varchar', value = '9', info = '', config_version = 1689734424757370, gmt_modified = usec_to_time(1689734424757370), section = 'OBSERVER', scope = 'CLUSTER', source = 'DEFAULT', edit_level = 'DYNAMIC_EFFECTIVE'
select config_version, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, section, scope, source, edit_level from __all_sys_parameter
select config_version, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, section, scope, source, edit_level from __all_sys_parameter

将修改后的值插入内部表之后,修改配置项命令就执行完成了。之后内部会将表中的增量数据刷新到各节点的本地数据结构中,此时才算真正完成了集群配置项更新。

修改租户配置项

执行租户配置项修改命令后,内部会执行两条sql,先往 __tenant_parameter 内部表中插入一行数据(该表只记录增量数据),然后往 __all_rootservice_event_history 内部表中插入一条修改记录。

INSERT INTO __tenant_parameter (tenant_id, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, config_version, gmt_modified, section, scope, source, edit_level) VALUES (1004, '', 'observer', 'ANY', 0, 'max_stale_time_for_weak_consistency', 'varchar', '7s', '', 1689732907024711, usec_to_time(1689732907024711), 'TENANT', 'TENANT', 'DEFAULT', 'DYNAMIC_EFFECTIVE') ON DUPLICATE KEY UPDATE data_type = 'varchar', value = '7s', info = '', config_version = 1689732907024711, gmt_modified = usec_to_time(1689732907024711), section = 'TENANT', scope = 'TENANT', source = 'DEFAULT', edit_level = 'DYNAMIC_EFFECTIVE'
INSERT INTO __all_rootservice_event_history (gmt_create, module, event, name1, value1, name2, value2, rs_svr_ip, rs_svr_port) VALUES (usec_to_time(1689732907031822), 'root_service', 'admin_set_config', 'ret', 0, 'arg', '{items:[{name:"max_stale_time_for_weak_consistency", value:"7s", comment:"", zone:"", server:"0.0.0.0:0", tenant_name:"", exec_tenant_id:1004, tenant_ids:[1004]}], is_inner:false}', '127.0.0.1', 23401

同样的,修改内部表之后SQL命令就会返回,之后再由后台线程刷新各节点的租户配置项。

内部更新(同步机制)

内部主动更新配置项,就是把 __tenant_parameter 和 __all_sys_parameter 内部表中的增量配置项同步到本地的过程。

集群配置项同步

  • ObLeaseStateMgr::start_heartbeat()

后台任务 hb_ 每2s执行一次。

int ObLeaseStateMgr::start_heartbeat()
{
  int ret = OB_SUCCESS;
  if (!inited_) {
    ret = OB_NOT_INIT;
    LOG_WARN("not init", K(ret));
  } else {
    const bool repeat = false;
    if (OB_FAIL(hb_timer_.schedule(hb_, DELAY_TIME, repeat))) {
      LOG_WARN("schedule failed", LITERAL_K(DELAY_TIME), K(repeat), K(ret));
    }
  }
  return ret;
}

static const int64_t DELAY_TIME = 2 * 1000 * 1000;//2s
  • ObLeaseStateMgr::HeartBeat::runTimerTask()

......

  • ObHeartBeatProcess::do_heartbeat_event(oceanbase::share::ObLeaseResponse const&)
  • ObHeartBeatProcess::ObZoneLeaseInfoUpdateTask::runTimerTask()

......

  • ObConfigManager::got_version(long, bool)
  • ObConfigManager::UpdateTask::runTimerTask()

该函数是刷新配置项的后台定时任务,会调用 update_local() 函数,将内部表中的数据同步到本地配置项中。

void ObConfigManager::UpdateTask::runTimerTask()
{
    ......
    } else if (update_local_) {
      config_mgr_->current_version_ = version;
      if (OB_FAIL(config_mgr_->system_config_.clear())) {
        // just print log, ignore ret
        LOG_WARN("Clear system config map failed", K(ret));
      } else {
        // do nothing
      }
      if (OB_FAIL(config_mgr_->update_local(version))) {
        LOG_WARN("Update local config failed", K(ret));
        // recovery current_version_
        config_mgr_->current_version_ = old_current_version;
        // retry update local config in 1s later
        if (OB_FAIL(TG_SCHEDULE(lib::TGDefIDs::CONFIG_MGR, *this, 1000 * 1000L, false))) {
          LOG_WARN("Reschedule update local config failed", K(ret));
        }
  • ObConfigManager::update_local(int64_t expected_version)

该函数主要做了以下操作:

  1. sql_client_retry_weak.read():从 __all_sys_parameter 内部表中读取增量配置项;
  2. system_config_.update():将配置项的新值更新到本地;
  3. reload_config():重新加载和校验配置项;
  4. dump2file():将配置项同步到 observer.config.bin 文件中;
int ObConfigManager::update_local(int64_t expected_version)
{
  int ret = OB_SUCCESS;
  if (OB_ISNULL(sql_proxy_)) {
    ret = OB_NOT_INIT;
    LOG_WARN("sql proxy is null", K(ret));
  } else {
    ObSQLClientRetryWeak sql_client_retry_weak(sql_proxy_);
    SMART_VAR(ObMySQLProxy::MySQLResult, result) {
      int64_t start = ObTimeUtility::current_time();
      const char *sqlstr = "select config_version, zone, svr_type, svr_ip, svr_port, name, "
          "data_type, value, info, section, scope, source, edit_level "
          "from __all_sys_parameter";
      if (OB_FAIL(sql_client_retry_weak.read(result, sqlstr))) {
        LOG_WARN("read config from __all_sys_parameter failed", K(sqlstr), K(ret));
      } else if (OB_FAIL(system_config_.update(result))) {
        LOG_WARN("failed to load system config", K(ret));
  ......
  if (OB_SUCC(ret)) {
    if ('\0' == dump_path_[0]) {
      ret = OB_NOT_INIT;
      LOG_ERROR("Dump path doesn't set, stop read config", K(ret));
    } else if (OB_FAIL(server_config_.read_config())) {
      LOG_ERROR("Read server config failed", K(ret));
    } else if (OB_FAIL(reload_config())) {
      LOG_WARN("Reload configuration failed", K(ret));
    } else {
      DRWLock::RDLockGuard guard(OTC_MGR.rwlock_); // need protect tenant config because it will also serialize tenant config
      if (OB_FAIL(dump2file())) {
        LOG_WARN("Dump to file failed", K_(dump_path), K(ret));
  ......

租户配置项同步

  • ObLeaseStateMgr::HeartBeat::runTimerTask()

......

  • ObTenantConfig::got_version(long, bool)
  • ObTenantConfig::TenantConfigUpdateTask::runTimerTask()

租户配置项同样有一个后台定时任务,只要配置项的最新版本大于本地版本,就会触发更新操作。

void ObTenantConfig::TenantConfigUpdateTask::runTimerTask()
{
  int ret = OB_SUCCESS;
  if (OB_ISNULL(config_mgr_)) {
    ret = OB_NOT_INIT;
    LOG_WARN("invalid argument", K_(config_mgr), K(ret));
  } else if (OB_ISNULL(tenant_config_)){
    ret = OB_NOT_INIT;
    LOG_WARN("invalid argument", K_(tenant_config), K(ret));
  } else {
    const int64_t saved_current_version = tenant_config_->current_version_;
    const int64_t version = version_;
    THIS_WORKER.set_timeout_ts(INT64_MAX);
    if (tenant_config_->current_version_ >= version) {
      ret = OB_ALREADY_DONE;
    } else if (update_local_) {
      tenant_config_->current_version_ = version;
      if (OB_FAIL(tenant_config_->system_config_.clear())) {
        LOG_WARN("Clear system config map failed", K(ret));
      } else if (OB_FAIL(config_mgr_->update_local(tenant_config_->tenant_id_, version))) {
        LOG_WARN("ObTenantConfigMgr update_local failed", K(ret), K(tenant_config_));
      } else {
        config_mgr_->notify_tenant_config_changed(tenant_config_->tenant_id_);
      }
  • ObTenantConfigMgr::update_local(uint64_t tenant_id, int64_t expected_version)

查询 __tenant_parameter 内部表获取当前租户的 config,然后将新的数据更新到 config中。

int ObTenantConfigMgr::update_local(uint64_t tenant_id, int64_t expected_version)
{

    SMART_VAR(ObMySQLProxy::MySQLResult, result) {
      if (OB_FAIL(sql.assign_fmt(
          "select config_version, zone, svr_type, svr_ip, svr_port, name, "
          "data_type, value, info, section, scope, source, edit_level "
          "from %s where tenant_id = '%lu'", OB_TENANT_PARAMETER_TNAME, tenant_id))) {
      } else if (OB_FAIL(sql_client_retry_weak.read(result, exec_tenant_id, sql.ptr()))) {
        LOG_WARN("read config from __tenant_parameter failed",
                 KR(ret), K(tenant_id), K(exec_tenant_id), K(sql));
      } else {
        DRWLock::WRLockGuard guard(rwlock_);
        ret = config_map_.get_refactored(ObTenantID(tenant_id), config);
        if (OB_FAIL(ret)) {
          LOG_ERROR("failed to get tenant config", K(tenant_id), K(ret));
        } else {
          ret = config->update_local(expected_version, result);
        }
  • ObTenantConfig::update_local()

调用 system_config_.update() 函数将配置项更新到本地,然后调用 dump2file() 将配置项持久化到文件中。

int ObTenantConfig::update_local(int64_t expected_version, ObMySQLProxy::MySQLResult &result,
                                 bool save2file /* = true */)
{
  int ret = OB_SUCCESS;
  if (OB_FAIL(system_config_.update(result))) {
    LOG_WARN("failed to load system config", K(ret));
      
  if (OB_SUCC(ret)) {
    if (OB_FAIL(read_config())) {
      LOG_ERROR("Read tenant config failed", K_(tenant_id), K(ret));
    } else if (save2file && OB_FAIL(config_mgr_->dump2file())) {
      LOG_WARN("Dump to file failed", K(ret));

小结

新增配置项并不复杂,代码中已经实现了成熟的访问和同步机制,只需要使用合适的宏并填上一些参数就可以定义新配置项了,而后续如何使用这个配置项才是实现新功能的关键。在修改配置项的过程中,实际上还会进行一些合法性检查,这部分会在后面的文章中与系统变量一起进行说明。

本专题下一篇文章是关于“系统变量的定义和源码解析”,系统变量的机制有别于配置项,还有全局级和会话级的区分,感兴趣的同学欢迎继续关注。

参考资料

  1. 配置项总览
  2. OceanBase源码

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论