本专题第一篇文章已经介绍过配置项的基本用法,一些对源码感兴趣的同学,可能会想知道配置项是如何实现的,甚至想自己新增一个配置项来完成自定义的功能。
本文将通过探究“如何新增配置项”这一问题,结合配置项的源码实现,讲解配置项的定义、初始化、内部访问和同步机制。
如何新增配置项?
要新增一个配置项,首先在 src/share/parameter/ob_parameter_seed.ipp 文件中,按照下面的格式定义配置项。
// 定义一个集群级别的、INT类型的配置项,动态生效
DEF_INT(cpu_count, OB_CLUSTER_PARAMETER, "0", "[0,]",
"the number of CPU\\'s in the system. "
"If this parameter is set to zero, the number will be set according to sysconf; "
"otherwise, this parameter is used. Range: [0,+∞) in integer",
ObParameterAttr(Section::OBSERVER, Source::DEFAULT, EditLevel::DYNAMIC_EFFECTIVE));
// 定义一个租户级别的、TIME类型的配置项,动态生效,并附带一个合法性检查类 ObConfigStaleTimeChecker
DEF_TIME_WITH_CHECKER(max_stale_time_for_weak_consistency, OB_TENANT_PARAMETER, "5s",
common::ObConfigStaleTimeChecker,
"[5s,)",
"the max data stale time that cluster weak read version behind current timestamp,"
"no smaller than weak_read_version_refresh_interval, range: [5s, +∞)",
ObParameterAttr(Section::TENANT, Source::DEFAULT, EditLevel::DYNAMIC_EFFECTIVE));
其中每个参数的含义如下:
参数 | 说明 | 举例 |
配置项宏 | 定义配置的宏,可以选择附带合法性检查函数 | DEF_XXX、DEF_XXX_WITH_CHECKER |
配置项名 | 配置项的名字 | 一般格式:xxx_xxx_xxx |
生效范围 | 租户配置项 or 集群配置项 | OB_CLUSTER_PARAMETER、OB_TENANT_PARAMETER |
默认值 | 默认值必须在取值范围中 | "0", "True", "100ms", "20GB", "random" |
取值范围 | 布尔类型和字符串类型不需要取值范围 | "[0,]", "[0M,]", "[1s, 180s]" |
描述 | 介绍该配置项的功能和注意事项 | "enable xxx" |
配置项属性 | ① Section:所属模块; ② Source:来源; ③ EditLevel:生效方式; |
① OBSERVER、TENANT、TRANS ② DEFAULT ③ DYNAMIC_EFFECTIVE、STATIC_EFFECTIVE |
DEF_XXX 宏最终展开是一个类的声明,并同时定义一个对象,对象名就是配置项名。
比如 DEF_TIME_WITH_CHECKER 宏,最终展开是一个 ObConfigTimeItem 类,重载 operator= 操作符让该类可以像基础数据类型一样进行赋值操作。
#define _DEF_PARAMETER_CHECKER_EASY(access_specifier, param, scope, name, def, checker, args...) \
access_specifier: \
class ObConfig ## param ## Item ## _ ## name \
: public common::ObConfig ## param ## Item \
{ \
public: \
ObConfig ## param ## Item ## _ ## name() \
: common::ObConfig ## param ## Item( \
local_container(), scope, #name, def, args) \
{ \
add_checker(OB_NEW(checker, g_config_mem_attr)); \
} \
template <class T> \
ObConfig ## param ## Item ## _ ## name& operator=(T value) \
{ \
common::ObConfig ## param ## Item::operator=(value); \
return *this; \
} \
} name;
ObConfigTimeItemXxx 继承的是一个 ObConfigIntegralItem 类,所以 time 类型的数据本质上是一个 int64_t 变量。
class ObConfigTimeItem
: public ObConfigIntegralItem
{
public:
......
static const uint64_t VALUE_BUF_SIZE = 32UL;
char value_str_[VALUE_BUF_SIZE];
char value_reboot_str_[VALUE_BUF_SIZE];
};
ObConfigIntegralItem 类重载了操作符 operator const int64_t &() const,在代码中访问该类对象的对象名时,实际上返回的是对象的 value_值。
class ObConfigIntegralItem
: public ObConfigItem
{
// get_value() return the real-time value
int64_t get_value() const { return value_; }
// get() return the real-time value if it does not need reboot, otherwise it return initial_value
int64_t get() const { return value_; }
operator const int64_t &() const { return value_; }
private:
int64_t value_;
配置项定义完成后,重新编译部署 OBServer,就可以对这个配置项进行查询和修改了。不过现在这个配置项没有任何功能,还需要在代码中用起来才能生效。
配置项初始化
集群配置项 ObServerConfig
集群配置项在 OBServer 启动时进行初始化,首先会从配置项的定义中获取默认值,然后从持久化配置文件中获取历史值(非首次启动),最后从 OBServer 的执行参数中获取最新值。它们的优先级是:执行参数 > 持久化配置文件 > 默认值。
配置项对象构造
集群配置项定义在 ObServerConfig 类中,通过在 ObConfigManager 类中定义了一个 ObServerConfig 实例,当 OBServer 启动时,它们及其成员变量的构造函数就会被调用。
class ObServerConfig : public ObCommonConfig
{
public:
friend class ObServerMemoryConfig;
int init(const ObSystemConfig &config);
static ObServerConfig &get_instance();
#undef OB_CLUSTER_PARAMETER
#define OB_CLUSTER_PARAMETER(args...) args
#include "share/parameter/ob_parameter_seed.ipp"
#undef OB_CLUSTER_PARAMETER
}
每个配置项都有默认值,在配置项的构造函数中会将 value_ 置为默认值。
以下是相关函数的调用流程,以及关键函数的代码解析。有的函数只是省略了参数列表,不代表没有参数。
- ObConfigTimeItem::ObConfigTimeItem()
- ObConfigIntegralItem::init()
- ObConfigItem::init()
- ObConfigItem::set_value(const char *str)
- ObConfigIntegralItem::set(const char *str)
其中 str 就是一开始定义的配置项默认值,将 str 中的字符串转化为对应类型的数据,然后赋值给 value_。
inline bool ObConfigIntegralItem::set(const char *str)
{
bool valid = true;
const int64_t value = parse(str, valid);
if (valid) {
value_ = value;
}
return valid;
}
配置文件解析
当集群配置项都构造完成后,再从持久化的配置文件中 etc/observer.config.bin 加载配置项。(在 OBServer 初次启动时,配置文件为空,所以不会执行这一步)
- ObServer::init()
- ObServer::init_config()
- ObConfigManager::load_config(const char *path)
- ObServerConfig::deserialize_with_compat()
- OB_DEF_DESERIALIZE(ObServerConfig)
先调用 ObCommonConfig::deserialize() 函数解析集群配置项,再调用 OTC_MGR.deserialize() 函数解析租户配置项。
OB_DEF_DESERIALIZE(ObServerConfig)
{
} else if (OB_FAIL(ObCommonConfig::deserialize(buf, data_len, pos))) {
LOG_ERROR("deserialize cluster config failed", K(ret));
} else if (OB_FAIL(OTC_MGR.deserialize(buf, data_len, pos))){
LOG_ERROR("deserialize tenant config failed", K(ret));
}
- OB_DEF_DESERIALIZE(ObCommonConfig)
- ObCommonConfig::add_extra_config()
将文件中集群配置项的值加载到内存数据结构中。
int ObCommonConfig::add_extra_config(const char *config_str,
int64_t version /* = 0 */ ,
bool check_name /* = false */,
bool check_unit /* = true */)
{
......
while (OB_SUCC(ret) && OB_NOT_NULL(token)) {
if (strncmp(token, "enable_production_mode=", 23) == 0) {
......
} else if (OB_ISNULL(pp_item = container_.get(ObConfigStringKey(name)))) {
......
if (OB_FAIL(ret) || OB_ISNULL(pp_item)) {
} else if (check_unit && !(*pp_item)->check_unit(value)) {
ret = OB_INVALID_CONFIG;
LOG_ERROR("Invalid config value", K(name), K(value), K(ret));
} else if (!(*pp_item)->set_value(value)) {
ret = OB_INVALID_CONFIG;
LOG_ERROR("Invalid config value", K(name), K(value), K(ret));
} else if (!(*pp_item)->check()) {
ret = OB_INVALID_CONFIG;
const char* range = (*pp_item)->range();
if (OB_ISNULL(range) || strlen(range) == 0) {
LOG_ERROR("Invalid config, value out of range", K(name), K(value), K(ret));
} else {
_LOG_ERROR("Invalid config, value out of %s (for reference only). name=%s, value=%s, ret=%d", range, name, value, ret);
}
} else {
(*pp_item)->set_version(version);
LOG_INFO("Load config succ", K(name), K(value));
}
执行参数解析
当配置文件中的数据加载完成后,再解析 OBServer 执行命令中的配置项参数。
- ObServer::init_config()
其中 config_.add_extra_config(opts_.optstr_, start_time_) 函数将参数解析为配置项的值,然后加载到配置项结构中。最后调用 dump2file() 函数,将前面解析出来的配置项全部持久化到"etc/observer.config.bin"文件中。
int ObServer::init_config()
{
int ret = OB_SUCCESS;
bool has_config_file = true;
// set dump path
const char *dump_path = "etc/observer.config.bin";
config_mgr_.set_dump_path(dump_path);
if (OB_FILE_NOT_EXIST == (ret = config_mgr_.load_config())) {
has_config_file = false;
ret = OB_SUCCESS;
}
......
if (opts_.optstr_ && strlen(opts_.optstr_) > 0) {
if (OB_FAIL(config_.add_extra_config(opts_.optstr_, start_time_))) {
LOG_ERROR("invalid config from cmdline options", K(opts_.optstr_), KR(ret));
}
}
......
if (is_arbitration_mode()) {
// arbitration mode, dump config params to file directly
if (OB_FAIL(config_mgr_.dump2file())) {
LOG_ERROR("config_mgr_ dump2file failed", KR(ret));
} else {
LOG_INFO("config_mgr_ dump2file success", KR(ret));
}
如果是用 OBD 部署集群,OBServer 第一次启动时,命令中会带上"xxx.yaml"文件中的启动参数。例如:
/data/user/observer1/bin/observer -p 23400 -P 23401 -z zone1 -c 1 -d /data/user/observer1/store -i lo -r 127.0.0.1:23401:23400 -o __min_full_resource_pool_memory=268435456,major_freeze_duty_time=Disable,datafile_size=20G,memory_limit=10G,system_memory=5G,cpu_count=24,stack_size=512K,cache_wash_threshold=1G,workers_per_cpu_quota=10,schema_history_expire_time=1d,net_thread_count=4,minor_freeze_times=10,enable_separate_sys_clog=False,enable_merge_by_turn=False,syslog_io_bandwidth_limit=10G,enable_async_syslog=False
集群第一次部署完成之后,"etc/observer.config.bin"文件才会被创建,之后重启 OBServer 就可以不带参数了,进程会从该文件中读取修改后的配置项。
租户配置项 ObTenantConfig
创建租户时初始化
租户级别配置项首先在创建租户时进行初始化,在代码中是一个 ObTenantConfig 对象。
(不只这一条调用路径,但最终会调用 add_tenant_config() 函数)
- ObRpcNotifyTenantServerUnitResourceP::process()
- ObTenantNodeBalancer::notify_create_tenant(oceanbase::obrpc::TenantServerUnitConfig const&)
- ObTenantNodeBalancer::check_new_tenant(oceanbase::share::ObUnitInfoGetter::ObTenantConfig const&, long)
- ObMultiTenant::create_tenant(oceanbase::omt::ObTenantMeta const&, bool, long)
- ObTenantConfigMgr::add_tenant_config(uint64_t tenant_id)
申请一个新的 ObTenantConfig 对象,调用 init() 初始化,然后添加到 config_map_中。
int ObTenantConfigMgr::add_tenant_config(uint64_t tenant_id)
{
int ret = OB_SUCCESS;
ObTenantConfig *const *config = nullptr;
DRWLock::WRLockGuard guard(rwlock_);
if (is_virtual_tenant_id(tenant_id)
|| OB_NOT_NULL(config = config_map_.get(ObTenantID(tenant_id)))) {
if (nullptr != config) {
ObTenantConfig *new_config = *config;
new_config->set_deleting(false);
}
} else {
ObTenantConfig *new_config = nullptr;
new_config = OB_NEW(ObTenantConfig, SET_USE_UNEXPECTED_500("TenantConfig"), tenant_id);
if (OB_NOT_NULL(new_config)) {
if(OB_FAIL(new_config->init(this))) {
LOG_WARN("new tenant config init failed", K(ret));
} else if (OB_FAIL(config_map_.set_refactored(ObTenantID(tenant_id),
new_config, 0))) {
LOG_WARN("add new tenant config failed", K(ret));
}
......
因为 ObTenantConfig 引入了租户配置项的定义,因此在构造 ObTenantConfig 对象时就完成了配置项的构造。
class ObTenantConfig : public ObCommonConfig
{
#undef OB_TENANT_PARAMETER
#define OB_TENANT_PARAMETER(args...) args
#include "share/parameter/ob_parameter_seed.ipp"
#undef OB_TENANT_PARAMETER
};
重启时初始化
在 OBServer 重新启动时,已有租户的配置项也会进行初始化。
- OB_DEF_DESERIALIZE(ObServerConfig)
调用 OTC_MGR.deserialize() 函数。
OB_DEF_DESERIALIZE(ObServerConfig)
{
} else if (OB_FAIL(ObCommonConfig::deserialize(buf, data_len, pos))) {
LOG_ERROR("deserialize cluster config failed", K(ret));
} else if (OB_FAIL(OTC_MGR.deserialize(buf, data_len, pos))){
LOG_ERROR("deserialize tenant config failed", K(ret));
}
- OB_DEF_DESERIALIZE(ObTenantConfigMgr)
读取文件中租户配置项,根据 tenant_id 获取 config,然后将buf中的配置项解析到 config 中。
OB_DEF_DESERIALIZE(ObTenantConfigMgr)
{
int ret = OB_SUCCESS;
if (data_len == 0 || pos >= data_len) {
} else {
while(OB_SUCC(ret) && pos < data_len) {
......
ObTenantConfig *config = nullptr;
if (OB_FAIL(config_map_.get_refactored(ObTenantID(tenant_id), config))) {
if (ret != OB_HASH_NOT_EXIST || OB_FAIL(add_tenant_config(tenant_id))) {
LOG_ERROR("get tenant config failed", K(tenant_id), K(ret));
break;
}
ret = config_map_.get_refactored(ObTenantID(tenant_id), config);
}
if (OB_SUCC(ret)) {
pos = saved_pos;
ret = config->deserialize(buf, data_len, pos);
}
......
在代码中查询配置项
外部查询
当用户使用"show ..."类型的命令时,OBServer 内部有统一的处理函数:ObShowResolver::resolve()。查询配置项的命令会被解析为 T_SHOW_PARAMETERS 类型,通过查询 __all_virtual_tenant_parameter_stat 表获取配置项的值。
int ObShowResolver::resolve(const ParseNode &parse_tree)
{
......
case T_SHOW_PARAMETERS: {
......
if (params_.show_seed_) {
char local_ip[OB_MAX_SERVER_ADDR_SIZE] = "";
if (OB_UNLIKELY(true != GCONF.self_addr_.ip_to_string(local_ip, sizeof(local_ip)))) {
ret = OB_CONVERT_ERROR;
} else {
GEN_SQL_STEP_1(ObShowSqlSet::SHOW_PARAMETERS_SEED);
GEN_SQL_STEP_2(ObShowSqlSet::SHOW_PARAMETERS_SEED, REAL_NAME(OB_SYS_DATABASE_NAME, OB_ORA_SYS_SCHEMA_NAME), REAL_NAME(OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME, OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_ORA_TNAME),
local_ip, GCONF.self_addr_.get_port());
}
} else if (OB_SYS_TENANT_ID == show_tenant_id) {
GEN_SQL_STEP_1(ObShowSqlSet::SHOW_PARAMETERS);
GEN_SQL_STEP_2(ObShowSqlSet::SHOW_PARAMETERS,
REAL_NAME(OB_SYS_DATABASE_NAME, OB_ORA_SYS_SCHEMA_NAME),
REAL_NAME(OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME, OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_ORA_TNAME),
show_tenant_id);
} else {
GEN_SQL_STEP_1(ObShowSqlSet::SHOW_PARAMETERS);
GEN_SQL_STEP_2(ObShowSqlSet::SHOW_PARAMETERS,
REAL_NAME(OB_SYS_DATABASE_NAME, OB_ORA_SYS_SCHEMA_NAME),
REAL_NAME(OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME, OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_ORA_TNAME),
show_tenant_id);
}
}
// 最终查询的虚拟表为 __all_virtual_tenant_parameter_stat
const char *const OB_ALL_VIRTUAL_TENANT_PARAMETER_STAT_TNAME = "__all_virtual_tenant_parameter_stat";
查询该虚拟表需要先初始化一个 ObAllVirtualTenantParameterStat 对象,然后调用 inner_open() 函数,再循环调用 inner_get_next_row() 函数遍历虚拟表。
- ObVirtualTableIterator::get_next_row(common::ObNewRow*&)
- ObAllVirtualTenantParameterStat::inner_get_next_row(common::ObNewRow*&)
其中 inner_sys_get_next_row() 函数获取集群配置项,inner_tenant_get_next_row() 函数获取租户配置项,最后根据查询条件进行筛选,返回满足条件的配置项。
int ObAllVirtualTenantParameterStat::inner_get_next_row(ObNewRow *&row)
{
int ret = OB_SUCCESS;
if (OB_UNLIKELY(!inited_)) {
ret = OB_NOT_INIT;
SERVER_LOG(WARN, "not inited", K(inited_), KR(ret));
} else if (show_seed_) {
ret = inner_seed_get_next_row(row);
} else {
if (OB_SUCC(inner_sys_get_next_row(row))) {
} else if (OB_ITER_END == ret) {
ret = inner_tenant_get_next_row(row);
}
}
return ret;
}
- ObAllVirtualTenantParameterStat::inner_sys_get_next_row(common::ObNewRow*&)
从 GCONF 中获取集群配置项。
int ObAllVirtualTenantParameterStat::inner_sys_get_next_row(common::ObNewRow *&row)
{
/*cluster parameter does not belong to any tenant*/
return fill_row_(row, sys_iter_, GCONF.get_container(), NULL);
}
// 集群配置项迭代器也就是 GCONF 中一个 hashmap 的迭代器
sys_iter_ = GCONF.get_container().begin();
- ObAllVirtualTenantParameterStat::inner_tenant_get_next_row(common::ObNewRow *&row)
从 tenant_config_中获取租户配置项。
int ObAllVirtualTenantParameterStat::inner_tenant_get_next_row(common::ObNewRow *&row)
{
// 租户配置项迭代器也就是 tenant_config_ 中一个 hashmap 的迭代器
if (cur_tenant_idx_ < 0 // first come-in
// current tenant is over
|| (tenant_config_.is_valid() && tenant_iter_ == tenant_config_->get_container().end())) {
// find next valid tenant
while (OB_SUCC(ret) && ++cur_tenant_idx_ < tenant_id_list_.count()) {
uint64_t tenant_id = tenant_id_list_.at(cur_tenant_idx_);
tenant_config_.set_config(TENANT_CONF(tenant_id));
if (tenant_config_.is_valid()) {
tenant_iter_ = tenant_config_->get_container().begin();
......
}
......
} else {
const uint64_t tenant_id = tenant_id_list_.at(cur_tenant_idx_);
if (OB_FAIL(fill_row_(row,
tenant_iter_,
tenant_config_->get_container(),
&tenant_id))) {
SERVER_LOG(WARN, "fill row fail", KR(ret), K(tenant_id), K(tenant_config_->get_tenant_id()),
K(cur_tenant_idx_), K(tenant_id_list_));
}
内部获取
集群配置项
因为配置项重载了操作符 operator &(),所以集群配置项直接通过 GCONF.xxx 的形式访问即可。
#include "share/config/ob_server_config.h"
GCONF.enable_sql_audit
在代码中有需要的地方,可以用“if (GCONF.enable_xxx)”来控制分支的走向,或者用“GCONF.xxx_time”来进行时间的计算,这样就可以把配置项使用起来了。
租户配置项
访问租户配置项需要先调用 OTC_MGR.read_tenant_config() 函数获取租户的 config,然后从 config 中获取指定的配置项。以租户配置项 max_stale_time_for_weak_consistency 为例,为其封装一个取值函数。
- ObWeakReadUtil::max_stale_time_for_weak_consistency(const uint64_t tenant_id, int64_t ignore_warn)
如果获取租户 config 成功,则从 config 中获取配置项的值,否则返回配置项的默认值并打印日志。
int64_t ObWeakReadUtil::max_stale_time_for_weak_consistency(const uint64_t tenant_id, int64_t ignore_warn)
{
int64_t max_stale_time = 0;
OTC_MGR.read_tenant_config(
tenant_id,
oceanbase::omt::ObTenantConfigMgr::default_fallback_tenant_id(),
/* success */ [&max_stale_time](const omt::ObTenantConfig &config) mutable {
max_stale_time = config.max_stale_time_for_weak_consistency;
},
/* failure */ [tenant_id, ignore_warn, &max_stale_time]() mutable {
max_stale_time = DEFAULT_MAX_STALE_TIME_FOR_WEAK_CONSISTENCY;
if (IGNORE_TENANT_EXIST_WARN != ignore_warn && REACH_TIME_INTERVAL(1 * 1000 * 1000L)) {
TRANS_LOG_RET(WARN, OB_ERR_UNEXPECTED, "tenant not exist when get max stale time for weak consistency,"
" use default max stale time instead",
K(tenant_id), K(max_stale_time), K(lbt()));
}
}
);
return max_stale_time;
}
- ObTenantConfigMgr::read_tenant_config()
从 config_map_中获取 tenant_id 对应的config,成功则调用 SuccessFunctor,失败则调用 FailureFunctor。
int ObTenantConfigMgr::read_tenant_config(
const uint64_t tenant_id,
const uint64_t fallback_tenant_id,
const SuccessFunctor &on_success,
const FailureFunctor &on_failure) const
{
int ret = OB_SUCCESS;
ObTenantConfig *config = nullptr;
DRWLock::RDLockGuard guard(rwlock_);
if (OB_FAIL(config_map_.get_refactored(ObTenantID(tenant_id), config))) {
if (fallback_tenant_id > 0 && OB_INVALID_ID != fallback_tenant_id) {
if (OB_FAIL(config_map_.get_refactored(ObTenantID(fallback_tenant_id), config))) {
LOG_WARN("failed to get tenant config", K(fallback_tenant_id), K(ret), K(lbt()));
}
} else {
LOG_WARN("failed to get tenant config", K(tenant_id), K(ret));
}
}
if (OB_SUCC(ret) && OB_NOT_NULL(config)) {
on_success(*config);
} else {
on_failure();
LOG_WARN("fail read tenant config", K(tenant_id), K(ret));
}
return ret;
}
在代码中修改配置项
外部修改
修改集群配置项
系统租户执行修改集群配置项命令时,内部会向 __all_sys_parameter 表中插入一条记录(该表只记录增量数据),实际执行的是以下sql命令。
select config_version, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, section, scope, source, edit_level from __all_sys_parameter
INSERT INTO __all_sys_parameter (zone, svr_type, svr_ip, svr_port, name, data_type, value, info, config_version, gmt_modified, section, scope, source, edit_level) VALUES ('', 'observer', 'ANY', 0, 'cpu_count', 'varchar', '9', '', 1689734424757370, usec_to_time(1689734424757370), 'OBSERVER', 'CLUSTER', 'DEFAULT', 'DYNAMIC_EFFECTIVE') ON DUPLICATE KEY UPDATE data_type = 'varchar', value = '9', info = '', config_version = 1689734424757370, gmt_modified = usec_to_time(1689734424757370), section = 'OBSERVER', scope = 'CLUSTER', source = 'DEFAULT', edit_level = 'DYNAMIC_EFFECTIVE'
select config_version, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, section, scope, source, edit_level from __all_sys_parameter
select config_version, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, section, scope, source, edit_level from __all_sys_parameter
将修改后的值插入内部表之后,修改配置项命令就执行完成了。之后内部会将表中的增量数据刷新到各节点的本地数据结构中,此时才算真正完成了集群配置项更新。
修改租户配置项
执行租户配置项修改命令后,内部会执行两条sql,先往 __tenant_parameter 内部表中插入一行数据(该表只记录增量数据),然后往 __all_rootservice_event_history 内部表中插入一条修改记录。
INSERT INTO __tenant_parameter (tenant_id, zone, svr_type, svr_ip, svr_port, name, data_type, value, info, config_version, gmt_modified, section, scope, source, edit_level) VALUES (1004, '', 'observer', 'ANY', 0, 'max_stale_time_for_weak_consistency', 'varchar', '7s', '', 1689732907024711, usec_to_time(1689732907024711), 'TENANT', 'TENANT', 'DEFAULT', 'DYNAMIC_EFFECTIVE') ON DUPLICATE KEY UPDATE data_type = 'varchar', value = '7s', info = '', config_version = 1689732907024711, gmt_modified = usec_to_time(1689732907024711), section = 'TENANT', scope = 'TENANT', source = 'DEFAULT', edit_level = 'DYNAMIC_EFFECTIVE'
INSERT INTO __all_rootservice_event_history (gmt_create, module, event, name1, value1, name2, value2, rs_svr_ip, rs_svr_port) VALUES (usec_to_time(1689732907031822), 'root_service', 'admin_set_config', 'ret', 0, 'arg', '{items:[{name:"max_stale_time_for_weak_consistency", value:"7s", comment:"", zone:"", server:"0.0.0.0:0", tenant_name:"", exec_tenant_id:1004, tenant_ids:[1004]}], is_inner:false}', '127.0.0.1', 23401
同样的,修改内部表之后SQL命令就会返回,之后再由后台线程刷新各节点的租户配置项。
内部更新(同步机制)
内部主动更新配置项,就是把 __tenant_parameter 和 __all_sys_parameter 内部表中的增量配置项同步到本地的过程。
集群配置项同步
- ObLeaseStateMgr::start_heartbeat()
后台任务 hb_ 每2s执行一次。
int ObLeaseStateMgr::start_heartbeat()
{
int ret = OB_SUCCESS;
if (!inited_) {
ret = OB_NOT_INIT;
LOG_WARN("not init", K(ret));
} else {
const bool repeat = false;
if (OB_FAIL(hb_timer_.schedule(hb_, DELAY_TIME, repeat))) {
LOG_WARN("schedule failed", LITERAL_K(DELAY_TIME), K(repeat), K(ret));
}
}
return ret;
}
static const int64_t DELAY_TIME = 2 * 1000 * 1000;//2s
- ObLeaseStateMgr::HeartBeat::runTimerTask()
......
- ObHeartBeatProcess::do_heartbeat_event(oceanbase::share::ObLeaseResponse const&)
- ObHeartBeatProcess::ObZoneLeaseInfoUpdateTask::runTimerTask()
......
- ObConfigManager::got_version(long, bool)
- ObConfigManager::UpdateTask::runTimerTask()
该函数是刷新配置项的后台定时任务,会调用 update_local() 函数,将内部表中的数据同步到本地配置项中。
void ObConfigManager::UpdateTask::runTimerTask()
{
......
} else if (update_local_) {
config_mgr_->current_version_ = version;
if (OB_FAIL(config_mgr_->system_config_.clear())) {
// just print log, ignore ret
LOG_WARN("Clear system config map failed", K(ret));
} else {
// do nothing
}
if (OB_FAIL(config_mgr_->update_local(version))) {
LOG_WARN("Update local config failed", K(ret));
// recovery current_version_
config_mgr_->current_version_ = old_current_version;
// retry update local config in 1s later
if (OB_FAIL(TG_SCHEDULE(lib::TGDefIDs::CONFIG_MGR, *this, 1000 * 1000L, false))) {
LOG_WARN("Reschedule update local config failed", K(ret));
}
- ObConfigManager::update_local(int64_t expected_version)
该函数主要做了以下操作:
- sql_client_retry_weak.read():从 __all_sys_parameter 内部表中读取增量配置项;
- system_config_.update():将配置项的新值更新到本地;
- reload_config():重新加载和校验配置项;
- dump2file():将配置项同步到 observer.config.bin 文件中;
int ObConfigManager::update_local(int64_t expected_version)
{
int ret = OB_SUCCESS;
if (OB_ISNULL(sql_proxy_)) {
ret = OB_NOT_INIT;
LOG_WARN("sql proxy is null", K(ret));
} else {
ObSQLClientRetryWeak sql_client_retry_weak(sql_proxy_);
SMART_VAR(ObMySQLProxy::MySQLResult, result) {
int64_t start = ObTimeUtility::current_time();
const char *sqlstr = "select config_version, zone, svr_type, svr_ip, svr_port, name, "
"data_type, value, info, section, scope, source, edit_level "
"from __all_sys_parameter";
if (OB_FAIL(sql_client_retry_weak.read(result, sqlstr))) {
LOG_WARN("read config from __all_sys_parameter failed", K(sqlstr), K(ret));
} else if (OB_FAIL(system_config_.update(result))) {
LOG_WARN("failed to load system config", K(ret));
......
if (OB_SUCC(ret)) {
if ('\0' == dump_path_[0]) {
ret = OB_NOT_INIT;
LOG_ERROR("Dump path doesn't set, stop read config", K(ret));
} else if (OB_FAIL(server_config_.read_config())) {
LOG_ERROR("Read server config failed", K(ret));
} else if (OB_FAIL(reload_config())) {
LOG_WARN("Reload configuration failed", K(ret));
} else {
DRWLock::RDLockGuard guard(OTC_MGR.rwlock_); // need protect tenant config because it will also serialize tenant config
if (OB_FAIL(dump2file())) {
LOG_WARN("Dump to file failed", K_(dump_path), K(ret));
......
租户配置项同步
- ObLeaseStateMgr::HeartBeat::runTimerTask()
......
- ObTenantConfig::got_version(long, bool)
- ObTenantConfig::TenantConfigUpdateTask::runTimerTask()
租户配置项同样有一个后台定时任务,只要配置项的最新版本大于本地版本,就会触发更新操作。
void ObTenantConfig::TenantConfigUpdateTask::runTimerTask()
{
int ret = OB_SUCCESS;
if (OB_ISNULL(config_mgr_)) {
ret = OB_NOT_INIT;
LOG_WARN("invalid argument", K_(config_mgr), K(ret));
} else if (OB_ISNULL(tenant_config_)){
ret = OB_NOT_INIT;
LOG_WARN("invalid argument", K_(tenant_config), K(ret));
} else {
const int64_t saved_current_version = tenant_config_->current_version_;
const int64_t version = version_;
THIS_WORKER.set_timeout_ts(INT64_MAX);
if (tenant_config_->current_version_ >= version) {
ret = OB_ALREADY_DONE;
} else if (update_local_) {
tenant_config_->current_version_ = version;
if (OB_FAIL(tenant_config_->system_config_.clear())) {
LOG_WARN("Clear system config map failed", K(ret));
} else if (OB_FAIL(config_mgr_->update_local(tenant_config_->tenant_id_, version))) {
LOG_WARN("ObTenantConfigMgr update_local failed", K(ret), K(tenant_config_));
} else {
config_mgr_->notify_tenant_config_changed(tenant_config_->tenant_id_);
}
- ObTenantConfigMgr::update_local(uint64_t tenant_id, int64_t expected_version)
查询 __tenant_parameter 内部表获取当前租户的 config,然后将新的数据更新到 config中。
int ObTenantConfigMgr::update_local(uint64_t tenant_id, int64_t expected_version)
{
SMART_VAR(ObMySQLProxy::MySQLResult, result) {
if (OB_FAIL(sql.assign_fmt(
"select config_version, zone, svr_type, svr_ip, svr_port, name, "
"data_type, value, info, section, scope, source, edit_level "
"from %s where tenant_id = '%lu'", OB_TENANT_PARAMETER_TNAME, tenant_id))) {
} else if (OB_FAIL(sql_client_retry_weak.read(result, exec_tenant_id, sql.ptr()))) {
LOG_WARN("read config from __tenant_parameter failed",
KR(ret), K(tenant_id), K(exec_tenant_id), K(sql));
} else {
DRWLock::WRLockGuard guard(rwlock_);
ret = config_map_.get_refactored(ObTenantID(tenant_id), config);
if (OB_FAIL(ret)) {
LOG_ERROR("failed to get tenant config", K(tenant_id), K(ret));
} else {
ret = config->update_local(expected_version, result);
}
- ObTenantConfig::update_local()
调用 system_config_.update() 函数将配置项更新到本地,然后调用 dump2file() 将配置项持久化到文件中。
int ObTenantConfig::update_local(int64_t expected_version, ObMySQLProxy::MySQLResult &result,
bool save2file /* = true */)
{
int ret = OB_SUCCESS;
if (OB_FAIL(system_config_.update(result))) {
LOG_WARN("failed to load system config", K(ret));
if (OB_SUCC(ret)) {
if (OB_FAIL(read_config())) {
LOG_ERROR("Read tenant config failed", K_(tenant_id), K(ret));
} else if (save2file && OB_FAIL(config_mgr_->dump2file())) {
LOG_WARN("Dump to file failed", K(ret));
小结
新增配置项并不复杂,代码中已经实现了成熟的访问和同步机制,只需要使用合适的宏并填上一些参数就可以定义新配置项了,而后续如何使用这个配置项才是实现新功能的关键。在修改配置项的过程中,实际上还会进行一些合法性检查,这部分会在后面的文章中与系统变量一起进行说明。
本专题下一篇文章是关于“系统变量的定义和源码解析”,系统变量的机制有别于配置项,还有全局级和会话级的区分,感兴趣的同学欢迎继续关注。