第一层:OHASD 启动:(OHASD派生)
1.CSSDAGENT负责启动CSSD的AGENT.以root用户权限启动,负责启动CSSD进程。
2.ORAROOTAGENT负责启动“root"用户下的OHASD的资源的AGENT.
以 root 用户权限启动,负责启动以下这些守护进程:CRSD进程、CTSSD进程、DISKMON进程、ACFS进程。这些进程也都是以ROOT用户权限启动。
3.ORAAGENT 负责启动所用GRID用户的OHASD的资源的AGENT.
以GRID用户权限启动,负责MDNSD进程、GIPCD进程、gpnpd进程、EVMD进程、ASM进程
4.CSSDMONITOR - 监控 CSSD 以及节点健康(和 cssdagent 一起)。
以ROOT用户权限启动,负责CSSDMONITOR进程和启动。
第二层:
1.OHASD rootagent 启动:
CRSD -管理集群资源的主要后台进程。
CTSSD-CLUSTER TIME SYNCHRONIZATION SERVICES DAEMON
DISKMON
ACFS (ASM CLUSTER FILE SYSTEM)驱动。
2.OHASD ORAAGENT启动:
MDNSD-用来实现DNS查询
GIPCD-用来做节点间通信
GPNPD-GRID PLUG &PLAY PROFILE DAEMON
EVMD-EVENT MONITOR DAEMON
ASM-ASM资源
第三层:CRSD启动:
ORAROOTAGENT-负责启动所有ROOT用户下的CRSD资源的AGENT.
ORAAGENT-负责启动所有GRID用户下的CRSD资源的AGENT
第四层:CRSD rootagent启动
NETWORK RESOURCE-监控公共网络
SCAN VIP(S) -SINGLE CLIENT ACCESS NAME VIRTURAL IPS
NODE VIPS-每个节点1个
ACFS REGISTERY 挂载ASM CLUSTER FILE SYSTEM
GNS VIP(OPTIONAL)VIP FOR GNS
第四层: CRSD oraagent 启动:
ASM RESOURCE -ASM 资源
DISKGROUP -用来管理/监控ASM磁盘组
DB RESOURCE -用来管理/监控数据库和实例
SCAN LISTENER -SCAN监听,监听在SCAN VIP 上
Listener -节点监听,监听在NODE VIP上
SERVICES -用来管理/监听 SERVICES
ONS- ORACLE NOTIFICATION SERVICES
EONS-加强版 ORACLE NOTIFICATION SERVICE
GSD 为了向下兼容9I
GNS (OPTIONAL)-GRID NAMING SERVICE -处理域名解析
启动流程对应日志:
Clusterware 后台进程日志都放在”GRID_HOME”/log/”NODENAME”之下,结构如下:
//log//alert.log
对于clusterware的问题,先检查这个文件
//log//ohasd
//log//agent/ohasd/oraagent_
//log//agent/ohasd/oracssdagent_root
//log//agent/ohasd/oracssdmonitor_root
//log//agent/ohasd/orarootagent_root
对应的 OHASD进程和其启动的子进程日志和PID
//log//crsd
//log//ctssd
//log//diskmon
对应 OHASD rootagent 启动的CRSD、CTSSD和Diskmon
//log//mdnsd
//log//gipcd
//log//gpnpd
//log//evmd
对应 OHASD oraagent 启动的MDNSD、GIPCD、GPNPD和EVMD
//log//agent/crsd/orarootagent_root
//log//agent/crsd/oraagent_
对应 CRSD 启动的orarootagent和oraagent
//log//cssd
对应 OHASD cssdagent 启动的CSSD
和 $ORACLE_BASE 目录下的 cfgtoollogs 目录存放了一些其它的重要日志
比如 rootcrs.pl 以及其它配置工具,比如 ASMCA 等等
ASM 日志存放在 $ORACLE_BASE/diag/asm/+asm//trace
/bin 目录下的 diagcollection.pl 可以自动收集重要的日志
以 root 用户执行它
Clusterware 资源状态检查:
使用root用户检查状态
su -
cd "$(su - grid -c 'echo $ORACLE_HOME')/bin"
./crsctl status resource -t
或者直接使用grid用户检查状态
su - grid
crsctl status resource -t
集群资源管理和维护命令简介:
srvctl 和 crsctl 可以用来管理集群资源
尽量使用 srvctl 来管理资源,当srvctl无法操作时,使用crsctl管理资源
使用俩命令的-h参数列出所有的可用操作选项
ocrconfig 可以用来管理维护OCR(Oracle Cluster Registry)或OLR(Oracle Local Registry)
诸如导入导出升级、基于备份的恢复和备份策略等
olsnodes 可以用来管理维护集群的节点信息,如查看集群信息、节点状态等
cluvfy 集群相关状态的检查和维护命令,该命令可以用来对集群状态进行巡检
主要有 comp 和 stage 两类用法
查看相应的帮助:cluvfy comp -help、cluvfy stage -help