本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使节点 2 上的主数据库崩溃
描述-模拟主数据库系统的完整细分。
运行节点-主要 SAP HANA 数据库节点(在节点 2 上)。
运行步骤:
-
使用以下命令使主数据库(在节点 2 上)系统崩溃
<sid>adm
。[root@sechana ~]# su - hdbadm hdbadm@sechana:/usr/sap/HDB/HDB00> HDB kill -9 hdbenv.sh: Hostname sechana defined in $SAP_RETRIEVAL_PATH=/usr/sap/ HDB/HDB00/sechana differs from host name defined on command line. hdbenv.sh: Error: Instance not found for host -9 killing HDB processes: kill -9 30751 /usr/sap/HDB/HDB00/sechana/trace/hdb.sapHDB_HDB00 -d -nw -f /usr/sap/HDB/HDB00/sechana/daemon.ini pf=/usr/sap/HDB/SYS/profile/HDB_HDB00_sechana kill -9 30899 hdbnameserver kill -9 31166 hdbcompileserver kill -9 31168 hdbpreprocessor kill -9 31209 hdbindexserver -port 30003 kill -9 31211 hdbxsengine -port 30007 kill -9 31721 hdbwebdispatcher kill orphan HDB processes: kill -9 30899 [hdbnameserver] <defunct> kill -9 31209 [hdbindexserver] <defunct>
预期结果:
-
集群检测到已停止的主要 SAP HANA 数据库(在节点 2 上),并将辅助的 SAP HANA 数据库(在节点 1 上)提升为主数据库。
[root@sechana ~]# pcs status Cluster name: rhelhanaha Stack: corosync Current DC: prihana (version 1.1.19-8.el7_6.5-c3c624ea3d) - partition with quorum Last updated: Tue Nov 10 18:13:35 2020 Last change: Tue Nov 10 18:12:51 2020 by hacluster via crmd on sechana 2 nodes configured 6 resources configured Online: [ prihana sechana ] Full list of resources: clusterfence (stonith:fence_aws): Started prihana Clone Set: SAPHanaTopology_HDB_00-clone [SAPHanaTopology_HDB_00] Started: [ prihana sechana ] Master/Slave Set: SAPHana_HDB_00-master [SAPHana_HDB_00] Masters: [ prihana ] Slaves: [ sechana ] hana-oip (ocf::heartbeat:aws-vpc-move-ip): Started prihana Failed Actions: * SAPHana_HDB_00_monitor_59000 on sechana 'master (failed)' (9): call=41, status=complete, exitreason='', last-rc-change='Tue Nov 10 18:03:49 2020', queued=0ms, exec=0ms Daemon Status: corosync: active/enabled pacemaker: active/enabled pcsd: active/enabled
-
重叠 IP 地址已迁移到新的主地址(在节点 1 上)。
-
由于设置
AUTOMATED_REGISTER
为 true,因此集群会重新启动出现故障的 SAP HANA 数据库,并将其注册到新的主数据库。
恢复程序:
-
以 root 用户身份清理节点 2 上的集群 “
failed actions
”。[root@prihana ~]# pcs resource cleanup SAPHana_HDB_00 --node sechana
-
资源清理后,确保已清理群集 “
failed actions
”。