使节点 1 上的主 SAP HANA 数据库崩溃 - SAPHANAon AWS

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使节点 1 上的主 SAP HANA 数据库崩溃

说明:模拟主数据库系统的完整分解。

运行节点:SAP HANA 主数据库节点

运行步骤

  • 使用以下命令停止主数据库系统<sid>adm

    prihana:~ # sudo su - hdbadm hdbadm@prihana:/usr/sap/HDB/HDB00> HDB kill -9 hdbenv.sh: Hostname prihana defined in $SAP_RETRIEVAL_PATH=/usr/sap/ HDB/HDB00/prihana differs from host name defined on command line. hdbenv.sh: Error: Instance not found for host -9 killing HDB processes: kill -9 6011 /usr/sap/HDB/HDB00/prihana/trace/hdb.sapHDB_HDB00 -d -nw -f /usr/sap/HDB/HDB00/prihana/daemon.ini pf=/usr/sap/HDB/SYS/profile/HDB_HDB00_prihana kill -9 6027 hdbnameserver kill -9 6137 hdbcompileserver kill -9 6139 hdbpreprocessor kill -9 6484 hdbindexserver -port 30003 kill -9 6494 hdbxsengine -port 30007 kill -9 7068 hdbwebdispatcher kill orphan HDB processes: kill -9 6027 [hdbnameserver] <defunct> kill -9 6484 [hdbindexserver] <defunct>

预期结果

  • 集群检测到已停止的主要 SAP HANA 数据库(在节点 1 上),并将辅助的 SAP HANA 数据库(在节点 2 上)提升为主数据库。

    prihana:~ # crm status Stack: corosync Current DC: prihana (version 1.1.18+20180430.b12c320f5-3.24.1-b12c320f5) - partition with quorum Last updated: Thu Nov 12 11:53:21 2020 Last change: Thu Nov 12 11:53:19 2020 by root via crm_attribute on sechana 2 nodes configured 6 resources configured Online: [ prihana sechana ] Full list of resources: res_AWS_STONITH (stonith:external/ec2): Started prihana res_AWS_IP (ocf::suse:aws-vpc-move-ip): Started sechana Clone Set: cln_SAPHanaTopology_HDB_HDB00 [rsc_SAPHanaTopology_HDB_HDB00] Started: [ prihana sechana ] Master/Slave Set: msl_SAPHana_HDB_HDB00 [rsc_SAPHana_HDB_HDB00] Masters: [ sechana ] Slaves: [ prihana ] Failed Actions: * rsc_SAPHana_HDB_HDB00_monitor_60000 on prihana 'master (failed)' (9): call=50, status=complete, exitreason='', last-rc-change='Thu Nov 12 11:51:45 2020', queued=0ms, exec=0ms
  • 重叠 IP 地址已迁移到新的主地址(在节点 2 上)。

  • AUTOMATIC_REGISTER参数设置为 true “” 后,集群会重新启动出现故障的 SAP HANA 数据库,并自动将其注册到新的主数据库。

恢复程序

  • 以 root 用户身份清理节点 1 上的集群 “failed actions”。

    prihana:~ # crm resource cleanup rsc_SAPHana_HDB_HDB00 prihana Cleaned up rsc_SAPHana_HDB_HDB00:0 on prihana Cleaned up rsc_SAPHana_HDB_HDB00:1 on prihana Waiting for 1 replies from the CRMd. OK
  • 资源清理后,将清理群集 “failed actions”。