可靠性 - 一般SAP指南

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

可靠性

可靠性是 L SAP ens——Well-Architecte AWS d Framework 的六大支柱之一。有关更多信息,请参阅可靠性

AWS 云在一个区域内有多个可用区, AWS 可提供可靠性。这使您的SAP应用程序 AWS 更具弹性。每个区域与其他区域进一步隔离,从而提供尽可能高的容错能力和稳定性。在每个 AWS 区域内,至少有三个隔离、物理上独立的可用区。有关更多信息,请参阅区域和可用区

AWS 全球基础设施

可用区使您能够操作生产应用程序和数据库,这些应用程序和数据库的可用性要高于单个数据中心所能达到的可用性。将您的应用程序分布在多个可用区中,使您能够在面对大多数故障模式(包括自然灾害或系统故障)时保持弹性。

每个可用区可以是多个数据中心。全面而言,它可以包含数十万台服务器。它们是 AWS 全球基础设施的完全隔离的分区。可用区在物理上与任何其他区域隔开,拥有自己的独立电源和网络资源。有几千米的距离,尽管所有距离都在100千米以内(彼此相距60英里)。这种距离可以隔离可能影响数据中心的最常见灾难,例如洪水、火灾、暴风雨、地震等。

一个区域内的所有可用区域都通过完全冗余的专用城域光纤与高带宽和低延迟网络互连。这可确保可用区域之间的高吞吐量、低延迟联网。网络性能足以完成同步复制。

AWS 全球基础设施

可用区使您能够以高度可用的方式运行应用程序,在可用区之间进行同步数据复制和自动故障转移。RISEwith SAP 可以为您的每个 AWS 地区的工作负载提供如此高的可用性设计。

弹性和成本注意事项

SAP提供了RISE满足不同弹性要求的选项。以下关键要求可RISE通过提供的选项包进行调整SAP。

  • 服务级别协议 (SLA)-描述解决方案的目标可用性。

  • 恢复时间目标 (RTO)-描述从灾难事件中完成恢复的目标持续时间。

  • 恢复点目标 (RPO)-描述灾难事件恢复期间可能发生的目标数据丢失级别。

有关更多详细信息,请参阅RISE协议中提供的定义SAP,以了解违规时的具体定义、条款、影响和处罚。

中断对组织的影响和数据丢失可能导致生产力下降和收入损失,并可能损害声誉。权衡成本和弹性之间的权衡有助于评估组织面临的风险。

弹性和性能注意事项

当您在中选择短距离灾难恢复选项时RISE,SAP应用程序服务器和数据库服务器将安装在多个可用区中。此架构支持针对您的SAP工作负载的高可用性设计。

在主动-主动配置中使用多个可用区域中的应用程序服务器时,它可以提高弹性。同时,引入了从应用程序服务器到数据库服务器的跨可用区域更高的延迟。您可以参阅 SAPNote 3496343(开启网络延迟 AWS),其中详细说明了在多可用区部署中,由于应用程序服务器和数据库服务器之间的距离而增加的延迟。这将在下一节中详细讨论。

您可以使用 AWS Network Manager-基础设施性能工具自动测量可用区间、可用区内和区域间网络延迟。或者,你可以按照 SAPNot SAP e 298 6631 使用's NIPING工具。

当SAP应用程序服务器和数据库服务器分布在多个可用区 (AZs) 时,它可以显著增强系统的可靠性和可用性,抵消网络延迟增加的影响。

跨可用区域流量可能会增加执行频繁调用数据库的某些事务或批处理作业所需的时间。如果影响很大,我们建议使用SAP登录组、服务器组和批处理RFC服务器组 ulink> 将此流量保持在同一个可用区内。这样可以确保受影响的事务或批处理作业仅使用与数据库服务器位于同一可用区的应用程序服务器。

为了自动执行和优化此类对性能至关重要的批处理作业和事务在与数据库服务器位于同一可用区的应用程序服务器上的运行, AWS 提供了客户可以在其系统中测试和实施的示例ABAP代码。SAP

您可以参阅 re AWS : Post 文章可用区间延迟,通过 C-State 参数实现进一步优化,SAP以降低网络延迟

当无法在多个可用区的主动-主动模式下运行应用程序服务器时,您可以使用ABAPSetServerInactive(注意 3075829)在主动-被动模式下运行 SAP

在极少数情况下,当您在一个可用区域内观察到延迟导致的性能影响时,您可以使用集群置放群组来实现尽可能低的延迟。您可以从中参阅《放置策略指南》 AWS

总而言之,以下是多可用区部署中的架构模式:

中的应用程序服务器 AZ1 中的应用程序服务器 AZ2 故障转移机制从AZ1到 AZ2
处于活动状态 处于活动状态 自动脚本(即起搏器)
处于活动状态 处于活动状态 手动调整登录组RFC和 Batch Server 组
处于活动状态 处于活动状态 用于调整登录组和 Batch Server 组RFC的自动脚本
处于活动状态 Passive 手动激活被动应用程序服务器
处于活动状态 Passive 用于激活被动应用程序服务器的自动脚本

为了实现SAP工作负载的高可靠性,我们建议执行以下任务:

  1. 与SAP讨论RISE部署的可用性SLA要求。这将推动将部署在多个可用区的组件(即数据库和应用程序服务器),以最大限度地提高的可靠性和可用性RISE。

  2. 如果您的业务场景涉及批处理作业和/或频繁调用数据库服务器的交易,可能会受到可用区间网络延迟的不利SAP影响,则可以考虑使用SAP的工作负载分配机制(登录组、RFC服务器组和批处理服务器组)来确保这些作业和事务在与数据库服务器位于同一可用区的应用程序服务器上运行

  3. 您可以通过参阅 re AWS : Post 文章可用区间延迟来进一步优化网络延迟。SAP

  4. 当主动-主动模式不可行时,您可以在应用程序服务器的主动-被动模式下运行(注意 3075829)。ABAPSetServerInactive SAP

  5. 您可以考虑将位于同一可用区之外的其他工作负载放在同一个可用区内RISE,以实现更好的网络延迟和更低的数据传输成本。

灾难恢复选项

您可以通过将数据复制到第二个 AWS 区域来实施灾难恢复解决方案。在极少发生本地或区域故障的情况下,您的SAP工作负载将受到保护。

RISE在 S SAP /4 HANA Cloud 中,私有版提供以下两个选项。

  • 短距离灾难恢复或城域灾难恢复 — RISE 在一个 AWS 区域中SAP使用多个可用区。具有三个或更多可用区的独特 AWS 区域为每个 AWS 区域提供了短距离灾难恢复选项。

  • 远距离灾难恢复或区域灾难恢复 — RISE SAP 使用辅助 AWS 区域作为故障转移系统的备用区域。由于两个区域之间的物理距离,数据是在两个 AWS 区域之间异步复制的。 AWS

有关更多详细信息,请参阅SAP文档SAP服务描述:灾难恢复和客户调用的故障转移