

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 Amazon OpenSearch Service 中設定多可用區域網域
<a name="managedomains-multiaz"></a>

為避免因服務中斷造成的資料遺失並盡量減少 Amazon OpenSearch Service 叢集停機時間，您可以在相同區域中將節點發佈至跨兩個或三個*可用區域*，此組態就是所謂的多可用區域。可用區域是每個區域內的隔離位置 AWS 。

對於執行生產工作負載的網域，我們建議使用具有待命部署的異地同步備份選項，這會建立下列組態：
+ 跨三個區域部署的網域。
+ 專用主節點和資料節點的新一代執行個體類型。
+ 三個專用主節點和三個 （或三個的倍數） 資料節點。
+ 網域中每個索引至少有兩個複本，或三個資料複本的倍數 （包括主節點和複本）。

本節其餘部分提供這些組態的說明和內容。

## 具有待命的異地同步備份
<a name="managedomains-za-standby"></a>

Multi-AZ with Standby 是 Amazon OpenSearch Service 網域的部署選項，可提供 99.99% 的可用性、生產工作負載的一致效能，以及簡化的網域組態和管理。當您將異地同步備份與待命搭配使用時，網域對基礎設施故障具有彈性，不會影響效能或可用性。此部署選項透過強制許多最佳實務來實現此標準，例如指定的資料節點計數、主節點計數、執行個體類型、複本計數、軟體更新設定，以及開啟自動調整。

**注意**  
具有待命的異地同步備份適用於 OpenSearch 1.3 版及更高版本，並且需要至少具有三個可用區域的區域。

當您將多可用區域與待命搭配使用時，OpenSearch Service 會跨三個可用區域建立網域，每個區域都包含完整的資料副本，並將資料平均分散在每個區域中。您的網域會將其中一個區域中的節點保留為待命，這表示它們不提供搜尋請求。當 OpenSearch Service 在基礎基礎設施中偵測到故障時，會在一分鐘內自動啟用待命節點。網域繼續提供索引和搜尋請求，任何影響僅限於執行容錯移轉所需的時間。資料或資源不會重新分佈，這會導致叢集效能不受影響，也不會降低可用性的風險。具有待命的異地同步備份可免費使用。

您有兩個選項可在 上建立具有待命狀態的網域 AWS 管理主控台。首先，您可以使用**輕鬆**建立方法建立網域，OpenSearch Service 會自動使用預先決定的組態，其中包括下列項目：
+ 三個可用區域，一個做為待命
+ 三個專用主節點和資料節點
+ 在網域上啟用自動調整
+ 資料節點的 GP3 儲存體

您也可以選擇**標準建立**方法，然後選取**具有待命的網域**做為您的部署選項。這可讓您自訂網域，同時仍然強制待命的關鍵功能，例如三個區域和三個主節點。我們建議選擇的資料節點計數是三的倍數 （可用區域的數量）。

建立網域後，您可以導覽至網域詳細資訊頁面，並在**叢集組態**索引標籤中確認*具有待命的 3-AZ * （顯示在可用區域下）。

如果您在使用待命將現有網域遷移至異地同步備份時遇到問題，請參閱故障診斷指南中的[使用待命遷移至異地同步備份](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/handling-errors.html#troubleshooting-multi-az-standby)時發生錯誤。

### 限制
<a name="limitations"></a>

當您使用具有待命的異地同步備份設定網域時，請考慮下列限制：
+ 節點上的碎片總數不能超過 1000，叢集上的碎片總數不能超過 75000，單一碎片的大小不能超過 65 GB。
+ 具有待命的異地同步備份僅適用於 `m5`、`c5`、、`r5``r6g`、`c6g`、`m6g`、`r6gd`、`r7g`、`c7g`、`m7g`、、 `r7gd`和 `i3`執行個體類型。如需支援執行個體的詳細資訊，請參閱[支援的執行個體類型](https://docs.aws.amazon.com/opensearch-service/latest/developerguide/supported-instance-types.html)。
+ 您只能使用佈建 IOPs SSD、一般用途 SSD (GP3) 或具有待命的執行個體後端儲存體。
+ 如果您在具有待命網域的多可用區域上啟用 [UltraWarm](ultrawarm.md)，暖節點的數量必須是正在使用的可用區域的倍數。

## 無待命的異地同步備份
<a name="managedomains-za-no-standby"></a>

OpenSearch Service 仍然支援沒有待命的異地同步備份，可提供 99.9% 的可用性。節點會分散到可用區域 (S)，而可用性取決於可用區域和資料副本的數量。使用待命時，您必須使用最佳實務來設定網域，而不需要待命，您可以選擇自己的可用區域、節點和複本數量。除非您有現有的工作流程會因為建立具有待命的網域而中斷，否則我們不建議使用此選項。

如果您選擇此選項，仍建議您選取三個可用區域，以保持對節點、磁碟和單一可用區域故障的彈性。當發生故障時，叢集會將資料重新分配到剩餘的資源，以維持可用性和備援。此資料移動會增加叢集上的資源使用量，並可能影響效能。如果叢集大小不正確，可能會遇到可用性降低，這主要會破壞多可用區域的目的。

在 上設定無待命網域的唯一方法是 AWS 管理主控台 選擇**標準建立**方法，然後選取**無待命網域**做為您的部署選項。

### 碎片分佈
<a name="shards"></a>

如果您啟用無待命的異地同步備份，您應該為叢集中的每個索引建立至少一個複本。如果沒有複本，OpenSearch Service 就無法將資料複本分發至其他可用區域。還好任何索引的預設組態是複本計數 1。如下圖所示，OpenSearch Service 會盡力將主碎片及其相應的副本碎片分配到不同的區域。

![三個可用區域，每個區域都包含兩個資料節點，其中包含跨區域分佈的主要碎片和複本。](http://docs.aws.amazon.com/zh_tw/opensearch-service/latest/developerguide/images/za-3-az.png)


除了依可用區域分配碎片外，OpenSearch Service 也會依節點對其進行分配。然而，特定網域組態會導致不平衡的碎片計數。請考慮以下網域：
+ 5 個資料節點
+ 5 個主要碎片
+ 2 個複本
+ 3 個可用區域

在這種情況下，OpenSearch Service 必須超載一個節點，以便跨區域分配主要和複本碎片，如下所示。

![三個可用區域具有資料節點，其中包含跨區域分佈的主要碎片和複本。](http://docs.aws.amazon.com/zh_tw/opensearch-service/latest/developerguide/images/za-3-az-imbal.png)


為了避免這些可能導致個別節點壓力和效能受損的情況，我們建議您選擇具有待命的異地同步備份，或當您計劃每個索引有兩個或多個複本時，選擇為三個的倍數的執行個體計數。

### 專用主節點分佈
<a name="dm"></a>

即使您在設定網域時選擇了兩個可用區域，OpenSearch Service 仍會在三個可用區域自動分配[專用主節點](managedomains-dedicatedmasternodes.md)。此分發可協助防止區域發生服務中斷時的叢集停機時間。如果建議的三個專用主節點和一個可用區域在您使用時發生故障，您的叢集仍具有專用主節點的仲裁 (2)，並且可以選擇新的主節點。下圖示範了此組態。

![四個資料節點，其主要和複本碎片分佈於兩個可用區域，而專用主節點位於三個區域。](http://docs.aws.amazon.com/zh_tw/opensearch-service/latest/developerguide/images/za-2-az.png)


如果您選擇了在三個可用區域中已無法使用的上一代執行個體類型，則適用以下狀況：
+ 如果您為該網域選擇了三個可用區域，OpenSearch Service 會發出錯誤。請​選擇不同的執行個體類型，然後再試一次。
+ 如果您為該網域選擇了兩個可用區域，則 OpenSearch Service 會將專用主節點發佈至兩個區域。

## 可用區域中斷
<a name="managedomains-za-summary"></a>

可用區域中斷雖然極少發生，但仍有可能出現。下表列出不同多個可用區在中段期間的組態和行為。資料表中的最後一列適用於具有待命的異地同步備份，而所有其他列的組態僅適用於沒有待命的異地同步備份。


| 區域中的可用區域數量 | 您選擇的可用區域數量 | 專用主節點數目 | 如果一個可用區域中斷時的行為 | 
| --- | --- | --- | --- | 
| 2 或以上 | 2 | 0 |  停機。您的叢集會失去一半的資料節點，且必須至少替換剩餘可用區域中的其中一個，然後才能選擇主節點。  | 
| 2 | 2 | 3 |  停機機率為 50/50。OpenSearch Service 會將兩個專用主節點個別分配到兩個可用區域： [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_tw/opensearch-service/latest/developerguide/managedomains-multiaz.html)  | 
| 3 或以上 | 2 | 3 |  不會停機。OpenSearch Service 會自動在三個可用區域分配專用主節點，因此剩餘的兩個專用主節點可以選擇一個主節點。  | 
| 3 或以上 | 3 | 0 |  不會停機。概略而言您資料節點的三分之二仍然可以選擇主節點。  | 
| 3 或以上 | 3 | 3 |  不會停機。剩餘的兩個專用主節點可以選擇主節點。  | 

在*所有*組態中，無論原因如何，節點故障都可能導致叢集的剩餘資料節點遭遇一段時間的負載增加，而 OpenSearch Service 會自動設定新節點以替換現在失去的節點。

例如，如果三個區域組態中的可用區域中斷，則三分之二的資料節點必須處理與叢集一樣多的請求。當處理這些請求時，剩餘的節點也會在上線時複製碎片到新節點，而這可能近一步影響效能。如果可用性與您的工作負載息息相關，請考慮在叢集中新增資源，以便舒緩此問題。

**注意**  
OpenSearch Service 會以透明的方式管理多可用區域網域，因此您無法手動模擬可用區域中斷。