管理 Amazon DocumentDB 索引 - Amazon DocumentDB

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

管理 Amazon DocumentDB 索引

建立 Amazon DocumentDB 索引

在 Amazon DocumentDB 中建置索引需要做出許多決策:

  • 需要多快完成?

  • 集合在建置期間是否無法存取?

  • 可以為建置配置多少執行個體運算能力?

  • 應該建立哪種類型的索引?

本節可協助您回答這些問題,並提供命令和監控範例,以在執行個體型叢集集合上建立 和 Amazon DocumentDB 索引。

指導方針

下列準則包括建立新索引時的基本限制和組態權衡:

  • Amazon DocumentDB 版本支援 - 雖然所有 Amazon DocumentDB 版本都支援單一工作者索引,但僅在 Amazon DocumentDB 4.0 版和 5.0 版支援多個工作者索引。

  • 效能權衡 - 在索引建立程序中增加工作者數量會增加CPU使用率,並在 Amazon DocumentDB 資料庫的主要執行個體上讀取 IO。建立新索引所需的資源將不適用於您執行中的工作負載。

  • 彈性叢集 - Amazon DocumentDB 彈性叢集不支援平行索引。

  • 工作者上限 - 您可以設定的工作者人數上限取決於資料庫叢集中主要執行個體的大小。它是您資料庫叢集主要執行個體 vCPUs 上 的總數的一半。例如,在具有 64 個 的 db.r6g.16xlarge 執行個體上,您最多可以執行 32 個工作者vCPUs。

    注意

    2xlarge 執行個體類別和更低版本不支援平行工作者。

  • 最低工作者 - 您可以設定的工作者人數下限為 1。在執行個體型叢集上建立索引的預設設定為兩名工作者。不過,您可以使用「工作者執行緒」選項,將工作者數量減少為一個。這會使用單一工作者執行程序。

  • 索引壓縮 - Amazon DocumentDB 不支援索引壓縮。索引的資料大小可能大於您使用其他選項時的大小。

  • 索引多個集合 - 資料庫叢集主要執行個體 vCPUs 上的一半 可用於在多個集合上執行索引建立的已設定工作者。

  • 索引類型 - 如需 Amazon DocumentDB 上支援索引類型的完整說明,請參閱此部落格文章

開始使用

若要在集合上開始建立索引,請使用 createIndexes命令。依預設, 命令會執行兩個平行工作者,將索引建立程序的速度提高兩倍。

例如,下列命令程序示範如何為文件中的「user_name」欄位建立索引,並將索引程序速度提高到四名工作者:

  1. 在叢集上使用兩個平行工作者建立索引:

    db.runCommand({"createIndexes":"test","indexes":[{"key": {"user_name":1}, "name":"username_idx"}]})
  2. 若要最佳化索引建立程序的速度,您可以使用db.runCommand createIndexes命令中的「工作者執行緒」選項 ("workers":<number>) 來指定工作者數量。

    將程序的速度提高到四個平行工作者:

    db.runCommand({"createIndexes":"test","indexes":[{"key": {"user_name":1}, "name":"username_idx", "workers":4}]})
    注意

    工作者數量越高,索引建立進度越快。不過,工作者數量增加越多,主要執行個體的 vCPUs 和讀取 IO 的負載增加越多。確保您的叢集已充分佈建,以處理增加的負擔,而不會降低其他工作負載。

索引進度狀態

索引建立程序的運作方式是初始化、掃描集合、排序索引鍵,最後則是透過索引建置器插入索引鍵。當您在前景執行時,此程序最多有六個階段,而在背景中執行時最多有九個階段。您可以依階段檢視狀態指標,例如完成百分比、掃描的儲存區塊總數、已排序的金鑰和插入的金鑰。

使用 mongo Shell 中的 db.currentOp()命令來監控索引程序的進度。100% 完成最後一個階段顯示已成功建立所有索引:

db.currentOp({"command.createIndexes": { $exists : true } })

索引建置類型

索引建置的四種類型為:

  • 前景 - 前景索引建置會封鎖所有其他資料庫操作,直到建立索引為止。Amazon DocumentDB 前景建置由五個階段組成。

  • 前景 (唯一) - 單一文件 (唯一) 前景索引建置會封鎖其他資料庫操作,例如一般前景建置。與基本前景建置不同,唯一的建置會使用額外的階段 (排序金鑰 2) 來尋找重複的金鑰。前景 (唯一) 建置由六個階段組成。

  • 背景 - 背景索引建置允許建立索引時,其他資料庫操作在前景中執行。Amazon DocumentDB 背景建置由八個階段組成。

  • 背景 (唯一) - 單一文件 (唯一) 背景索引建置可讓其他資料庫操作在建立索引時在前景中執行。與基本背景建置不同,唯一的建置會使用額外的階段 (排序金鑰 2) 來尋找重複的金鑰。背景 (唯一) 建置由九個階段組成。

索引建置階段

階段 前景 前景 (唯一) 背景介紹 背景 (唯一)

初始化

1

1

1

1

建置索引:初始化

2

2

2

2

建置索引:掃描 collectio

3

3

3

3

建置索引:排序索引鍵 1

4

4

4

4

建置索引:排序索引鍵 2

5

5

建置索引:插入金鑰

5

6

5

6

驗證:掃描索引

6

7

驗證:排序組分

7

8

驗證:掃描集合

8

9

  • 初始化 - createIndex 正在準備索引建置器。此階段應該非常簡短。

  • 建置索引:初始化 - 索引建置器正在準備建立索引。此階段應該非常簡短。

  • 建置索引:掃描集合 - 索引建置器正在執行集合掃描以收集索引鍵。測量單位是「區塊」。

    注意

    如果針對索引建置設定了多個工作者,則會顯示在此階段。“掃描集合”階段是唯一在索引建置過程中使用多個工作者的階段。所有其他階段都會顯示單一工作者。

  • 建置索引:排序索引鍵 1 - 索引建置器正在排序收集的索引鍵。計量單位是 “keys”。

  • 建置索引:排序索引鍵 2 - 索引建置器正在排序與無效組群對應的收集索引鍵。此階段僅適用於唯一的索引建置。計量單位是 “keys”。

  • 建置索引:插入索引鍵 - 索引建置器正在將索引鍵插入新索引。計量單位是 “keys”。

  • 驗證:掃描索引 - createIndex 正在掃描索引以尋找需要驗證的金鑰。測量單位是「區塊」。

  • 驗證:排序組分 - createIndex 正在排序索引掃描階段的輸出。

  • 驗證:掃描集合 - createIndex 正在掃描集合,以驗證前兩個階段中找到的索引鍵。測量單位是「區塊」。

索引建置輸出範例

在下面的輸出範例中 (前景索引建置),會顯示索引建立的狀態。“msg” 欄位透過指示建置的階段和完成百分比來總結建置進度。“workers” 欄位表示索引建置的該階段期間所使用的工作者數量。“進度”欄位顯示用於計算完成百分比的實際數字。

注意

Amazon DocumentDB 4.0 版不支援「currentIndexBuild名稱」、「訊息」和「進度」欄位。

{ "inprog" : [{ … "command": { "createIndexes": "test", "indexes": [{ "v": 2, "key": { "user_name": 1 }, "name": "user_name_1" }], "lsid": { "id": UUID(“094d0fba-8f41-4373-82c3-7c4c7b5ff13b”) }, "$db": "test" }, "currentIndexBuildName": user_name_1, "msg": "Index Build: building index number_1, stage 6/6 building index: 656860/1003520 (keys) 65%", "workers": 1, "progress": { "done": 656861, "total": 1003520 }, … ], "ok" : 1 }

使用 進行 Amazon DocumentDB 索引維護 reIndex

reIndex 是用來重建索引的命令。通常在索引已損毀或效率不佳時使用。隨著時間的推移,由於許多更新、插入或刪除,索引可能會累積未使用的空間,導致效能下降。重新索引有助於移除此類未使用的空間,並還原索引的效率。

reIndex 準則

  • reIndex 僅支援 Amazon DocumentDB 5.0。

  • Amazon DocumentDB 支援背景中的reindex單一索引,允許多個工作者。程序reIndex執行時,舊索引可供查詢使用。

  • Amazon DocumentDB 支援透過 編製進度報告索引currentOp。您可以看到與建立索引期間索引建置階段檢視的 類似的索引建置階段。唯一的區別是,無論是否為唯一,reIndex一律有八個階段。沒有「建置索引:排序索引鍵 2」階段。

  • reIndex 除了相同集合上的索引相關命令之外dropIndexes, 可以同時執行任何命令:createIndexescollMod、 和 renameCollection

  • reIndex 目前不支援文字、地理空間、向量和部分索引。

reIndex 建置

使用下列命令來重建索引:

db.runCommand({ reIndex: "collection-name", index: "index-name"})

您也可以選擇性地控制指派給重建程序的工作者數量:

db.runCommand({ reIndex: "collection-name", index: "index-name", workers: number })