Amazon OpenSearch Serverless とは - Amazon OpenSearch Service

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon OpenSearch Serverless とは

Amazon OpenSearch Serverless は、Amazon OpenSearch Service のオンデマンドのサーバーレスオプションであり、OpenSearch クラスターのプロビジョニング、設定、チューニングの運用上の複雑さを排除します。これは、クラスターを自己管理しない組織や、大規模なデプロイを運用するための専用のリソースと専門知識を欠く組織に最適です。OpenSearch Serverless を使用すると、基盤となるインフラストラクチャを管理することなく、大量のデータを検索および分析できます。

OpenSearch Serverless コレクションとは、特定のワークロードやユースケースをサポートするために連携する OpenSearch インデックスのグループのことです。コレクションは、手動プロビジョニングを必要とするセルフマネージド OpenSearch クラスターと比較してオペレーションを簡素化します。

コレクションは、プロビジョニングされた OpenSearch Service ドメインと同じ大容量、分散型、高可用性のストレージを使用しますが、手動設定とチューニングが不要なため、複雑さが軽減されます。コレクション内のデータは転送中に暗号化されます。OpenSearch Serverless は OpenSearch Dashboards もサポートしており、データ分析用のインターフェイスを提供します。

現在、サーバーレスコレクションは OpenSearch バージョン 2.0.x を実行します。新しいバージョンがリリースされると、OpenSearch Serverless はコレクションを自動的にアップグレードして、新機能、バグ修正、パフォーマンスの向上を組み込みます。

OpenSearch Serverless では OpenSearch オープンソーススイートと同じ取り込みオペレーションやクエリ API オペレーションがサポートされているため、既存のクライアントやアプリケーションを引き続き使用できます。OpenSearch Serverless を使用するには、クライアントでの OpenSearch 2.x との互換性が必要になります。詳細については、「Amazon OpenSearch Serverless コレクションへのデータの取り込み」を参照してください。

OpenSearch Serverless のユースケース

OpenSearch Serverless は、主に次の 2 つのユースケースをサポートしています。

  • ログ分析 – ログ分析セグメントは、オペレーションインサイトとユーザーの行動に関するインサイトを得るために、マシン生成による大量の半構造化された時系列データを分析することに重点を置きます。

  • 全文検索 – 全文検索セグメントが、社内ネットワーク内のアプリケーション (コンテンツ管理システム、法的文書) や、e コマースウェブサイトのコンテンツ検索などのインターネット向けアプリケーションを強化します。

コレクションを作成するときは、これらのユースケースのいずれかを選択します。詳細については、「コレクションタイプを選択する」を参照してください。

仕組み

従来の OpenSearch クラスターには、インデックス作成オペレーションと検索オペレーションの両方を実行する単一のインスタンスセットがあり、インデックスストレージはコンピューティング性能と密接に結びついています。これに対し、OpenSearch Serverless はインデックス作成 (取り込み) コンポーネントを検索 (クエリ) コンポーネントから分離するクラウドネイティブなアーキテクチャを採用しており、Amazon S3 をインデックスのプライマリデータストレージとして使用します。

この分離されたアーキテクチャでは、検索機能とインデックス作成機能を相互に独立して、さらに S3 のインデックス化されたデータとも無関係にスケーリングできます。また、このアーキテクチャでは、取り込みオペレーションとクエリオペレーションを分離できるため、リソースを競合させることなく同時に実行できます。

コレクションにデータを書き込むと、OpenSearch Serverless はそのデータをインデックス作成用コンピューティングユニットに配信します。インデックス作成用コンピューティングユニットは、受信データを取り込み、インデックスを S3 に移動します。コレクションデータに対して検索を実行すると、OpenSearch Serverless はクエリ実行対象のデータを保持する検索用コンピューティングユニットにリクエストをルーティングします。検索コンピューティングユニットは、インデックス化されたデータを S3 から直接ダウンロードし (まだローカルにキャッシュされていない場合)、検索オペレーションを実行し、集計を実行します。

次の図は、この分離されたアーキテクチャを示しています。

Diagram showing indexing and search processes using compute units and Amazon S3 storage.

データインジェスト、検索、およびクエリの実行に必要な OpenSearch Serverless のコンピューティング性能は、OpenSearch Compute Unit (OCU) で測定されます。各 OCU は、6 GiB のメモリと対応する仮想 CPU (vCPU)、および Amazon S3 へのデータ転送を組み合わせたものです。各 OCU には、120 GiB のインデックスデータを保存するのに十分なホットエフェメラルストレージが含まれています。

最初のコレクションを作成すると、OpenSearch Serverless は 2 OCU (1 OCU はインデックス作成用、もう 1 OCU は検索用) をインスタンス化します。高可用性を確保するために、他のアベイラビリティーゾーンでスタンバイノードのセットも起動します。開発とテストの目的で、コレクションの [冗長性を有効化] 設定を無効にすることができます。これにより、2 つのスタンバイレプリカが排除され、2 つの OCU のみがインスタンス化されます。デフォルトでは、冗長アクティブレプリカが有効になっています。これは、アカウントの最初のコレクションのために合計で 4 つの OCU がインスタンス化されることを意味します。

これらの OCU は、すべてのコレクションエンドポイントにアクティビティがない場合でも存在します。後続のすべてのコレクションは、これらの OCU を共有します。同じアカウントで追加のコレクションを作成した場合、OpenSearch Serverless は、指定したキャパシティー制限に従って、コレクションのサポートに必要な数だけ検索用と取り込み用の OCU を追加します。キャパシティーは、コンピューティング使用量の減少に伴ってスケールダウンされます。

これらの OCU に対する課金方法については、「料金」を参照してください。

コレクションタイプを選択する

OpenSearch Serverless は、主に次の 3 つのコレクションタイプをサポートしています。

時系列 – 大量の半構造化されたマシン生成データをリアルタイムで分析し、運用、セキュリティ、ユーザー行動、ビジネスパフォーマンスに関するインサイトを提供するログ分析セグメント。

検索 – コンテンツ管理システムや法的文書リポジトリなどの内部ネットワーク内のアプリケーション、および e コマースサイト検索やコンテンツ検出などのインターネット向けアプリケーションを可能にするフルテキスト検索。

ベクトル検索 – ベクトル埋め込みのセマンティック検索は、ベクトルデータ管理を簡素化し、機械学習 (ML) で拡張された検索エクスペリエンスを可能にします。チャットボット、パーソナルアシスタント、不正検出などの生成 AI アプリケーションをサポートしています。

コレクションを初めて作成するときに、コレクションタイプを選択します。

Three collection type options: Time series, Search, and Vector search for different data use cases.

選択するコレクションタイプは、コレクションに取り込む予定のデータの種類と、そのデータへのクエリ実行方法によって異なります。コレクションの作成後にコレクションタイプを変更することはできません。

コレクションタイプには、次の大きな違いがあります。

  • 検索およびベクトル検索コレクションでは、迅速なクエリ応答時間を確保するために、すべてのデータがホットストレージに保存されます。時系列コレクションでは、ホットストレージとウォームストレージを組み合わせて使用します。この場合、より頻繁にアクセスされるデータのクエリ応答時間を最適化するために、最新のデータがホットストレージに保存されます。

  • 時系列およびベクトル検索コレクションの場合、カスタムドキュメント ID によるインデックス付けや、UPSERT リクエストによる更新はできません。この操作は検索のユースケース専用です。代わりにドキュメント ID を使用して更新できます。詳細については、「サポートされている OpenSearch APIオペレーションとアクセス許可」を参照してください。

  • 検索および時系列コレクションの場合、k-NN タイプのインデックスは使用できません。

料金

AWS では、以下の OpenSearch Serverless コンポーネントに対して料金が発生します。

  • データインジェスト用コンピューティング

  • 検索およびクエリ用コンピューティング

  • ストレージは Amazon S3 に保持されます

OCU に時間単位で課金され、秒単位の詳細度が付けられます。アカウントステートメントには、データインジェスト用のラベルと検索用のラベルが付いたコンピューティングのエントリが OCU 時間単位で表示されます。 AWS また、 は Amazon S3 に保存されているデータに対して毎月請求します。OpenSearch Dashboards の使用料金は発生しません。

コレクションを作成し、冗長アクティブレプリカを有効にすると、取り込み用に 2 OCUs (0.5 OCU x 2)、検索用に 1 OCU (0.5 OCU x 2) 以上の料金が請求されます。冗長アクティブレプリカを無効にすると、アカウントの最初のコレクションに対して最低 1 OCU (0.5 OCU x 2) の料金が請求されます。後続のすべてのコレクションは、これらの OCU を共有できます。

OpenSearch Serverless は、コレクションをサポートするのに必要な処理能力とストレージに基づいて 1 OCU 単位で追加の OCU を追加します。コストを抑えるために、アカウントの OCU の最大数を設定できます。

注記

一意の を持つコレクション AWS KMS keys は、OCUs他のコレクションと共有できません。

OpenSearch Serverless は、ワークロードの変化に対応するために必要な最小限のリソースの使用を試みます。プロビジョニングされる OCUs の数はいつでも異なり、正確ではありません。時間の経過とともに、OpenSearch Serverless が使用するアルゴリズムは、システム使用量をより最小限に抑えるよう継続的に改善します。

料金の詳細については、「Amazon OpenSearch Service の料金表」を参照してください。

サポート AWS リージョン

OpenSearch Serverless は、OpenSearch Service AWS リージョン が利用可能な のサブセットで使用できます。サポートされているリージョンのリストについては、「AWS 全般のリファレンス」の「Amazon OpenSearch Service endpoints and quotas」(Amazon OpenSearch Service エンドポイントとクォータ) を参照してください。

制限

OpenSearch Serverless には次の制約事項があります。

  • 一部の OpenSearch API オペレーションがサポートされていません。「サポートされている OpenSearch APIオペレーションとアクセス許可」を参照してください。

  • 一部の OpenSearch プラグインがサポートされていません。「サポートされている OpenSearch プラグイン」を参照してください。

  • 現在、マネージド型の OpenSearch Service ドメインから Serverless コレクションにデータを自動的に移行する方法はありません。ドメインからコレクションにデータを再インデックスする必要があります。

  • コレクションへのクロスアカウントアクセスはサポートされていません。他のアカウントからのコレクションを暗号化またはデータアクセスポリシーに含めることはできません。

  • カスタムの OpenSearch プラグインはサポートされていません。

  • OpenSearch Serverless コレクションのスナップショットを取得または復元することはできません。

  • クロスリージョン検索およびレプリケーションはサポートされていません。

  • 1 つのアカウントおよびリージョンで使用できるサーバーレスリソースの数には制限があります。「OpenSearch Serverless のクォータ」を参照してください。

  • ベクトル検索コレクションのインデックスの更新間隔は約 60 秒です。検索コレクションと時系列コレクションのインデックスの更新間隔は約 10 秒です。

  • シャードの数、間隔の数、更新間隔は変更できず、OpenSearch サーバーレス によって処理されます。シャーディング戦略はコレクションタイプとトラフィックに基づいています。例えば、時系列コレクションでは、書き込みトラフィックのボトルネックに基づいてプライマリシャードをスケーリングします。

  • OpenSearch バージョン 2.1 までで利用可能な地理空間機能がサポートされています。