Qu'est-ce qu'Amazon OpenSearch Serverless ? - Amazon OpenSearch Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce qu'Amazon OpenSearch Serverless ?

Amazon OpenSearch Serverless est une configuration sans serveur à la demande pour Amazon OpenSearch Service. Le mode Serverless élimine les complexités opérationnelles liées au provisionnement, à la configuration et au réglage de vos clusters. OpenSearch C'est une bonne option pour les organisations qui ne souhaitent pas gérer elles-mêmes leurs OpenSearch clusters, ou pour les organisations qui ne disposent pas des ressources ou de l'expertise nécessaires pour exploiter de grands clusters. Avec OpenSearch Serverless, vous pouvez facilement rechercher et analyser un grand volume de données sans avoir à vous soucier de l'infrastructure sous-jacente et de la gestion des données.

Une collection OpenSearch sans serveur est un groupe d' OpenSearchindex qui fonctionnent ensemble pour prendre en charge une charge de travail ou un cas d'utilisation spécifique. Les collections sont plus faciles à utiliser que les OpenSearch clusters autogérés, qui nécessitent un provisionnement manuel.

Les collections disposent du même type de volume de stockage à haute capacité, distribué et hautement disponible que celui utilisé par les domaines de OpenSearch service provisionnés, mais elles simplifient davantage car elles ne nécessitent pas de configuration ni de réglage manuels. Les données sont cryptées pendant leur transit au sein d'une collection. OpenSearch Serverless prend également en charge OpenSearch les tableaux de bord, qui fournissent une interface intuitive pour analyser les données.

Les collections sans serveur exécutent actuellement la OpenSearch version 2.0.x. Au fur et à mesure que de nouvelles versions sont publiées, OpenSearch Serverless met automatiquement à niveau vos collections pour utiliser les nouvelles fonctionnalités, les corrections de bogues et les améliorations de performances.

Cas d'utilisation du mode OpenSearch Serverless

OpenSearch Serverless prend en charge deux principaux cas d'utilisation :

  • Analyse des journaux : le segment d'analyse des journaux se concentre sur les grands volumes de données de séries temporelles semi-structurées et générées par des machines, afin d'obtenir des informations sur les opérations et le comportement des utilisateurs.

  • Recherche en texte intégral : le segment de recherche en texte intégral alimente les applications de vos réseaux internes (systèmes de gestion de contenu, documents juridiques) et les applications accessibles sur Internet, telles que la recherche de contenu sur les sites web de commerce en ligne.

Lorsque vous créez une collection, vous choisissez l'un de ces cas d'utilisation. Pour de plus amples informations, veuillez consulter Choix d'un type de collection.

Prérequis

OpenSearch Serverless prend en charge les mêmes API opérations d'ingestion et de requête que la suite OpenSearch open source, ce qui vous permet de continuer à utiliser vos clients et applications existants. Vos clients doivent être compatibles avec la OpenSearch version 2.x pour fonctionner avec OpenSearch Serverless. Pour de plus amples informations, veuillez consulter Ingestion de données dans des collections Amazon OpenSearch Serverless.

Comment ça marche

Les OpenSearch clusters traditionnels possèdent un ensemble unique d'instances qui effectuent à la fois des opérations d'indexation et de recherche, et le stockage d'index est étroitement lié à la capacité de calcul. En revanche, OpenSearch Serverless utilise une architecture native pour le cloud qui sépare les composants d'indexation (ingestion) des composants de recherche (requête), Amazon S3 étant le principal stockage de données pour les index.

Cette architecture découplée vous permet de mettre à l'échelle les fonctions de recherche et d'indexation indépendamment les unes des autres et indépendamment des données indexées dans S3. L'architecture permet également d'isoler les opérations d'ingestion et de requête afin qu'elles puissent s'exécuter simultanément sans conflit de ressources.

Lorsque vous écrivez des données dans une collection, OpenSearch Serverless les distribue aux unités de calcul d'indexation. Les unités de calcul d'indexation ingèrent les données entrantes et déplacent les index vers S3. Lorsque vous effectuez une recherche sur les données de collecte, OpenSearch Serverless achemine les demandes vers les unités de calcul de recherche qui contiennent les données demandées. Les unités de calcul de recherche téléchargent les données indexées directement depuis S3 (si elles ne sont pas déjà mises en cache localement), exécutent des opérations de recherche et effectuent des regroupements.

L'image suivante illustre cette architecture découplée :

Diagram showing indexing and search processes using compute units and Amazon S3 storage.

OpenSearch La capacité de calcul sans serveur pour l'ingestion, la recherche et l'interrogation de données est mesurée en unités de OpenSearch calcul ()OCUs. Chacune OCU est une combinaison de 6 GiB de mémoire et du virtuel CPU (vCPU) correspondant, ainsi que du transfert de données vers Amazon S3. Chacun OCU inclut suffisamment de stockage éphémère à chaud pour 120 GiB de données d'index.

Lorsque vous créez votre première collection, OpenSearch Serverless en instancie deux, l'une pour l'indexation OCUs et l'autre pour la recherche. Afin de garantir une haute disponibilité, il lance également un ensemble de nœuds de secours dans une autre zone de disponibilité. À des fins de développement et de test, vous pouvez désactiver le paramètre Activer la redondance pour une collection, ce qui élimine les deux répliques de secours et n'en instancie que deux. OCUs Par défaut, les répliques actives redondantes sont activées, ce qui signifie qu'un total de quatre répliques OCUs sont instanciées pour la première collection d'un compte.

Ils OCUs existent même lorsqu'il n'y a aucune activité sur les points de terminaison de collecte. Toutes les collections suivantes les partagentOCUs. Lorsque vous créez des collections supplémentaires dans le même compte, OpenSearch Serverless en ajoute uniquement OCUs pour la recherche et l'ingestion si nécessaire pour prendre en charge les collections, conformément aux limites de capacité que vous spécifiez. La capacité diminue à mesure que votre utilisation des ressources informatiques diminue.

Pour plus d'informations sur la façon dont ces frais vous sont facturésOCUs, consultezTarification du mode OpenSearch Serverless.

Choix d'un type de collection

OpenSearch Serverless prend en charge trois types de collecte principaux :

Séries temporelles : segment d'analyse des journaux qui se concentre sur l'analyse en temps réel de grands volumes de données semi-structurées et générées par des machines, à des fins opérationnelles, de sécurité, de comportement des utilisateurs et d'informations métier.

Recherche : recherche en texte intégral qui alimente les applications de vos réseaux internes (systèmes de gestion de contenu, documents juridiques) et les applications accessibles sur Internet, telles que la recherche sur les sites web de commerce en ligne et la recherche de contenu.

Recherche vectorielle : recherche sémantique sur des intégrations vectorielles qui simplifie la gestion des données vectorielles et optimise les expériences de recherche augmentées par apprentissage automatique (ML) et les applications d'IA génératives, telles que les chatbots, les assistants personnels et la détection des fraudes.

Vous choisissez un type de collection lorsque vous créez une collection pour la première fois :

Three collection type options: Time series, Search, and Vector search for different data use cases.

Le type de collection que vous choisissez dépend du type de données que vous prévoyez d'intégrer à la collection et de la manière dont vous allez les interroger. Vous ne pouvez pas modifier le type de la collection après l'avoir créée.

Les types de collection présentent les différences notables suivantes :

  • Pour les collections de recherche et de recherche vectorielle, toutes les données sont stockées dans un espace de stockage à chaud afin de garantir des temps de réponse rapides aux requêtes. Les collections de séries temporelles utilisent une combinaison de stockage à chaud et tiède, les données les plus récentes étant conservées dans un stockage hot afin d'optimiser les temps de réponse aux requêtes pour les données les plus fréquemment consultées.

  • Pour les séries chronologiques et les collections de recherche vectorielle, vous ne pouvez pas indexer par identifiant de document personnalisé ni mettre à jour par des requêtes upsert. Cette opération est réservée aux cas d'utilisation de recherche. Vous pouvez plutôt effectuer une mise à jour par numéro de document. Pour de plus amples informations, veuillez consulter OpenSearch APIOpérations et autorisations prises en charge.

  • Pour les recherches et les collections de séries chronologiques, vous ne pouvez pas utiliser d'index de type K-nn.

Tarification du mode OpenSearch Serverless

Dans OpenSearch Serverless, les composants suivants vous sont facturés :

  • Calcul d'ingestion de données

  • Calcul de recherche et de requêtes

  • Stockage conservé dans Amazon S3

OCUssont facturés sur une base horaire, avec une granularité à la seconde. Dans votre relevé de compte, vous voyez une entrée pour le calcul en OCU -hours avec une étiquette pour l'ingestion de données et une étiquette pour la recherche. Les données stockées dans Amazon S3 vous sont également facturées chaque mois. L'utilisation des OpenSearch tableaux de bord ne vous est pas facturée.

Un minimum de 2 OCUs [0,5 OCU x 2] vous est facturé pour l'ingestion et 1 OCU [0,5 OCU x 2] pour la recherche lorsque vous créez une collection et activez des répliques actives redondantes. Un montant minimum de 1 OCU [0,5 OCU x 2] vous est facturé pour la première collection de votre compte si vous désactivez les répliques actives redondantes. Toutes les collections suivantes peuvent les partagerOCUs.

OpenSearch Serverless OCUs en ajoute par incréments de 1 en OCU fonction de la puissance de calcul et du stockage nécessaires pour prendre en charge vos collections. Vous pouvez configurer un nombre maximum de OCUs pour votre compte afin de contrôler les coûts.

Note

Les collections uniques ne AWS KMS keys peuvent pas être partagées OCUs avec d'autres collections.

OpenSearch Serverless tente d'utiliser les ressources minimales requises pour tenir compte de l'évolution des charges de travail. Le nombre de OCUs fournitures fournies à un moment donné peut varier et n'est pas exact. Au fil du temps, l'algorithme utilisé par OpenSearch Serverless continuera de s'améliorer afin de mieux minimiser l'utilisation du système.

Pour en savoir plus sur les tarifs, consultez les tarifs d'Amazon OpenSearch Service.

Soutenu Régions AWS

OpenSearch Serverless est disponible dans un sous-ensemble de Régions AWS ce OpenSearch service disponible dans. Pour obtenir la liste des régions prises en charge, consultez la section Points OpenSearch de terminaison et quotas Amazon Service dans le Références générales AWS.

Limites

OpenSearch Le mode Serverless présente les limites suivantes :

  • Certaines OpenSearch API opérations ne sont pas prises en charge. Consultez OpenSearch APIOpérations et autorisations prises en charge.

  • Certains OpenSearch plugins ne sont pas pris en charge. Consultez OpenSearch Plugins pris en charge.

  • Il n'existe actuellement aucun moyen de migrer automatiquement vos données d'un domaine de OpenSearch service géré vers une collection sans serveur. Vous devez réindexer vos données d'un domaine vers une collection.

  • L'accès intercompte aux collections n'est pas pris en charge. Vous ne pouvez pas inclure les collections provenant d'autres comptes dans vos stratégies de chiffrement ou d'accès aux données.

  • Les OpenSearch plugins personnalisés ne sont pas pris en charge.

  • Vous ne pouvez pas prendre ou restaurer des instantanés de collections OpenSearch sans serveur.

  • La recherche et la réplication entre régions ne sont pas prises en charge.

  • Le nombre de ressources sans serveur que vous pouvez avoir dans un seul compte et une seule région est limité. Voir Quotas OpenSearch sans serveur.

  • L'intervalle d'actualisation des index dans les collections de recherche vectorielle est d'environ 60 secondes. L'intervalle d'actualisation des index dans les recherches et les collections de séries chronologiques est d'environ 10 secondes.

  • Le nombre de partitions, le nombre d'intervalles et l'intervalle d'actualisation ne sont pas modifiables et sont gérés par OpenSearch Serverless. La stratégie de partitionnement est basée sur le type de collecte et le trafic. Par exemple, une collection de séries chronologiques redimensionne les partitions primaires en fonction des goulots d'étranglement du trafic d'écriture.

  • Les fonctionnalités géospatiales disponibles sur OpenSearch les versions jusqu'à 2.1 sont prises en charge.