Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Ajustement de la capacité
Note
La prise en charge des fonctionnalités varie en fonction du type d'index et de la recherche API utilisés. Pour savoir si cette fonctionnalité est prise en charge pour le type d'index et la recherche que API vous utilisez, consultez la section Types d'index.
Amazon Kendra fournit des ressources pour votre index en unités de capacité. Chaque unité de capacité fournit des ressources supplémentaires pour votre index. Il existe des unités de capacité distinctes pour le stockage des documents et pour les requêtes. Vous ne pouvez ajouter des unités de capacité qu'aux indices GenAI Enterprise Edition et Amazon Kendra Enterprise. Vous ne pouvez pas ajouter de capacité à un index Developer Edition.
Une unité de capacité de stockage de documents fournit le stockage supplémentaire suivant pour votre index.
-
Amazon Kendra GenAI Enterprise Edition — 20 000 documents ou 200 Mo de texte extrait.
-
Amazon Kendra Enterprise Edition : 100 000 documents ou 30 Go de stockage.
Une unité de capacité de requête fournit les requêtes supplémentaires suivantes pour votre index. Le nombre de requêtes par seconde est partagé entre le retrieve et le queryAPI.
-
Amazon Kendra GenAI Enterprise Edition : 0,1 requête par seconde, soit environ 8 000 requêtes par jour.
-
Amazon Kendra Enterprise Edition : 0,1 requête par seconde, soit environ 8 000 requêtes par jour.
Chaque index est doté d'une capacité de base égale à 1 unité de capacité (30 Go/200Mo de stockage et 0,1 requête par seconde). Il y a un coût supplémentaire pour chaque unité de capacité supplémentaire. Pour de plus amples informations, veuillez consulter Tarification Amazon Kendra
Vous pouvez ajouter jusqu'à 100 unités de capacité supplémentaires à votre espace de stockage et interroger des ressources pour obtenir un index. Si vous avez besoin de plus d'unités, contactez simplement le Support
Vous pouvez ajuster les unités de capacité jusqu'à 5 fois par jour pour répondre à vos besoins d'utilisation. Vous ne pouvez pas réduire la capacité de stockage des documents en dessous du nombre de documents stockés dans votre index. Par exemple, si vous stockez 150 000 documents, vous ne pouvez pas réduire la capacité de stockage en dessous d'une unité supplémentaire.
Vous pouvez afficher les ressources utilisées par un index dans la console en sélectionnant le nom de l'index pour ouvrir les paramètres de l'index et d'autres informations, ou vous pouvez utiliser le DescribeIndexAPI.
Amazon Kendra renvoie également des exceptions lorsque vous dépassez la capacité d'un index. Vous obtenez un ServiceQuotaExceededException
lorsque la taille totale extraite de tous les documents dépasse la limite d'un index. Vous obtenez un InvalidRequest
pour chaque document lorsque le nombre de documents dépasse la limite d'un index. Vous obtenez un ThrottlingException
lorsque le nombre de requêtes par seconde dépasse la limite. Pour plus d'informations sur les limites, consultez la section Quotas pour Amazon Kendra.
Les requêtes accumulées dureront jusqu'à 24 heures.
Capacité de visionnage
Consultez les ressources utilisées par votre index avec la Amazon Kendra console en sélectionnant le nom de votre index pour accéder aux détails. La console fournit également des graphiques d'utilisation qui vous permettent de déterminer la capacité de stockage et de requête utilisée par votre index. Vous pouvez utiliser ces informations pour vous aider à planifier à quel moment ajouter de la capacité supplémentaire.
Pour afficher le stockage des documents et utiliser les requêtes (console)
-
Connectez-vous à la Amazon Kendra console AWS Management Console et ouvrez-la à la https://console.aws.amazon.com/kendra/maison
. -
Dans la liste des index, choisissez l'index auquel vous souhaitez accéder.
-
Accédez à la section des paramètres pour afficher le stockage total actuel des documents et la capacité de requête.
Pour afficher la capacité à l'aide du Amazon Kendra API, utilisez le CapacityUnits
paramètre du DescribeIndexAPI.
Ajouter et supprimer de la capacité
Si vous avez besoin d'une capacité supplémentaire pour votre index, vous pouvez l'ajouter à l'aide de la console ou du Amazon Kendra API.
Pour ajouter ou supprimer de la capacité de stockage ou de requête (console)
-
Connectez-vous à la Amazon Kendra console AWS Management Console et ouvrez-la à la https://console.aws.amazon.com/kendra/maison
. -
Dans la liste des index, choisissez l'index auquel vous souhaitez accéder.
-
Sélectionnez Modifier ou sélectionnez Modifier dans le menu déroulant Actions.
-
Sélectionnez Suivant pour accéder à la page des détails du provisionnement.
-
Ajoutez ou supprimez des unités de capacité de stockage de documents et/ou de capacité de requête.
-
Continuez à sélectionner Suivant pour accéder à la page de révision, puis sélectionnez Mettre à jour pour enregistrer vos modifications.
Une fois que vous avez mis à jour la capacité de votre index, plusieurs minutes peuvent être nécessaires pour que les modifications prennent effet.
Pour ajouter ou supprimer de la capacité à l'aide du Amazon Kendra API, utilisez le CapacityUnits
paramètre du UpdateIndexAPI.
Amazon Kendra Capacité de classement intelligente
Une unité de capacité fournit les demandes de renotation supplémentaires suivantes par seconde pour un plan d'exécution de la renotation. Un plan d'exécution du rescore est une ressource utilisée pour provisionner le APIRescore.
-
0,01 requêtes par seconde.
Chaque plan d'exécution du rescore est doté d'une capacité de base égale à 1 unité de capacité (0,01 requêtes par seconde). Il y a un coût supplémentaire pour chaque unité de capacité supplémentaire. Pour de plus amples informations, veuillez consulter Tarification Amazon Kendra
Vous pouvez ajouter jusqu'à 1 000 unités de capacité supplémentaires pour un plan d'exécution de la nouvelle notation. Si vous avez besoin de plus d'unités, contactez simplement le Support
Capacité de suggestions de requêtes
Lorsque vous utilisez des suggestions de requêtes, la capacité de requête de base est de 2,5 GetQuerySuggestionsappels par seconde. La GetQuerySuggestions
capacité est cinq fois supérieure à la capacité de requête allouée pour un index, ou à la capacité de base de 2,5 appels par seconde, selon la valeur la plus élevée. Par exemple, la capacité de base d'un index est de 0,1 requête par seconde, et la capacité GetQuerySuggestions
a une base de 2,5 appels par seconde. Si vous ajoutez 0,1 requête supplémentaire par seconde pour un total de 0,2 requête par seconde pour un index, la capacité GetQuerySuggestions
est de 2,5 appels par seconde (supérieure à cinq fois 0,2 requête par seconde).
Amazon Kendra capacité d'expérience
Capacité d'expérience de recherche
Amazon Kendra commence à s'accélérer Query
QuerySuggestions
, SubmitFeedback
pour votre Amazon Kendra expérience à 15 requêtes par seconde et à 40 demandes par seconde pour l'éclatement des requêtes. Pour un index comportant plus de 150 unités de capacité de requête, ces limites s'appliquent toujours.
Par exemple, vos unités de capacité de requête pour votre index sont de 150, de sorte que votre application d'expérience de recherche peut traiter 15 requêtes par seconde. Toutefois, si vous passiez à 200 unités de capacité de requête, votre application d'expérience de recherche ne traiterait toujours que 15 requêtes par seconde. Si vous limitez votre index à 100 unités de capacité de requête, votre application d'expérience de recherche ne traitera que 10 requêtes par seconde.
rafale de requêtes adaptative
Amazon Kendra possède une capacité de base provisionnée de 1 unité de capacité de requête. Vous pouvez utiliser jusqu'à 8 000 requêtes par jour avec un débit minimum de 0,1 requête par seconde (par unité de capacité de requête). Les requêtes accumulées dureront jusqu'à 24 heures et peuvent faire face à des pics de trafic. La quantité de rafale autorisée varie car elle dépend de la charge du cluster à un moment donné. Fournissez suffisamment d'unités de capacité de requête pour gérer vos pics de charge.
Une approche adaptative permettant de gérer les pics de trafic inattendus au-delà du débit fourni est l'éclatement Amazon Kendra de requêtes adaptatif intégré. La fonction Adaptive Query Bursting est disponible dans l'édition Enterprise de Amazon Kendra.
La compression adaptative des requêtes est une fonctionnalité intégrée qui vous permet d'appliquer une capacité de requête inutilisée pour gérer le trafic inattendu. Amazon Kendra accumule vos requêtes inutilisées au rythme des requêtes provisionnées par seconde, chaque seconde, jusqu'au nombre maximum de requêtes que vous avez provisionnées pour votre index. Amazon Kendra Ces requêtes accumulées sont utilisées pour le trafic inattendu supérieur à la capacité allouée. Les performances optimales de la compression adaptative des requêtes peuvent varier en fonction de plusieurs facteurs tels que la taille totale de votre index, la complexité des requêtes, le cumul de requêtes inutilisées et la charge globale de votre index. Il est recommandé d'effectuer vos propres tests de charge pour mesurer avec précision la capacité d'éclatement.