Kapazität anpassen - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Kapazität anpassen

Anmerkung

Die Funktionsunterstützung variiert je nach Indextyp und API verwendeter Suche. Informationen darüber, ob diese Funktion für den von Ihnen verwendeten Indextyp und die von API Ihnen verwendete Suche unterstützt wird, finden Sie unter Indextypen.

Amazon Kendra stellt Ressourcen für Ihren Index in Kapazitätseinheiten bereit. Jede Kapazitätseinheit stellt zusätzliche Ressourcen für Ihren Index bereit. Es gibt separate Kapazitätseinheiten für die Speicherung von Dokumenten und für Abfragen. Sie können nur Kapazitätseinheiten zu den Indizes GenAI Enterprise Edition und Amazon Kendra Enterprise hinzufügen. Sie können einem Developer Edition-Index keine Kapazität hinzufügen.

Eine Dokumentenspeicherkapazitätseinheit bietet den folgenden zusätzlichen Speicherplatz für Ihren Index.

  • Amazon Kendra GenAI Enterprise Edition — 20.000 Dokumente oder 200 MB extrahierter Text.

  • Amazon Kendra Enterprise Edition — 100.000 Dokumente oder 30 GB Speicher.

Eine Abfragekapazitätseinheit bietet die folgenden zusätzlichen Abfragen für Ihren Index. Die Abfrage pro Sekunde wird von Abruf und Abfrage gemeinsam genutztAPI.

  • Amazon Kendra GenAI Enterprise Edition — 0,1 Abfragen pro Sekunde oder etwa 8.000 Abfragen pro Tag.

  • Amazon Kendra Enterprise Edition — 0,1 Abfragen pro Sekunde oder etwa 8.000 Abfragen pro Tag.

Jeder Index hat eine Basiskapazität, die einer Kapazitätseinheit entspricht (30 GB/200 MB Speicher und 0,1 Abfragen pro Sekunde). Für jede zusätzliche Kapazitätseinheit fallen zusätzliche Kosten an. Weitere Details finden Sie unter Amazon Kendra -Preise.

Sie können Ihrem Speicher bis zu 100 zusätzliche Kapazitätseinheiten hinzufügen und Ressourcen für einen Index abfragen. Wenn Sie mehr Einheiten benötigen, wenden Sie sich einfach an den Support.

Sie können die Kapazitätseinheiten bis zu fünfmal täglich an Ihre Nutzungsanforderungen anpassen. Sie können die Speicherkapazität für Dokumente nicht unter die Anzahl der in Ihrem Index gespeicherten Dokumente reduzieren. Wenn Sie beispielsweise 150.000 Dokumente speichern, können Sie die Speicherkapazität nicht auf eine zusätzliche Einheit reduzieren.

Sie können die Ressourcen, die ein Index verwendet, in der Konsole anzeigen, indem Sie den Namen des Indexes auswählen, um die Indexeinstellungen und andere Informationen zu öffnen, oder Sie können den DescribeIndexAPI.

Amazon Kendra gibt auch Ausnahmen zurück, wenn Sie die Kapazität eines Indexes überschreiten. Sie erhalten eineServiceQuotaExceededException, wenn die gesamte extrahierte Größe aller Dokumente den Grenzwert für einen Index überschreitet. Sie erhalten a InvalidRequest für jedes Dokument, wenn die Anzahl der Dokumente das Limit für einen Index überschreitet. Sie erhalten eineThrottlingException, wenn die Anzahl der Abfragen pro Sekunde den Grenzwert überschreitet. Weitere Informationen zu Grenzwerten finden Sie unter Kontingente für Amazon Kendra.

Kumulierte Abfragen dauern bis zu 24 Stunden.

Kapazität für die Anzeige

Zeigen Sie mit der Amazon Kendra Konsole die Ressourcen an, die Ihr Index verwendet, indem Sie den Namen Ihres Indexes auswählen, um auf die Details zuzugreifen. Die Konsole bietet auch Nutzungsdiagramme, mit denen Sie ermitteln können, wie viel Speicher- und Abfragekapazität Ihr Index verwendet. Sie können diese Informationen verwenden, um zu planen, wann zusätzliche Kapazität hinzugefügt werden sollte.

So zeigen Sie den Dokumentenspeicher und die Verwendung von Abfragen an (Konsole)
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole zu https://console.aws.amazon.com/kendra/Hause.

  2. Wählen Sie aus der Liste der Indizes den Index aus, auf den Sie zugreifen möchten.

  3. Scrollen Sie zum Bereich Einstellungen, um die aktuelle Gesamtspeicher- und Abfragekapazität für Dokumente anzuzeigen.

Um die Kapazität mithilfe von anzuzeigen Amazon Kendra API, verwenden Sie den CapacityUnits Parameter in DescribeIndexAPI.

Kapazität hinzufügen und entfernen

Wenn Sie zusätzliche Kapazität für Ihren Index benötigen, können Sie diese über die Konsole oder die hinzufügen Amazon Kendra API.

Um Speicher- oder Abfragekapazität hinzuzufügen oder zu entfernen (Konsole)
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole zu https://console.aws.amazon.com/kendra/Hause.

  2. Wählen Sie aus der Liste der Indizes den Index aus, auf den Sie zugreifen möchten.

  3. Wählen Sie Bearbeiten aus oder wählen Sie Bearbeiten aus der Dropdownliste Aktionen aus.

  4. Wählen Sie Weiter aus, um zur Seite mit den Bereitstellungsdetails zu gelangen.

  5. Fügen Sie Kapazitätseinheiten für Dokumentenspeicher und/oder Abfragen hinzu oder entfernen Sie sie.

  6. Wählen Sie weiterhin Weiter aus, um zur Überprüfungsseite zu gelangen, und wählen Sie dann Aktualisieren aus, um Ihre Änderungen zu speichern.

Nachdem Sie die Kapazität Ihres Index aktualisiert haben, kann es mehrere Minuten dauern, bis die Änderungen wirksam werden.

Um Kapazität mithilfe von hinzuzufügen oder zu entfernen Amazon Kendra API, verwenden Sie den CapacityUnits Parameter in UpdateIndexAPI.

Amazon Kendra Kapazität für intelligentes Ranking

Eine Kapazitätseinheit stellt die folgenden zusätzlichen Rescore-Anfragen pro Sekunde für einen Rescore-Ausführungsplan bereit. Ein Rescore-Ausführungsplan ist eine Ressource, die zur Bereitstellung des Rescores verwendet wird. API

  • 0,01 Anfragen pro Sekunde.

Jeder Rescore-Ausführungsplan hat eine Basiskapazität, die 1 Kapazitätseinheit (0,01 Anfragen pro Sekunde) entspricht. Für jede zusätzliche Kapazitätseinheit fallen zusätzliche Kosten an. Weitere Details finden Sie unter Amazon Kendra -Preise.

Sie können bis zu 1000 zusätzliche Kapazitätseinheiten für einen Rescore-Ausführungsplan hinzufügen. Wenn Sie mehr Einheiten benötigen, wenden Sie sich einfach an den Support.

Kapazität für Vorschläge abfragen

Bei der Verwendung von Abfragevorschlägen gibt es eine Basisabfragekapazität von 2,5 GetQuerySuggestionsAufrufen pro Sekunde. Die GetQuerySuggestions Kapazität entspricht dem Fünffachen der bereitgestellten Abfragekapazität für einen Index oder der Basiskapazität von 2,5 Aufrufen pro Sekunde, je nachdem, welcher Wert höher ist. Zum Beispiel beträgt die Basiskapazität für einen Index 0,1 Abfragen pro Sekunde, und die GetQuerySuggestions-Kapazität hat eine Basis von 2,5 Anrufen pro Sekunde. Wenn Sie weitere 0,1 Abfragen pro Sekunde hinzufügen, um insgesamt 0,2 Abfragen pro Sekunde für einen Index zu erhalten, ist die GetQuerySuggestions-Kapazität 2,5 Aufrufe pro Sekunde (höher als fünf mal 0,2 Abfragen pro Sekunde).

Amazon Kendra Kapazität erleben

Kapazität für Sucherlebnisse

Amazon Kendra beginnt QueryQuerySuggestions, SubmitFeedback Ihrer Amazon Kendra Erfahrung nach auf 15 Anfragen pro Sekunde und 40 Anfragen pro Sekunde beim Abfrage-Bursting zu drosseln. Für einen Index mit mehr als 150 Abfragekapazitätseinheiten gelten diese Grenzwerte weiterhin.

Ihre Abfragekapazitätseinheiten für Ihren Index sind beispielsweise 150, sodass Ihre Search Experience-Anwendung 15 Anfragen pro Sekunde verarbeiten kann. Wenn Sie jedoch auf 200 Kapazitätseinheiten für Abfragen skalieren würden, würde Ihre Search Experience-App immer noch nur 15 Anfragen pro Sekunde verarbeiten. Wenn Sie Ihren Index auf 100 Kapazitätseinheiten für Abfragen beschränken, würde Ihre Search Experience-App nur 10 Anfragen pro Sekunde verarbeiten.

Adaptives Abfrage-Bursting

Amazon Kendra hat eine bereitgestellte Basiskapazität von 1 Abfragekapazitätseinheit. Sie können bis zu 8.000 Abfragen pro Tag mit einem Mindestdurchsatz von 0,1 Abfragen pro Sekunde (pro Abfragekapazitätseinheit) verwenden. Kumulierte Abfragen dauern bis zu 24 Stunden und können Datenfluten bewältigen. Die Anzahl der zulässigen Bursts variiert, da sie von der Auslastung des Clusters zu einem bestimmten Zeitpunkt abhängt. Stellen Sie genügend Abfragekapazitätseinheiten bereit, um Ihre Spitzenlastwerte zu bewältigen.

Ein adaptiver Ansatz für den Umgang mit unerwarteten Datenverkehrsspitzen, die über den bereitgestellten Durchsatz hinausgehen, Amazon Kendra ist das integrierte adaptive Query-Bursting. Adaptives Query-Bursting ist in der Enterprise Edition von verfügbar. Amazon Kendra

Adaptives Query-Bursting ist eine integrierte Funktion, mit der Sie ungenutzte Abfragekapazität nutzen können, um unerwarteten Datenverkehr zu verarbeiten. Amazon Kendra sammelt Ihre ungenutzten Abfragen mit der Rate Ihrer bereitgestellten Abfragen pro Sekunde, jede Sekunde, bis zur maximalen Anzahl von Abfragen, die Sie für Ihren Index bereitgestellt haben. Amazon Kendra Diese gesammelten Abfragen werden für unerwarteten Datenverkehr verwendet, der die zugewiesene Kapazität übersteigt. Die optimale Leistung von adaptivem Query-Bursting kann variieren und hängt von verschiedenen Faktoren ab, wie z. B. der Gesamtgröße Ihres Indexes, der Komplexität der Abfragen, der Anzahl ungenutzter Abfragen und der Gesamtauslastung Ihres Index. Es wird empfohlen, dass Sie Ihre eigenen Lasttests durchführen, um die Bursting-Kapazität genau zu messen.