Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Regolazione della capacità
Nota
Il supporto delle funzionalità varia in base al tipo di indice e alla ricerca API utilizzata. Per verificare se questa funzionalità è supportata per il tipo di indice e la ricerca API che stai utilizzando, consulta Tipi di indice.
Amazon Kendra fornisce risorse per l'indice in unità di capacità. Ogni unità di capacità fornisce risorse aggiuntive per l'indice. Esistono unità di capacità separate per l'archiviazione dei documenti e per le interrogazioni. È possibile aggiungere unità di capacità solo agli indici GenAI Enterprise Edition ed Enterprise. Amazon Kendra Non è possibile aggiungere capacità a un indice Developer Edition.
Un'unità di capacità di archiviazione dei documenti fornisce il seguente spazio di archiviazione aggiuntivo per l'indice.
-
Amazon Kendra GenAI Enterprise Edition: 20.000 documenti o 200 MB di testo estratto.
-
Amazon Kendra Enterprise Edition: 100.000 documenti o 30 GB di spazio di archiviazione.
Un'unità di capacità di interrogazione fornisce le seguenti interrogazioni aggiuntive per l'indice. Le query al secondo vengono condivise tra retrieve e query. API
-
Amazon Kendra GenAI Enterprise Edition: 0,1 query al secondo o circa 8.000 query al giorno.
-
Amazon Kendra Enterprise Edition: 0,1 query al secondo o circa 8.000 query al giorno.
Ogni indice ha una capacità di base pari a 1 unità di capacità (30 GB/200 MB di storage e 0,1 query al secondo). È previsto un costo aggiuntivo per ogni unità di capacità aggiuntiva. Per informazioni dettagliate, consulta Prezzi di Amazon Kendra
È possibile aggiungere fino a 100 unità di capacità extra alle risorse di storage e interrogare un indice. Se hai bisogno di più unità, contatta semplicemente l'assistenza
È possibile regolare la capacità delle unità fino a 5 volte al giorno in base alle proprie esigenze di utilizzo. Non è possibile ridurre la capacità di archiviazione dei documenti al di sotto del numero di documenti archiviati nell'indice. Ad esempio, se stai archiviando 150.000 documenti, non puoi ridurre la capacità di archiviazione al di sotto di 1 unità aggiuntiva.
È possibile visualizzare le risorse utilizzate da un indice nella console selezionando il nome dell'indice per aprire le impostazioni dell'indice e altre informazioni oppure utilizzare il DescribeIndexAPI.
Amazon Kendra restituisce anche eccezioni quando si supera la capacità di un indice. Si ottiene un ServiceQuotaExceededException
quando la dimensione totale estratta di tutti i documenti supera il limite di un indice. Si ottiene un valore InvalidRequest
per ogni documento quando il numero di documenti supera il limite di un indice. Si ottiene un ThrottlingException
quando il numero di interrogazioni al secondo supera il limite. Per ulteriori informazioni sui limiti, consulta Quotas for. Amazon Kendra
Le interrogazioni accumulate dureranno fino a 24 ore.
Capacità di visualizzazione
Visualizza le risorse utilizzate dall'indice con la Amazon Kendra console selezionando il nome dell'indice per accedere ai dettagli. La console fornisce anche grafici di utilizzo che consentono di determinare la capacità di storage e di interrogazione utilizzata dall'indice. È possibile utilizzare queste informazioni per pianificare quando aggiungere capacità aggiuntiva.
Per visualizzare l'archiviazione dei documenti e le query, usa (console)
-
Accedi a AWS Management Console e apri la Amazon Kendra console da https://console.aws.amazon.com/kendra/casa
. -
Dall'elenco degli indici, scegli l'indice a cui desideri accedere.
-
Scorri fino alla sezione delle impostazioni per visualizzare l'attuale capacità totale di archiviazione dei documenti e la capacità di interrogazione.
Per visualizzare la capacità utilizzando il Amazon Kendra API, utilizzare il CapacityUnits
parametro in DescribeIndexAPI.
Aggiungere e rimuovere capacità
Se hai bisogno di capacità aggiuntiva per l'indice, puoi aggiungerla utilizzando la console o il Amazon Kendra API.
Per aggiungere o rimuovere la capacità di archiviazione o di interrogazione (console)
-
Accedi a AWS Management Console e apri la Amazon Kendra console a https://console.aws.amazon.com/kendra/casa
. -
Dall'elenco degli indici, scegli l'indice a cui desideri accedere.
-
Seleziona Modifica o seleziona Modifica dal menu a discesa Azioni.
-
Seleziona Avanti per accedere alla pagina dei dettagli del provisioning.
-
Aggiungi o rimuovi unità di capacità di archiviazione dei documenti e/o di interrogazione.
-
Continua a selezionare Avanti per andare alla pagina di revisione, quindi seleziona Aggiorna per salvare le modifiche.
Dopo aver aggiornato la capacità dell'indice, possono essere necessari alcuni minuti prima che le modifiche abbiano effetto.
Per aggiungere o rimuovere capacità utilizzando il Amazon Kendra API, utilizza il CapacityUnits
parametro in UpdateIndexAPI.
Amazon Kendra Capacità di classificazione intelligente
Un'unità di capacità fornisce le seguenti richieste di rescore aggiuntive al secondo per un piano di esecuzione di rescore. Un piano di esecuzione di rescore è una risorsa utilizzata per fornire Rescore. API
-
0,01 richieste al secondo.
Ogni piano di esecuzione di rescore ha una capacità di base pari a 1 unità di capacità (0,01 richieste al secondo). È previsto un costo aggiuntivo per ogni unità di capacità aggiuntiva. Per informazioni dettagliate, consulta Prezzi di Amazon Kendra
È possibile aggiungere fino a 1000 unità di capacità extra per un piano di esecuzione di rescore. Se hai bisogno di più unità, contatta semplicemente l'assistenza
Capacità di interrogazione e suggerimenti
Quando si utilizzano i suggerimenti di query, esiste una capacità di query di base di 2,5 GetQuerySuggestionschiamate al secondo. La GetQuerySuggestions
capacità è cinque volte la capacità di interrogazione fornita per un indice o la capacità di base di 2,5 chiamate al secondo, a seconda di quale sia il valore maggiore. Ad esempio, la capacità di base per un indice è di 0,1 query al secondo e la capacità di GetQuerySuggestions
ha una base di 2,5 chiamate al secondo. Se aggiungi altre 0,1 query al secondo a un totale di 0,2 query al secondo per un indice, la capacità di GetQuerySuggestions
è di 2,5 chiamate al secondo (superiore a cinque volte 0,2 query al secondo).
Amazon Kendra capacità di esperienza
Capacità di esperienza di ricerca
Amazon Kendra inizia a rallentare, Query
QuerySuggestions
, SubmitFeedback
la tua Amazon Kendra esperienza a 15 richieste al secondo e 40 richieste al secondo in caso di query bursting. Per un indice con più di 150 unità di capacità di interrogazione, questi limiti sono ancora validi.
Ad esempio, le unità di capacità di query per l'indice sono 150, quindi l'applicazione per l'esperienza di ricerca può gestire 15 richieste al secondo. Tuttavia, se passassi a 200 unità di capacità di query, la tua app per l'esperienza di ricerca continuerebbe a gestire solo 15 richieste al secondo. Se limiti l'indice a 100 unità di capacità di query, la tua app per l'esperienza di ricerca gestirà solo 10 richieste al secondo.
Scoppio di query adattive
Amazon Kendra ha una capacità di base prevista di 1 unità di capacità di interrogazione. È possibile utilizzare fino a 8.000 query al giorno con un throughput minimo di 0,1 query al secondo (per unità di capacità di query). Le query accumulate dureranno fino a 24 ore e possono gestire picchi di traffico. La quantità di burst consentita varia perché dipende dal carico del cluster in un dato momento. Fornisci un numero sufficiente di unità di capacità di interrogazione per gestire i livelli di carico di picco.
Un approccio adattivo alla gestione di picchi di traffico imprevisti oltre il throughput assegnato è l'adaptive query Amazon Kendra bursting integrato. L'Adaptive Query Bursting è disponibile nell'Enterprise Edition di. Amazon Kendra
L'Adaptive Query Bursting è una funzionalità integrata che consente di applicare la capacità di interrogazione inutilizzata per gestire il traffico imprevisto. Amazon Kendra accumula le query inutilizzate alla frequenza di query preimpostate al secondo, ogni secondo, fino al numero massimo di query che hai fornito per l'indice. Amazon Kendra Queste query accumulate vengono utilizzate per traffico imprevisto superiore alla capacità allocata. Le prestazioni ottimali dell'adaptive query bursting possono variare in base a diversi fattori, quali la dimensione totale dell'indice, la complessità delle query, l'accumulo di query non utilizzate e il carico complessivo dell'indice. Si consiglia di eseguire test di carico personalizzati per misurare con precisione la capacità di bursting.