Ajuste de la capacidad - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajuste de la capacidad

Amazon Kendra proporciona recursos para su índice en unidades de capacidad. Cada unidad de capacidad proporciona recursos adicionales para el índice. Hay unidades de capacidad independientes para el almacenamiento de documentos y para las consultas. Solo puede añadir unidades de capacidad a los índices de Amazon Kendra Enterprise Edition. No puede agregar capacidad a un índice de Developer Edition.

Una unidad de capacidad de almacenamiento de documentos proporciona el siguiente espacio de almacenamiento adicional para el índice.

  • 100 000 documentos o 30 GB de almacenamiento.

Una unidad de capacidad de consulta proporciona las siguientes consultas adicionales para el índice.

  • 0,1 consultas de por segundo o aproximadamente 8000 consultas al día.

Cada índice incluye una capacidad base equivalente a 1 unidad de capacidad (30 GB de almacenamiento y 0,1 consultas por segundo). Hay un coste adicional por cada unidad de capacidad adicional. Consulte Precios de Amazon Kendra para obtener más información.

Puede agregar hasta 100 unidades de capacidad adicional a sus recursos de almacenamiento y de consulta para un índice. Si necesita más unidades, simplemente póngase en contacto con Support.

Puede ajustar las unidades de capacidad hasta 5 veces al día para adaptarse a sus necesidades de uso. No puede reducir la capacidad de almacenamiento de documentos por debajo del número de documentos almacenados en el índice. Por ejemplo, si almacena 150 000 documentos, no puede reducir la capacidad de almacenamiento por debajo de 1 unidad adicional.

Puede ver los recursos que utiliza un índice en la consola seleccionando el nombre del índice para abrir la configuración del índice y otra información, o bien puede utilizar la DescribeIndexAPI.

Amazon Kendra también devuelve excepciones cuando se supera la capacidad de un índice. Se obtiene un valor ServiceQuotaExceededException cuando el tamaño total extraído de todos los documentos supera el límite de un índice. Se obtiene un valor InvalidRequest para cada documento cuando el número de documentos supere el límite de un índice. Se obtiene un valor ThrottlingException cuando el número de consultas por segundo supera el límite. Para obtener más información sobre los límites, consulte Cuotas para Amazon Kendra.

Las consultas acumuladas durarán hasta 24 horas.

Visualización de la capacidad

Para ver los recursos que utiliza el índice con la Amazon Kendra consola, seleccione el nombre del índice para acceder a los detalles. La consola también proporciona gráficos de uso para que pueda determinar la capacidad de almacenamiento y consulta que utiliza el índice. Puede utilizar esta información para planificar cuándo agregar capacidad adicional.

Para ver el almacenamiento de documentos y el uso de consultas (consola)
  1. Inicie sesión AWS Management Console y abra la Amazon Kendra consola en https://console.aws.amazon.com/kendra/home.

  2. En la lista de índices, seleccione el índice al que desea acceder.

  3. Desplácese hasta la sección de configuración para ver la capacidad total actual de almacenamiento de documentos y consulta.

Para ver la capacidad mediante la Amazon Kendra API, utilice el CapacityUnits parámetro de la DescribeIndexAPI.

Agregar y eliminar capacidad

Si necesita capacidad adicional para su índice, puede agregarla mediante la consola o la Amazon Kendra API.

Para agregar o eliminar capacidad de almacenamiento o de consulta (consola)
  1. Inicie sesión AWS Management Console y abra la Amazon Kendra consola en https://console.aws.amazon.com/kendra/home.

  2. En la lista de índices, seleccione el índice al que desea acceder.

  3. Seleccione Editar o seleccione Editar en el menú desplegable Acciones.

  4. Seleccione Siguiente para ir a la página de detalles de aprovisionamiento.

  5. Agregue o elimine unidades de capacidad de almacenamiento de documentos o de consulta.

  6. Continúe seleccionando Siguiente para ir a la página de revisión y, a continuación, seleccione Actualizar para guardar los cambios.

Después de la actualización de la capacidad del índice, pueden pasar varios minutos hasta que los cambios surtan efecto.

Para añadir o eliminar capacidad mediante la Amazon Kendra API, utiliza el CapacityUnits parámetro de la UpdateIndexAPI.

Amazon Kendra Capacidad de clasificación inteligente

Una unidad de capacidad proporciona las siguientes solicitudes de repuntuación adicionales por segundo para un plan de ejecución de repuntuación. Un plan de ejecución de repuntuación es un recurso que se utiliza para aprovisionar la API Rescore.

  • 0,01 solicitudes por segundo.

Cada plan de ejecución de repuntuación incluye una capacidad base igual a 1 unidad de capacidad (0,01 solicitudes por segundo). Hay un coste adicional por cada unidad de capacidad adicional. Consulte Precios de Amazon Kendra para obtener más información.

Puede agregar hasta 1000 unidades de capacidad adicional para un plan de ejecución de repuntuación. Si necesita más unidades, simplemente póngase en contacto con Support.

Capacidad de sugerencias de consulta

Cuando se utilizan sugerencias de consultas, hay una capacidad de consulta básica de 2,5 GetQuerySuggestionsllamadas por segundo. La capacidad de GetQuerySuggestions es cinco veces la capacidad de consulta aprovisionada para un índice o la capacidad base de 2,5 llamadas por segundo, la que sea mayor. Por ejemplo, la capacidad base de un índice es de 0,1 consultas por segundo, y la capacidad de GetQuerySuggestions tiene una base de 2,5 llamadas por segundo. Si se agregan otras 0,1 consultas por segundo al total de 0,2 consultas por segundo para un índice, la capacidad de GetQuerySuggestions es de 2,5 llamadas por segundo (mayor que cinco veces 0,2 consultas por segundo).

Amazon Kendra capacidad de experiencia

Capacidad de experiencia de búsqueda

Amazon Kendra comienza a acelerarse QueryQuerySuggestions, SubmitFeedback para su Amazon Kendra experiencia, a 15 solicitudes por segundo y 40 solicitudes por segundo a ráfagas de consultas. En el caso de un índice con más de 150 unidades de capacidad de consulta, se seguirán aplicando estos límites.

Por ejemplo, las unidades de capacidad de consulta del índice son 150, por lo que la aplicación de experiencia de búsqueda puede gestionar 15 solicitudes por segundo. Sin embargo, si lo escalara a 200 unidades de capacidad de consulta, su aplicación de experiencia de búsqueda seguiría gestionando solo 15 solicitudes por segundo. Si limita el índice a 100 unidades de capacidad de consulta, su aplicación de experiencia de búsqueda gestionaría solo 10 solicitudes por segundo.

Ráfaga de consultas adaptativas

Amazon Kendra tiene una capacidad base aprovisionada de 1 unidad de capacidad de consulta. Puede utilizar hasta 8000 consultas al día con un rendimiento mínimo de 0,1 consultas por segundo (por unidad de capacidad de consulta). Las consultas acumuladas durarán hasta 24 horas y pueden adaptarse a ráfagas de tráfico. La cantidad de ráfaga permitida varía porque depende de la carga del clúster en un momento dado. Aprovisione suficientes unidades de capacidad de consulta para gestionar los picos de carga.

Un enfoque adaptativo para gestionar ráfagas de tráfico inesperadas que superen el rendimiento previsto es la fragmentación Amazon Kendra de consultas adaptativa integrada. La ráfaga de consultas adaptativas está disponible en la edición Enterprise de Amazon Kendra.

La fragmentación adaptativa de consultas es una función integrada que permite utilizar la capacidad de consulta no utilizada para gestionar el tráfico inesperado. Amazon Kendra acumula las consultas no utilizadas a una tasa de consultas aprovisionadas por segundo, cada segundo, hasta el número máximo de consultas que haya aprovisionado para su índice. Amazon Kendra Estas consultas acumuladas se utilizan para el tráfico inesperado que supere la capacidad asignada. El rendimiento óptimo de la ráfaga de consultas adaptativas puede variar en función de varios factores, como el tamaño total del índice, la complejidad de las consultas, la acumulación de consultas no utilizadas y la carga general del índice. Se recomienda realizar sus propias pruebas de carga para medir con precisión la capacidad de transmisión por ráfagas.