Directrices y cuotas - Amazon Comprehend

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Directrices y cuotas

A menos que se especifique lo contrario, las cuotas de Amazon Comprehend son por región. Puede solicitar un aumento de las cuotas ajustables si lo necesita para sus aplicaciones. Para obtener más información acerca de las cuotas y de cómo solicitar un aumento de estas, consulte AWS Service Quotas.

Regiones admitidas

Amazon Comprehend está disponible en las siguientes regiones: AWS

  • US East (Ohio)

  • Este de EE. UU. (Norte de Virginia)

  • Oeste de EE. UU. (Oregón)

  • Asia-Pacífico (Bombay)

  • Asia-Pacífico (Seúl)

  • Asia-Pacífico (Singapur)

  • Asia-Pacífico (Sídney)

  • Asia-Pacífico (Tokio)

  • Canadá (centro)

  • Europa (Fráncfort)

  • Europa (Irlanda)

  • Europa (Londres)

  • AWS GovCloud (EE. UU.-Oeste)

De forma predeterminada, Amazon Comprehend proporciona todas las operaciones de API en cada una de las regiones compatibles. Para conocer las excepciones, consulte Procesamiento de documentos.

Para obtener información acerca del uso de puntos de conexión de API, consulte Regiones y puntos de conexión de Amazon Comprehend en la Referencia general de Amazon Web Services.

Para revisar las cuotas actuales de una región o para solicitar un aumento de la cuota de aquellas cuotas que sean ajustables, abra la consola Service Quotas.

Cuotas para modelos integrados

Amazon Comprehend ofrece modelos integrados para analizar documentos de texto en UTF-8. Amazon Comprehend ofrece operaciones síncronas y asíncronas que utilizan los modelos integrados.

Análisis en tiempo real (sincrónico)

En esta sección se describen las cuotas relacionadas con el análisis en tiempo real que usan los modelos integrados.

Operaciones con un solo documento

La API de Amazon Comprehend ofrece operaciones que utilizan un único documento como entrada. Las siguientes cuotas se aplican a estas operaciones.

Cuotas generales para las operaciones con un solo documento

Las siguientes cuotas aplican al análisis en tiempo real para la detección de entidades, de frases clave o del idioma predominante. Para la detección de entidades, estas cuotas se aplican a la detección con los modelos integrados. Para la detección de entidades personalizadas, consulte las cuotas en Reconocimiento de entidades personalizado .

Descripción Cuota/Directriz
Tamaño máximo del documento 100 KB
Cuotas de operaciones específicas para operaciones con un solo documento

Las siguientes cuotas se aplican al análisis en tiempo real para detectar opiniones, opiniones específicas y sintaxis.

Descripción Cuota/Directriz
Tamaño máximo del documento 5 KB

Operaciones con varios documentos

La API de Amazon Comprehend ofrece operaciones por lotes que procesan varios documentos con una sola solicitud de API. Las siguientes cuotas se aplican a las operaciones por lotes.

Descripción Cuota/Directriz
Tamaño máximo del documento 5 KB
Número máximo de documentos por solicitud 25

Para obtener más información sobre cómo usar las operaciones de documentos por lotes, consulte Procesamiento sincrónico de varios documentos.

Limitación de solicitudes para solicitudes en tiempo real (síncronas)

Amazon Comprehend aplica una limitación dinámica a las solicitudes síncronas. Si el ancho de banda de procesamiento del sistema está disponible, Amazon Comprehend aumenta gradualmente el número de solicitudes que procesa. Para controlar el uso que hace su aplicación de las operaciones sincrónicas de la API, le recomendamos que active las alertas de facturación o implemente una limitación de velocidad en su aplicación.

Análisis asíncrono

En esta sección se describen las cuotas relacionadas con el análisis asíncrono que usa los modelos integrados.

Cada una de las operaciones asíncronas de la API admite un máximo de 10 trabajos activos. Para ver las cuotas de cada operación de la API, consulte la tabla Service Quotas en Puntos de conexión y cuotas de Amazon Comprehend en la Referencia general de Amazon Web Services.

Puede solicitar un aumento de la cuota para aquellas cuotas que sean ajustables a través de la consola de Service Quotas.

Cuotas generales para operaciones asíncronas

Puede ejecutar trabajos de análisis asíncronos usando la consola o cualquiera de las operaciones Start* de la API. Para obtener información acerca de cómo usar las operaciones asíncronas, consulte Procesamiento por lotes asincrónico. Las siguientes cuotas se aplican a la mayoría de las operaciones Start* de la API para los modelos integrados. Para conocer las excepciones, consulte Cuotas de operaciones específicas para trabajos asíncronos.

Descripción Cuota/Directriz
Tamaño máximo de cada documento en trabajos que detectan entidades, frases clave, información de identificación personal e idiomas 1 MB
Tamaño total máximo de todos los archivos de una solicitud 5 GB
Tamaño total mínimo de todos los archivos de una solicitud 500 bytes
Número máximo de archivos, un documento por archivo 1 000 000
Número máximo total de líneas, un documento por línea 1 000 000

Cuotas de operaciones específicas para trabajos asíncronos

En esta sección se describen las cuotas para las operaciones asincrónicas específicas. Si no se especifica una cuota en las siguientes tablas, se aplicará el valor de cuota general.

Opinión

Los trabajos de opinión asíncronos, que se crean con la StartSentimentDetectionJoboperación, tienen las siguientes cuotas.

Descripción Cuota/Directriz
Tamaño máximo de cada documento de entrada 5 KB
Opiniones específicas

Los trabajos de opinión segmentados asíncronos, que se crean con la StartTargetedSentimentDetectionJoboperación, tienen las siguientes cuotas.

Descripción Cuota/Directriz
Formatos de documentos admitidos UTF-8
Tamaño máximo de cada documento en un trabajo 10 KB
Tamaño máximo de todos los documentos en un trabajo 300 MB
Número máximo de archivos, un documento por archivo 30.000
Número máximo total de líneas, un documento por línea (para todos los archivos de una solicitud) 30.000
Eventos

Los trabajos de detección de eventos asíncronos, que se crean con la StartEventsDetectionJoboperación, tienen las siguientes cuotas.

Descripción Cuotas
Codificación de caracteres UTF-8
Tamaño total de todos los archivos en un trabajo 50 MB
Tamaño máximo de cada documento en un trabajo 10 KB
Número máximo de archivos, un documento por archivo 5 000
Número máximo total de líneas, un documento por línea (para todos los archivos de la solicitud) 5 000
Modelado de temas

Los trabajos de modelado de temas asíncronos, que se crean con la StartTopicsDetectionJoboperación, tienen las siguientes cuotas.

Descripción Cuota/Directriz
Codificación de caracteres UTF-8
Número máximo de temas a devolver 100
Tamaño máximo para un archivo, un documento por archivo 100 MB

Para más información, consulte Modelado de temas

Limitación de solicitudes para solicitudes asíncronas

Cada operación de API asíncrona admite un número máximo de solicitudes por segundo (por región, por cuenta), además de un máximo de 10 trabajos activos. Para ver las cuotas de cada operación de la API, consulte la tabla Service Quotas en Puntos de conexión y cuotas de Amazon Comprehend en la Referencia general de Amazon Web Services.

Puede solicitar un aumento de la cuota para aquellas cuotas que sean ajustables a través de la consola de Service Quotas.

Cuotas para modelos personalizados

Puede usar Amazon Comprehend para crear sus propios modelos personalizados para la clasificación personalizada y para el reconocimiento de entidades a nivel personalizado. En esta sección se proporcionan las directrices y las cuotas relacionadas con el entrenamiento y el uso de modelos personalizados. Para obtener más información acerca de los modelos personalizados, consulte Amazon Comprehend Custom.

Cuotas generales

Amazon Comprehend establece cuotas generales para cada tipo de documento de entrada que puede analizar con modelos personalizados. Para conocer las cuotas de análisis en tiempo real, consulte Tamaños máximos de documentos para el análisis en tiempo real. Para conocer las cuotas de análisis asíncronos, consulte Entradas para análisis personalizados asíncronos.

Cada operación de API asíncrona admite un número máximo de solicitudes por segundo (por región, por cuenta), además de un máximo de 10 trabajos activos. Para ver las cuotas de cada operación de la API, consulte la tabla Service Quotas en Puntos de conexión y cuotas de Amazon Comprehend en la Referencia general de Amazon Web Services.

Puede solicitar un aumento de la cuota para aquellas cuotas que sean ajustables a través de la consola de Service Quotas.

Cuotas para puntos de conexión

Puede crear un punto de conexión para ejecutar análisis en tiempo real con un modelo personalizado. Para obtener información acerca de los puntos de conexión, consulte Administración de puntos de conexión de Amazon Comprehend.

Las siguientes cuotas se aplican a los puntos de conexión. Para obtener información acerca de cómo solicitar un aumento de la cuota, consulte Service Quotas AWS.

Descripción Cuota/Directriz
Número máximo de puntos de conexión activos por región para cada cuenta 20
Número máximo de unidades de inferencia por región para cada cuenta 200
Número máximo de unidades de inferencia por punto de conexión y región 50
Rendimiento máximo por unidad de inferencia (caracteres) 100/segundo
Rendimiento máximo por unidad de inferencia (documentos) 2/segundo

Clasificación de documentos

En esta sección se describen las directrices y las cuotas para las siguientes operaciones de clasificación de documentos:

Cuotas generales para la clasificación de documentos

En la siguiente tabla se describen las cuotas generales relacionadas con el entrenamiento de clasificadores personalizados.

Descripción Cuota/Directriz
Longitud máxima de un nombre de clase 5000 caracteres
Número de clases (modos multiclase) 2 - 1000
Número de clases (modos multiclase) 2 - 100
Formato de las anotaciones
Número mínimo de anotaciones por clase (modo multiclase) 10
Número mínimo de anotaciones por clase (modo multietiqueta) 10
Número mínimo de anotaciones (modo multietiqueta) 50
Formato de archivo CSV
Número mínimo de documentos de entrenamiento por clase (modo multiclase) 50
Número mínimo de documentos de entrenamiento por clase (modo multietiqueta) 10
Número mínimo de documentos de entrenamiento (modo multietiqueta) 50

Clasificación de documentos de texto sin formato

Se crea y entrena un modelo de texto sin formato usando documentos de entrada de texto sin formato. Amazon Comprehend ofrece operaciones asíncronas y en tiempo real para clasificar documentos de texto sin formato usando un modelo de texto sin formato.

Formación

En la siguiente tabla se describen las cuotas relacionadas con el entrenamiento de un clasificador personalizado con documentos con texto sin formato.

Descripción Cuota/Directriz
Tamaño total de todos los archivos de un trabajo de entrenamiento 5 GB
Número máximo de archivos de manifiesto aumentados para entrenar a un clasificador personalizado 5
Número máximo de nombres de atributos para cada archivo de manifiesto aumentado 5
Longitud máxima del nombre de atributo 63 caracteres
Análisis en tiempo real (sincrónico)

En la siguiente tabla se describen las cuotas relacionadas con la clasificación en tiempo real de los documentos con texto sin formato.

Descripción Cuota/Directriz
Número máximo de documentos por solicitud síncrona 1
Tamaño máximo del documento de texto (codificado en UTF-8) 10 KB
Análisis asíncrono

En la siguiente tabla se describen las cuotas relacionadas con la clasificación asíncrona de los documentos con texto sin formato.

Descripción Cuota/Directriz
Tamaño total de todos los archivos de un trabajo asíncrono 5 GB
Tamaño máximo para un archivo, un documento por archivo 10 MB
Número máximo de archivos, un documento por archivo 1 000 000
Número máximo total de líneas, un documento por línea (para todos los archivos de la solicitud) 1 000 000

Clasificación de los documentos semiestructurados

En esta sección se describen las directrices y las cuotas para la clasificación de documentos semiestructurados. Para clasificar los documentos semiestructurados, utilice un modelo de documento nativo que haya entrenado con documentos de entrada nativos.

Entrenamiento de un modelo de documento nativo con documentos semiestructurados

En la siguiente tabla se describen las cuotas relacionadas con el entrenamiento de un clasificador personalizado con documentos semiestructurados, tales como documentos PDF, documentos de Word y archivos de imagen.

Descripción Cuota/Directriz
Número máximo de páginas en todos los documentos 10 000
Tamaño máximo del archivo de anotaciones (todos los tamaños de archivo CSV combinados) 5 MB
Tamaño del corpus del documento (documentos de entrenamiento y prueba) 10 GB
Tamaños de los archivos para los archivos de entrenamiento y prueba
Tamaño del archivo de imagen (JPG, PNG, TIFF). 1 byte: 10 MB

Archivos TIFF: una página como máximo.

Tamaño de la página para documentos PDF 1 byte: 10 MB
Tamaño de la página para documentos de Word 1 byte: 10 MB
Tamaño del JSON de salida de la API de Amazon Textract 1 byte: 1 MB
Análisis en tiempo real (sincrónico)

En esta sección se describen las cuotas relacionadas con la clasificación en tiempo real de documentos semiestructurados.

En la siguiente tabla se muestran los tamaños de archivo máximos para documentos de entrada. Para todos los tipos de documentos de entrada, el tamaño máximo del archivo de entrada es una página, con un máximo de 10 000 caracteres.

Tipo de archivo Tamaño máximo (API) Tamaño máximo (consola)
Documentos de texto UTF-8 10 KB 10 KB
Documentos PDF 10 MB 5 MB
Documentos de Word 10 MB 5 MB
Archivos de imagen 10 MB 5 MB
Tamaño de salida de la API de Amazon Textract 1 MB n/a
Análisis asíncrono

En la siguiente tabla se describen las cuotas relacionadas con la clasificación asíncrona de los documentos semiestructurados.

Descripción Cuota/Directriz
Número máximo de páginas en todos los documentos de entrada para un trabajo 25 000
Tamaño del corpus del documento 25 GB
Tamaño del archivo de imagen (JPG, PNG, TIFF). 1 byte: 10 MB

Archivos TIFF: una página como máximo.

Tamaño de la página para documentos PDF 1 byte: 10 MB
Tamaño de la página para documentos de Word 1 byte: 10 MB
Tamaño del JSON de salida de la API de Textract 1 byte: 1 MB

Reconocimiento de entidades personalizado

En esta sección se describen las directrices y cuotas de las siguientes operaciones para el reconocimiento personalizado de entidades:

  • Los trabajos de formación sobre el reconocedor de entidades comenzaron con la operación CreateEntityRecognizer.

  • Los trabajos de reconocimiento asíncrono de entidades comenzaron con la operación. StartEntitiesDetectionJob

  • Solicitudes de reconocimiento de entidades sincrónicas mediante la operación. DetectEntities

Reconocimiento de entidades personalizado para documentos de texto sin formato

Amazon Comprehend ofrece operaciones síncronas y asíncronas para analizar documentos de texto sin formato con un reconocedor de entidades personalizado.

Formación

En esta sección se describen las cuotas relacionadas con el entrenamiento de un reconocedor de entidades personalizado para analizar documentos de texto sin formato. Para entrenar el modelo, puede proporcionar una lista de entidades o un conjunto de documentos de texto anotados.

En la siguiente tabla se describen las cuotas relacionadas con el entrenamiento del modelo con una lista de entidades.

Descripción Cuota/Directriz
Número de entidades por modelo 1 - 25
Tamaño del documento (UTF-8) 1 - 5000 bytes
Número de elementos de la lista de entidades 1 - 1 millón
Longitud de la entrada individual (barra posterior) de la lista de entradas 1 - 5000
Tamaño del corpus de la lista de entidades (todos los documentos con texto sin formato combinados) 5 KB - 200 MB

En la siguiente tabla se describen las cuotas relacionadas con el entrenamiento del modelo con documentos de texto anotados.

Descripción Cuota/Directriz
Número de entidades por modelo/reconocedor de entidades personalizado 1 - 25
Tamaño del documento (UTF-8) 1 - 5000 bytes
Número de documentos (consulte las anotaciones en texto sin formato) 3 - 200 000
Tamaño del corpus del documento (todos los documentos con texto sin formato combinados) 5 KB - 200 MB
Número mínimo de anotaciones por entidad 25
Análisis en tiempo real (sincrónico)

En la siguiente tabla se describen las cuotas relacionadas con el análisis en tiempo real de los documentos con texto sin formato.

Descripción Cuota/Directriz
Número máximo de documentos por solicitud síncrona 1
Tamaño máximo del documento de texto (codificado en UTF-8) 5 KB
Análisis asíncrono

En la siguiente tabla se describen las cuotas relacionadas con el reconocimiento de entidades asíncrono de los documentos con texto sin formato.

Descripción Cuota/Directriz
Tamaño del documento (UTF-8) 1 byte: 1 MB
Número máximo de archivos, un documento por archivo 1 000 000
Número máximo total de líneas, un documento por línea (para todos los archivos de la solicitud) 1 000 000
Tamaño del corpus del documento (todos los documentos con texto sin formato combinados) 1 byte: 5 GB

Reconocimiento personalizado de entidades para documentos semiestructurados

Amazon Comprehend ofrece operaciones síncronas y asíncronas para analizar documentos semiestructurados con un reconocedor de entidades personalizado. Debe entrenar el modelo usando documentos PDF anotados.

Formación

En la siguiente tabla se describen las cuotas relacionadas con la formación de un reconocedor de entidades personalizado (CreateEntityRecognizer) para analizar documentos semiestructurados.

Descripción Cuota/Directriz
Número de entidades por modelo/reconocedor de entidades personalizado 1 - 25
Tamaño máximo del archivo de anotaciones (JSON UTF-8) 5 MB
Número de documentos 250 - 10 000
Tamaño del corpus del documento (todos los documentos con texto sin formato combinados) 5 KB - 1 GB
Número mínimo de anotaciones por entidad 100
Número máximo de archivos de manifiesto aumentados para entrenar a un reconocedor de entidades personalizado 5
Número máximo de nombres de atributos para cada archivo de manifiesto aumentado 5
Longitud máxima del nombre de atributo 63 caracteres
Análisis en tiempo real (sincrónico)

En esta sección se describen las cuotas relacionadas con el análisis de documentos semiestructurados.

En la siguiente tabla se muestran los tamaños de archivo máximos para documentos de entrada. Para todos los tipos de documentos de entrada, el tamaño máximo del archivo de entrada es una página, con un máximo de 10 000 caracteres.

Tipo de archivo Tamaño máximo (API) Tamaño máximo (consola)
Documentos de texto UTF-8 10 KB 10 KB
Documentos PDF 10 MB 5 MB
Documentos de Word 10 MB 5 MB
Archivos de imagen 10 MB 5 MB
Archivos de salida de Textract 1 MB n/a
Análisis asíncrono

En esta sección se describen las cuotas para el análisis asíncrono de documentos semiestructurados.

Descripción Cuota/Directriz
Tamaño de la imagen (JPG o PNG) 1 byte: 10 MB
Tamaño de la imagen (TIFF) 1 byte: 10 MB Máximo una página.
Tamaño del documento (PDF) 1 byte: 50 MB
Tamaño del documento (DOCX) 1 byte: 5 MB
Tamaño del documento (UTF-8) 1 byte: 1 MB
Número máximo de archivos, un documento por archivo (no se permite un documento por línea para archivos de imagen ni para documentos PDF/Word) 500
Número máximo de páginas para un archivo PDF o DOCX 100
Tamaño del corpus del documento tras la extracción del texto (texto sin formato, todos los archivos combinados) 1 byte: 5 GB

Para obtener más información sobre los límites para las imágenes, consulte Límites estrictos en Amazon Textract

Cuotas para volantes de inercia

Utilice los volantes de inercia para gestionar el entrenamiento y el seguimiento de las versiones de modelos personalizados para una clasificación y un reconocimiento de entidades personalizados. Para obtener más información acerca de los volantes, consulte Volantes de inercia.

Cuotas generales para los volantes

Las siguientes cuotas se aplican a los volantes de inercia y a las iteraciones del volante.

Descripción Cuota/Directriz
Número máximo de volantes de inercia 50
Número máximo de volantes en estado CREACIÓN 10
Número máximo de conjuntos de datos de entrenamiento por volante 50
Número máximo de conjuntos de datos de prueba por volante 50
Número máximo de conjuntos de datos con estado INCORPORACIÓN 10
Número máximo de iteraciones del volante en curso por cuenta 10

Cuotas de conjuntos de datos para modelos de clasificación personalizados

Al incorporar un conjunto de datos para un volante asociado a un modelo de clasificación personalizado, se aplicarán las siguientes cuotas.

Descripción Cuota/Directriz
Número mínimo de documentos de entrenamiento por clase (modo multietiqueta) 50
Número máximo de documentos de entrenamiento 1 000 000
Tamaño mínimo del conjunto de datos 500 bytes
Tamaño máximo del conjunto de datos 5 GB
Tamaño máximo para un archivo, un documento por archivo 10 MB

Cuotas de conjuntos de datos para modelos personalizados de reconocimiento de entidades

Al incorporar un conjunto de datos para un volante asociado a un modelo de reconocimiento de entidad personalizado, se aplicarán las siguientes cuotas.

Descripción Cuota/Directriz
Tamaño máximo del documento 5 KB
Número mínimo de documentos de entrenamiento 3
Número máximo de documentos de entrenamiento 200.000
Número mínimo de anotaciones por entidad 25
Tamaño máximo del conjunto de datos 200 MB