Diretrizes e cotas - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Diretrizes e cotas

A menos que especificado de outra forma, as cotas do Amazon Comprehend são por região. Você pode solicitar um aumento nas cotas ajustáveis, se necessário, para seus aplicativos. Para obter informações sobre as cotas e solicitar um aumento de cota, consulteAWS Service Quotas .

Regiões compatíveis

O Amazon Comprehend está disponível nas seguintes regiões: AWS

  • Leste dos EUA (Ohio)

  • Leste dos EUA (N. da Virgínia)

  • Oeste dos EUA (Oregon)

  • Asia Pacific (Mumbai)

  • Ásia-Pacífico (Seul)

  • Ásia-Pacífico (Singapura)

  • Ásia-Pacífico (Sydney)

  • Ásia-Pacífico (Tóquio)

  • Canadá (Central)

  • Europa (Frankfurt)

  • Europa (Irlanda)

  • Europa (Londres)

  • AWS GovCloud (Oeste dos EUA)

Por padrão, o Amazon Comprehend fornece todas as operações de API em cada uma das Regiões compatíveis. Para ver as exceções, consulte Processamento de documentos.

Para obter informações sobre endpoints de API, consulte Regiões e endpoints do Amazon Comprehend na Referência geral da Amazon Web Services.

Para analisar as cotas atuais em uma região ou solicitar aumentos de cotas para cotas ajustáveis, abra o console do Service Quotas.

Cotas para modelos integrados

O Amazon Comprehend fornece modelos integrados para você analisar documentos de texto UTF-8. O Amazon Comprehend fornece operações síncronas e assíncronas que usam os modelos integrados.

Análise em tempo real (síncrona)

Esta seção descreve as cotas relacionadas a análises em tempo real usando os modelos integrados.

Operações com um único documento

A API do Amazon Comprehend fornece operações que usam um único documento como entrada. As cotas a seguir aplicam-se a essas operações.

Cotas gerais para operações com um único documento

As cotas a seguir se aplicam à análise em tempo real para detectar entidades, frases-chave ou Idioma dominante. Para detecção de entidades, essas cotas se aplicam à detecção com os modelos integrados. Para detecção de entidades personalizadas, consulte as cotas em Reconhecimento de entidade personalizado .

Descrição Cota/diretriz
Tamanho máximo do documento 100 KB
Cotas específicas da operação para operações com um único documento

As cotas a seguir se aplicam à análise em tempo real para detectar sentimento, sentimento direcionado e sintaxe.

Descrição Cota/diretriz
Tamanho máximo do documento 5 KB

Operações com vários documentos

A API do Amazon Comprehend fornece operações em lote que processam vários documentos com uma única solicitação de API. As cotas a seguir se aplicam às operações em lote.

Descrição Cota/diretriz
Tamanho máximo do documento 5 KB
Máximo de documentos por solicitação 25

Para obter mais informações sobre o uso de operações com documentos em lote, consulte Processamento síncrono de vários documentos.

Solicitar controle de utilização para solicitações em tempo real (síncronas)

O Amazon Comprehend aplica controle de utilização às solicitações síncronas. Se a largura de banda de processamento do sistema estiver disponível, o Amazon Comprehend aumentará gradualmente o número de solicitações processadas. Para controlar o uso das operações síncronas da API pelo seu aplicativo, recomendamos que você ative os alertas de cobrança ou implemente a limitação de taxa em seu aplicativo.

Análise assíncrona

Esta seção descreve as cotas relacionadas à análise assíncrona usando os modelos integrados.

Cada operação assíncrona de API oferece suporte a um máximo de 10 trabalhos ativos. Para visualizar as cotas para cada operação de API, consulte a tabela de Service Quotas nos endpoints e cotas do Amazon Comprehend na Referência geral da Amazon Web Services.

É possível solicitar aumentos de cota para cotas ajustáveis do IAM usando o console do Service Quotas.

Cotas gerais para operações assíncronas

Você pode executar trabalhos de análise assíncronos usando o console ou qualquer uma das operações da API Start*. Para obter informações sobre quando usar operações assíncronas, consulte Processamento em lote assíncrono. As cotas a seguir se aplicam à maioria das operações de API Start* para modelos integrados. Para ver as exceções, consulte Cotas específicas da operação para trabalhos assíncronos.

Descrição Cota/diretriz
Tamanho máximo de cada documento em trabalhos que detectam entidades, frases-chave, PII e idiomas 1 MB
Tamanho total máximo de todos os arquivos em uma solicitação 5 GB
Tamanho total mínimo de todos os arquivos em uma solicitação 500 bytes
Número máximo de arquivos, um documento por arquivo 1.000.000
Número total máximo de linhas, um documento por linha 1.000.000

Cotas específicas da operação para trabalhos assíncronos

Esta seção descreve as cotas para operações assíncronas específicas. Se uma cota não for especificada nas tabelas a seguir, o valor geral da cota se aplica.

Sentimento

Os trabalhos de sentimento assíncronos, que você cria com a StartSentimentDetectionJoboperação, têm as seguintes cotas.

Descrição Cota/diretriz
Tamanho máximo de cada documento de entrada 5 KB
Sentimento direcionado

Os trabalhos assíncronos de sentimento direcionados, que você cria com a StartTargetedSentimentDetectionJoboperação, têm as seguintes cotas.

Descrição Cota/diretriz
Formatos de documento compatíveis UTF-8
Tamanho máximo de cada documento em um trabalho 10 KB
Tamanho máximo de todos os documentos em um trabalho 300 MB
Número máximo de arquivos, um documento por arquivo 30.000
Número total máximo de linhas, um documento por linha (para todos os arquivos solicitados) 30.000
Eventos

Os trabalhos de detecção de eventos assíncronos, que você cria com a StartEventsDetectionJoboperação, têm as seguintes cotas.

Descrição Cotas
Codificação de caracteres UTF-8
Tamanho total de todos os arquivos em um trabalho 50 MB
Tamanho máximo de cada documento em um trabalho 10 KB
Número máximo de arquivos, um documento por arquivo 5.000
Número máximo total de linhas, um documento por linha (para todos os arquivos solicitados) 5.000
Modelagem de tópicos

Os trabalhos assíncronos de modelagem de tópicos, que você cria com a StartTopicsDetectionJoboperação, têm as seguintes cotas.

Descrição Cota/diretriz
Codificação de caracteres UTF-8
O número máximo de tópicos a serem retornados 100
Tamanho máximo do arquivo para um arquivo, um documento por arquivo 100 MB

Para mais informações, consulte Modelagem de tópicos.

Solicite controle de utilização para solicitações assíncronas

Cada operação assíncrona de API é compatível com um número máximo de solicitações por segundo (por região, por conta) e, também, com um máximo de 10 trabalhos ativos. Para visualizar as cotas para cada operação de API, consulte a tabela de Service Quotas nos endpoints e cotas do Amazon Comprehend na Referência geral da Amazon Web Services.

É possível solicitar aumentos de cota para cotas ajustáveis do IAM usando o console do Service Quotas.

Cotas para modelos personalizados

Você pode usar o Amazon Comprehend para criar seus próprios modelos personalizados para classificação personalizada e reconhecimento personalizado de entidades. Esta seção fornece as diretrizes e cotas relacionadas ao treinamento e ao uso de modelos personalizados. Para obter mais informações sobre modelos personalizados, consulte Amazon Comprehend Custom.

Cotas gerais

O Amazon Comprehend define cotas de tamanho geral para cada tipo de documento de entrada que você pode analisar com modelos personalizados. Para cotas de análise em tempo real, consulte Tamanhos máximos de documentos para análise em tempo real. Para cotas de análise assíncrona, consulte Entradas para análise personalizada assíncrona.

Cada operação assíncrona de API é compatível com um número máximo de solicitações por segundo (por região, por conta) e, também, com um máximo de 10 trabalhos ativos. Para visualizar as cotas para cada operação de API, consulte a tabela de Service Quotas nos endpoints e cotas do Amazon Comprehend na Referência geral da Amazon Web Services.

É possível solicitar aumentos de cota para cotas ajustáveis do IAM usando o console do Service Quotas.

Cotas para endpoints

Você cria um endpoint para executar análises em tempo real com um modelo personalizado. Para obter informações sobre endpoints, consulte Gerenciando endpoints do Amazon Comprehend.

As cotas a seguir se aplicam aos endpoints. Para obter informações sobre como solicitar um aumento de cota, consulte AWS Service Quotas.

Descrição Cota/diretriz
Número máximo de endpoints ativos por Região para cada conta 20
Número máximo de unidades de inferência por Região para cada conta 200
Número máximo de unidades de inferência por endpoint por região 50
Taxa de throughput por unidade de inferência (caracteres) 100/segundo
Taxa de throughput por unidade de inferência (documentos) 2/segundo

Classificação de documento

Esta seção descreve as diretrizes e cotas para as seguintes operações de classificação de documentos:

Cotas gerais para classificação de documentos

A tabela a seguir descreve as cotas gerais relacionadas ao treinamento de classificadores personalizados.

Descrição Cota/diretriz
Comprimento máximo do nome da classe 5.000 caracteres
Número de classes (modo multiclasse) 2 a 1.000
Número de classes (modo multirrótulo) 2 a 100
Formato de anotações
Número mínimo de anotações por classe (modo multiclasse) 10
Número mínimo de anotações por classe (modo multirrótulo) 10
Número mínimo de anotações (modo multirrótulo) 50
Formato de arquivo CSV
Número mínimo de documentos de treinamento por classe (modo multiclasse) 50
Número mínimo de documentos de treinamento por classe (modo multirrótulo) 10
Número mínimo de documentos de treinamento (modo multirrótulo) 50

Classificação para documentos de texto simples

Você cria e treina um modelo de texto simples usando documentos de entrada de texto simples. O Amazon Comprehend fornece operações assíncronas e em tempo real para classificar documentos de texto simples usando um modelo de texto simples.

Treinamento

A tabela a seguir descreve as cotas relacionadas ao treinamento de um classificador personalizado com documentos de texto simples.

Descrição Cota/diretriz
Tamanho total de todos os arquivos no trabalho de treinamento 5 GB
Número máximo de arquivos manifesto aumentados para treinar um classificador personalizado 5
Número máximo de nomes de atributos para cada arquivo manifesto aumentado 5
Comprimento máximo do nome do atributo 63 caracteres
Análise em tempo real (síncrona)

A tabela a seguir descreve as cotas relacionadas à classificação em tempo real de documentos de texto simples.

Descrição Cota/diretriz
Número máximo de documentos por solicitação síncrona 1
Tamanho máximo do documento de texto (codificação UTF-8) 10 KB
Análise assíncrona

A tabela a seguir descreve as cotas relacionadas à classificação assíncrona de documentos de texto simples.

Descrição Cota/diretriz
Tamanho total de todos os arquivos no trabalho assíncrono 5 GB
Tamanho máximo do arquivo para um arquivo, um documento por arquivo 10 MB
Número máximo de arquivos, um documento por arquivo 1.000.000
Número máximo total de linhas, um documento por linha (para todos os arquivos solicitados) 1.000.000

Classificação para documentos semiestruturados

Esta seção descreve as diretrizes e cotas para classificação de documentos semiestruturados. Para classificar documentos semiestruturados, use um modelo de documento nativo que você treinou com documentos de entrada nativos.

Treinando um modelo de documento nativo com documentos semiestruturados

A tabela a seguir descreve as cotas relacionadas ao treinamento de um classificador personalizado com documentos semiestruturados, como documentos em PDF, documentos do Word e arquivos de imagem.

Descrição Cota/diretriz
Número máximo de páginas em todos os documentos 10.000
Tamanho máximo do arquivo de anotações (todos os tamanhos de CSV combinados) 5 MB
Tamanho do corpus do documento (documentos de treinamento e de teste) 10 GB
Tamanhos de arquivo para treinamento e teste de arquivos
Tamanho do arquivo de imagem (JPG, PNG, TIFF). 1 byte a 10 MB.

Arquivos TIFF: no máximo uma página.

Tamanho da página para documentos em PDF 1 byte a 10 MB
Tamanho da página para documentos do Word 1 byte a 10 MB
Tamanho do JSON de saída da API do Amazon Textract 1 byte a 1 MB
Análise em tempo real (síncrona)

Esta seção descreve as cotas relacionadas à classificação em tempo real de documentos semiestruturados.

A tabela a seguir mostra os tamanhos máximos de arquivo dos documentos de entrada. Para todos os tipos de documentos de entrada, o máximo do arquivo de entrada é de uma página, com no máximo 10.000 caracteres.

Tipo de arquivo Tamanho máximo (API) Tamanho máximo (console)
Documentos de texto em UTF-8 10 KB 10 KB
Documentos em PDF 10 MB 5 MB
Documentos do Word 10 MB 5 MB
Arquivos de imagem 10 MB 5 MB
Tamanho da saída da API do Amazon Textract 1 MB n/a
Análise assíncrona

A tabela a seguir descreve as cotas relacionadas à classificação assíncrona de documentos semiestruturados.

Descrição Cota/diretriz
Número máximo de páginas em todos os documentos de entrada para um trabalho 25.000
Tamanho do corpus do documento 25 GB
Tamanho do arquivo de imagem (JPG, PNG ou TIFF) 1 byte a 10 MB.

Arquivos TIFF: no máximo uma página.

Tamanho da página para documentos em PDF 1 byte a 10 MB
Tamanho da página para documentos do Word 1 byte a 10 MB
Tamanho do JSON de saída da API do Textract 1 byte a 1 MB.

Reconhecimento de entidade personalizado

Esta seção descreve as diretrizes e cotas para as seguintes operações de reconhecimento de entidades personalizado:

  • Os trabalhos de treinamento do reconhecedor de entidades começaram com a CreateEntityRecognizeroperação.

  • Os trabalhos assíncronos de reconhecimento de entidades foram iniciados com a operação. StartEntitiesDetectionJob

  • Solicitações síncronas de reconhecimento de entidades usando a DetectEntitiesoperação.

Reconhecimento de entidades personalizado para documentos de texto simples

O Amazon Comprehend fornece operações assíncronas e síncronas para analisar documentos de texto simples com um reconhecedor de entidades personalizado.

Treinamento

Esta seção descreve as cotas relacionadas ao treinamento de um reconhecedor de entidades personalizado para analisar documentos de texto simples. Para treinar o modelo, você pode fornecer uma lista de entidades ou um conjunto de documentos de texto anotados.

A tabela a seguir descreve as cotas relacionadas ao treinamento do modelo com uma lista de entidades.

Descrição Cota/diretriz
Número de entidades por modelo 1 a 25
Tamanho do documento (UTF-8) 1 a 5.000 bytes
Número de itens na lista de entidades 1 a 1 milhão
Comprimento da entrada individual (pós-remoção) na lista de entradas 1 a 5.000
Tamanho da lista de entradas (todos os documentos em texto simples combinados) 5 KB a 200 MB

A tabela a seguir descreve as cotas relacionadas ao treinamento do modelo com documentos de texto anotados.

Descrição Cota/diretriz
Número de entidades por modelo/reconhecedor de entidade personalizado 1 a 25
Tamanho do documento (UTF-8) 1 a 5.000 bytes
Número de documentos (consulte Anotações em texto simples) 3 a 200.000
Tamanho do corpo do documento (todos os documentos em texto simples combinados) 5 KB a 200 MB
Número mínimo de anotações por entidade 25
Análise em tempo real (síncrona)

A tabela a seguir descreve as cotas relacionadas à análise em tempo real de documentos de texto sem formatação.

Descrição Cota/diretriz
Número máximo de documentos por solicitação síncrona 1
Tamanho máximo do documento de texto (codificação UTF-8) 5 KB
Análise assíncrona

A tabela a seguir descreve as cotas relacionadas ao reconhecimento assíncrono de entidades de documentos de texto simples.

Descrição Cota/diretriz
Tamanho do documento (UTF-8) 1 byte a 1 MB
Número máximo de arquivos, um documento por arquivo 1.000.000
Número máximo total de linhas, um documento por linha (para todos os arquivos solicitados) 1.000.000
Tamanho do corpo do documento (todos os documentos em texto simples combinados) 1 byte a 5 GB

Reconhecimento de entidades personalizado para documentos semiestruturados

O Amazon Comprehend fornece operações assíncronas e síncronas para analisar documentos semiestruturados com um reconhecedor de entidades personalizado. Você deve treinar o modelo usando documentos em PDF anotados.

Treinamento

A tabela a seguir descreve as cotas relacionadas ao treinamento de um reconhecedor de entidades personalizado (CreateEntityRecognizer) para analisar documentos semiestruturados.

Descrição Cota/diretriz
Número de entidades por modelo/reconhecedor de entidade personalizado 1 a 25
Tamanho máximo do arquivo de anotação (UTF-8 JSON) 5 MB
Número de documentos 250 a 10.000
Tamanho do corpo do documento (todos os documentos em texto simples combinados) 5 KB a 1 GB
Número mínimo de anotações por entidade 100
Número máximo de arquivos manifesto aumentados para treinar um reconhecedor de entidades personalizado 5
Número máximo de nomes de atributos para cada arquivo manifesto aumentado 5
Comprimento máximo do nome do atributo 63 caracteres
Análise em tempo real (síncrona)

Esta seção descreve as cotas relacionadas à análise em tempo real de documentos semiestruturados.

A tabela a seguir mostra os tamanhos máximos de arquivo dos documentos de entrada. Para todos os tipos de documentos de entrada, o máximo do arquivo de entrada é de uma página, com no máximo 10.000 caracteres.

Tipo de arquivo Tamanho máximo (API) Tamanho máximo (console)
Documentos de texto em UTF-8 10 KB 10 KB
Documentos em PDF 10 MB 5 MB
Documentos do Word 10 MB 5 MB
Arquivos de imagem 10 MB 5 MB
Arquivos de saída do Textract 1 MB n/a
Análise assíncrona

Esta seção descreve as cotas para análise assíncrona de documentos semiestruturados.

Descrição Cota/diretriz
Tamanho da imagem (JPG ou PNG) 1 byte a 10 MB
Tamanho da imagem (TIFF) 1 byte a 10 MB. Máximo de uma página.
Tamanho do documento (PDF) 1 byte a 50 MB
Tamanho do documento (Docx) 1 byte a 5 MB
Tamanho do documento (UTF-8) 1 byte a 1 MB
Número máximo de arquivos, um documento por arquivo (um documento por linha não é permitido para arquivos de imagem ou documentos em PDF/do Word) 500
Número máximo de páginas para um arquivo PDF ou Docx 100
Tamanho do corpus do documento após a extração do texto (texto simples, todos os arquivos combinados) 1 byte a 5 GB

Para obter mais informações sobre limites para imagens, consulte Limites rígidos no Amazon Textract

Cotas para flywheels

Use flywheels para gerenciar o treinamento e o monitoramento de versões de modelos personalizados para classificação personalizada e reconhecimento personalizado de entidades. Para obter mais informações sobre flywheels, consulte Flywheels.

Cotas gerais para flywheels

As cotas a seguir se aplicam flywheels e às iterações de flywheel.

Descrição Cota/diretriz
Número máximo de flywheels 50
Número máximo de flywheels no status CREATING 10
Número máximo de conjuntos de dados de treinamento por flywheel 50
Número máximo de conjuntos de dados de teste por flywheel 50
Número máximo de conjuntos de dados com status INGESTING 10
Número máximo de iterações de flywheel em andamento por conta 10

Cotas de conjuntos de dados para modelos de classificação personalizados

Quando você ingere um conjunto de dados para um flywheel associado a um modelo de classificação personalizado, as cotas a seguir se aplicam.

Descrição Cota/diretriz
Número mínimo de documentos de treinamento por classe (modo multirrótulo) 50
Número máximo de documentos de treinamento 1.000.000
Tamanho mínimo do conjunto de dados 500 bytes
Tamanho máximo do conjunto de dados 5 GB
Tamanho máximo do arquivo para um arquivo, um documento por arquivo 10 MB

Cotas de conjuntos de dados para modelos personalizados de reconhecimento de entidades

Quando você ingere um conjunto de dados para um flywheel associado a um modelo de reconhecimento de entidade personalizado, as cotas a seguir se aplicam.

Descrição Cota/diretriz
Tamanho máximo do documento 5 KB
Número mínimo de documentos de treinamento 3
Número máximo de documentos de treinamento 200.000
Número mínimo de anotações por entidade 25
Tamanho máximo do conjunto de dados 200 MB