As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Diretrizes e cotas
A menos que especificado de outra forma, as cotas do Amazon Comprehend são por região. Você pode solicitar um aumento nas cotas ajustáveis, se necessário, para seus aplicativos. Para obter informações sobre as cotas e solicitar um aumento de cota, consulteAWS Service Quotas .
Tópicos
Regiões compatíveis
O Amazon Comprehend está disponível nas seguintes regiões: AWS
-
Leste dos EUA (Ohio)
-
Leste dos EUA (N. da Virgínia)
-
Oeste dos EUA (Oregon)
-
Asia Pacific (Mumbai)
-
Ásia-Pacífico (Seul)
-
Ásia-Pacífico (Singapura)
-
Ásia-Pacífico (Sydney)
-
Ásia-Pacífico (Tóquio)
-
Canadá (Central)
-
Europa (Frankfurt)
-
Europa (Irlanda)
-
Europa (Londres)
-
AWS GovCloud (Oeste dos EUA)
Por padrão, o Amazon Comprehend fornece todas as operações de API em cada uma das Regiões compatíveis. Para ver as exceções, consulte Processamento de documentos.
Para obter informações sobre endpoints de API, consulte Regiões e endpoints do Amazon Comprehend na Referência geral da Amazon Web Services.
Para analisar as cotas atuais em uma região ou solicitar aumentos de cotas para cotas ajustáveis, abra o console do Service Quotas
Cotas para modelos integrados
O Amazon Comprehend fornece modelos integrados para você analisar documentos de texto UTF-8. O Amazon Comprehend fornece operações síncronas e assíncronas que usam os modelos integrados.
Análise em tempo real (síncrona)
Esta seção descreve as cotas relacionadas a análises em tempo real usando os modelos integrados.
Tópicos
Operações com um único documento
A API do Amazon Comprehend fornece operações que usam um único documento como entrada. As cotas a seguir aplicam-se a essas operações.
Cotas gerais para operações com um único documento
As cotas a seguir se aplicam à análise em tempo real para detectar entidades, frases-chave ou Idioma dominante. Para detecção de entidades, essas cotas se aplicam à detecção com os modelos integrados. Para detecção de entidades personalizadas, consulte as cotas em Reconhecimento de entidade personalizado .
Descrição | Cota/diretriz |
---|---|
Tamanho máximo do documento | 100 KB |
Cotas específicas da operação para operações com um único documento
As cotas a seguir se aplicam à análise em tempo real para detectar sentimento, sentimento direcionado e sintaxe.
Descrição | Cota/diretriz |
---|---|
Tamanho máximo do documento | 5 KB |
Operações com vários documentos
A API do Amazon Comprehend fornece operações em lote que processam vários documentos com uma única solicitação de API. As cotas a seguir se aplicam às operações em lote.
Descrição | Cota/diretriz |
---|---|
Tamanho máximo do documento | 5 KB |
Máximo de documentos por solicitação | 25 |
Para obter mais informações sobre o uso de operações com documentos em lote, consulte Processamento síncrono de vários documentos.
Solicitar controle de utilização para solicitações em tempo real (síncronas)
O Amazon Comprehend aplica controle de utilização às solicitações síncronas. Se a largura de banda de processamento do sistema estiver disponível, o Amazon Comprehend aumentará gradualmente o número de solicitações processadas. Para controlar o uso das operações síncronas da API pelo seu aplicativo, recomendamos que você ative os alertas de cobrança ou implemente a limitação de taxa em seu aplicativo.
Análise assíncrona
Esta seção descreve as cotas relacionadas à análise assíncrona usando os modelos integrados.
Cada operação assíncrona de API oferece suporte a um máximo de 10 trabalhos ativos. Para visualizar as cotas para cada operação de API, consulte a tabela de Service Quotas nos endpoints e cotas do Amazon Comprehend na Referência geral da Amazon Web Services.
É possível solicitar aumentos de cota para cotas ajustáveis do IAM usando o console do Service Quotas
Tópicos
Cotas gerais para operações assíncronas
Você pode executar trabalhos de análise assíncronos usando o console ou qualquer uma das operações da API Start*
. Para obter informações sobre quando usar operações assíncronas, consulte Processamento em lote assíncrono. As cotas a seguir se aplicam à maioria das operações de API Start*
para modelos integrados. Para ver as exceções, consulte Cotas específicas da operação para trabalhos assíncronos.
Descrição | Cota/diretriz |
---|---|
Tamanho máximo de cada documento em trabalhos que detectam entidades, frases-chave, PII e idiomas | 1 MB |
Tamanho total máximo de todos os arquivos em uma solicitação | 5 GB |
Tamanho total mínimo de todos os arquivos em uma solicitação | 500 bytes |
Número máximo de arquivos, um documento por arquivo | 1.000.000 |
Número total máximo de linhas, um documento por linha | 1.000.000 |
Cotas específicas da operação para trabalhos assíncronos
Esta seção descreve as cotas para operações assíncronas específicas. Se uma cota não for especificada nas tabelas a seguir, o valor geral da cota se aplica.
Sentimento
Os trabalhos de sentimento assíncronos, que você cria com a StartSentimentDetectionJoboperação, têm as seguintes cotas.
Descrição | Cota/diretriz |
---|---|
Tamanho máximo de cada documento de entrada | 5 KB |
Sentimento direcionado
Os trabalhos assíncronos de sentimento direcionados, que você cria com a StartTargetedSentimentDetectionJoboperação, têm as seguintes cotas.
Descrição | Cota/diretriz |
---|---|
Formatos de documento compatíveis | UTF-8 |
Tamanho máximo de cada documento em um trabalho | 10 KB |
Tamanho máximo de todos os documentos em um trabalho | 300 MB |
Número máximo de arquivos, um documento por arquivo | 30.000 |
Número total máximo de linhas, um documento por linha (para todos os arquivos solicitados) | 30.000 |
Eventos
Os trabalhos de detecção de eventos assíncronos, que você cria com a StartEventsDetectionJoboperação, têm as seguintes cotas.
Descrição | Cotas |
---|---|
Codificação de caracteres | UTF-8 |
Tamanho total de todos os arquivos em um trabalho | 50 MB |
Tamanho máximo de cada documento em um trabalho | 10 KB |
Número máximo de arquivos, um documento por arquivo | 5.000 |
Número máximo total de linhas, um documento por linha (para todos os arquivos solicitados) | 5.000 |
Modelagem de tópicos
Os trabalhos assíncronos de modelagem de tópicos, que você cria com a StartTopicsDetectionJoboperação, têm as seguintes cotas.
Descrição | Cota/diretriz |
---|---|
Codificação de caracteres | UTF-8 |
O número máximo de tópicos a serem retornados | 100 |
Tamanho máximo do arquivo para um arquivo, um documento por arquivo | 100 MB |
Para mais informações, consulte Modelagem de tópicos.
Solicite controle de utilização para solicitações assíncronas
Cada operação assíncrona de API é compatível com um número máximo de solicitações por segundo (por região, por conta) e, também, com um máximo de 10 trabalhos ativos. Para visualizar as cotas para cada operação de API, consulte a tabela de Service Quotas nos endpoints e cotas do Amazon Comprehend na Referência geral da Amazon Web Services.
É possível solicitar aumentos de cota para cotas ajustáveis do IAM usando o console do Service Quotas
Cotas para modelos personalizados
Você pode usar o Amazon Comprehend para criar seus próprios modelos personalizados para classificação personalizada e reconhecimento personalizado de entidades. Esta seção fornece as diretrizes e cotas relacionadas ao treinamento e ao uso de modelos personalizados. Para obter mais informações sobre modelos personalizados, consulte Amazon Comprehend Custom.
Tópicos
Cotas gerais
O Amazon Comprehend define cotas de tamanho geral para cada tipo de documento de entrada que você pode analisar com modelos personalizados. Para cotas de análise em tempo real, consulte Tamanhos máximos de documentos para análise em tempo real. Para cotas de análise assíncrona, consulte Entradas para análise personalizada assíncrona.
Cada operação assíncrona de API é compatível com um número máximo de solicitações por segundo (por região, por conta) e, também, com um máximo de 10 trabalhos ativos. Para visualizar as cotas para cada operação de API, consulte a tabela de Service Quotas nos endpoints e cotas do Amazon Comprehend na Referência geral da Amazon Web Services.
É possível solicitar aumentos de cota para cotas ajustáveis do IAM usando o console do Service Quotas
Cotas para endpoints
Você cria um endpoint para executar análises em tempo real com um modelo personalizado. Para obter informações sobre endpoints, consulte Gerenciando endpoints do Amazon Comprehend.
As cotas a seguir se aplicam aos endpoints. Para obter informações sobre como solicitar um aumento de cota, consulte AWS Service Quotas.
Descrição | Cota/diretriz |
---|---|
Número máximo de endpoints ativos por Região para cada conta | 20 |
Número máximo de unidades de inferência por Região para cada conta | 200 |
Número máximo de unidades de inferência por endpoint por região | 50 |
Taxa de throughput por unidade de inferência (caracteres) | 100/segundo |
Taxa de throughput por unidade de inferência (documentos) | 2/segundo |
Classificação de documento
Esta seção descreve as diretrizes e cotas para as seguintes operações de classificação de documentos:
-
Trabalhos de treinamento do classificador que você inicia com a CreateDocumentClassifieroperação.
Tarefas assíncronas de classificação de documentos que você inicia com a operação. StartDocumentClassificationJob
-
Solicitações síncronas de classificação de documentos que usam a ClassifyDocumentoperação.
Cotas gerais para classificação de documentos
A tabela a seguir descreve as cotas gerais relacionadas ao treinamento de classificadores personalizados.
Descrição | Cota/diretriz |
---|---|
Comprimento máximo do nome da classe | 5.000 caracteres |
Número de classes (modo multiclasse) | 2 a 1.000 |
Número de classes (modo multirrótulo) | 2 a 100 |
Formato de anotações | |
Número mínimo de anotações por classe (modo multiclasse) | 10 |
Número mínimo de anotações por classe (modo multirrótulo) | 10 |
Número mínimo de anotações (modo multirrótulo) | 50 |
Formato de arquivo CSV | |
Número mínimo de documentos de treinamento por classe (modo multiclasse) | 50 |
Número mínimo de documentos de treinamento por classe (modo multirrótulo) | 10 |
Número mínimo de documentos de treinamento (modo multirrótulo) | 50 |
Classificação para documentos de texto simples
Você cria e treina um modelo de texto simples usando documentos de entrada de texto simples. O Amazon Comprehend fornece operações assíncronas e em tempo real para classificar documentos de texto simples usando um modelo de texto simples.
Treinamento
A tabela a seguir descreve as cotas relacionadas ao treinamento de um classificador personalizado com documentos de texto simples.
Descrição | Cota/diretriz |
---|---|
Tamanho total de todos os arquivos no trabalho de treinamento | 5 GB |
Número máximo de arquivos manifesto aumentados para treinar um classificador personalizado | 5 |
Número máximo de nomes de atributos para cada arquivo manifesto aumentado | 5 |
Comprimento máximo do nome do atributo | 63 caracteres |
Análise em tempo real (síncrona)
A tabela a seguir descreve as cotas relacionadas à classificação em tempo real de documentos de texto simples.
Descrição | Cota/diretriz |
---|---|
Número máximo de documentos por solicitação síncrona | 1 |
Tamanho máximo do documento de texto (codificação UTF-8) | 10 KB |
Análise assíncrona
A tabela a seguir descreve as cotas relacionadas à classificação assíncrona de documentos de texto simples.
Descrição | Cota/diretriz |
---|---|
Tamanho total de todos os arquivos no trabalho assíncrono | 5 GB |
Tamanho máximo do arquivo para um arquivo, um documento por arquivo | 10 MB |
Número máximo de arquivos, um documento por arquivo | 1.000.000 |
Número máximo total de linhas, um documento por linha (para todos os arquivos solicitados) | 1.000.000 |
Classificação para documentos semiestruturados
Esta seção descreve as diretrizes e cotas para classificação de documentos semiestruturados. Para classificar documentos semiestruturados, use um modelo de documento nativo que você treinou com documentos de entrada nativos.
Treinando um modelo de documento nativo com documentos semiestruturados
A tabela a seguir descreve as cotas relacionadas ao treinamento de um classificador personalizado com documentos semiestruturados, como documentos em PDF, documentos do Word e arquivos de imagem.
Descrição | Cota/diretriz |
---|---|
Número máximo de páginas em todos os documentos | 10.000 |
Tamanho máximo do arquivo de anotações (todos os tamanhos de CSV combinados) | 5 MB |
Tamanho do corpus do documento (documentos de treinamento e de teste) | 10 GB |
Tamanhos de arquivo para treinamento e teste de arquivos | |
Tamanho do arquivo de imagem (JPG, PNG, TIFF). | 1 byte a 10 MB. Arquivos TIFF: no máximo uma página. |
Tamanho da página para documentos em PDF | 1 byte a 10 MB |
Tamanho da página para documentos do Word | 1 byte a 10 MB |
Tamanho do JSON de saída da API do Amazon Textract | 1 byte a 1 MB |
Análise em tempo real (síncrona)
Esta seção descreve as cotas relacionadas à classificação em tempo real de documentos semiestruturados.
A tabela a seguir mostra os tamanhos máximos de arquivo dos documentos de entrada. Para todos os tipos de documentos de entrada, o máximo do arquivo de entrada é de uma página, com no máximo 10.000 caracteres.
Tipo de arquivo | Tamanho máximo (API) | Tamanho máximo (console) |
---|---|---|
Documentos de texto em UTF-8 | 10 KB | 10 KB |
Documentos em PDF | 10 MB | 5 MB |
Documentos do Word | 10 MB | 5 MB |
Arquivos de imagem | 10 MB | 5 MB |
Tamanho da saída da API do Amazon Textract | 1 MB | n/a |
Análise assíncrona
A tabela a seguir descreve as cotas relacionadas à classificação assíncrona de documentos semiestruturados.
Descrição | Cota/diretriz |
---|---|
Número máximo de páginas em todos os documentos de entrada para um trabalho | 25.000 |
Tamanho do corpus do documento | 25 GB |
Tamanho do arquivo de imagem (JPG, PNG ou TIFF) | 1 byte a 10 MB. Arquivos TIFF: no máximo uma página. |
Tamanho da página para documentos em PDF | 1 byte a 10 MB |
Tamanho da página para documentos do Word | 1 byte a 10 MB |
Tamanho do JSON de saída da API do Textract | 1 byte a 1 MB. |
Reconhecimento de entidade personalizado
Esta seção descreve as diretrizes e cotas para as seguintes operações de reconhecimento de entidades personalizado:
Os trabalhos de treinamento do reconhecedor de entidades começaram com a CreateEntityRecognizeroperação.
Os trabalhos assíncronos de reconhecimento de entidades foram iniciados com a operação. StartEntitiesDetectionJob
Solicitações síncronas de reconhecimento de entidades usando a DetectEntitiesoperação.
Reconhecimento de entidades personalizado para documentos de texto simples
O Amazon Comprehend fornece operações assíncronas e síncronas para analisar documentos de texto simples com um reconhecedor de entidades personalizado.
Treinamento
Esta seção descreve as cotas relacionadas ao treinamento de um reconhecedor de entidades personalizado para analisar documentos de texto simples. Para treinar o modelo, você pode fornecer uma lista de entidades ou um conjunto de documentos de texto anotados.
A tabela a seguir descreve as cotas relacionadas ao treinamento do modelo com uma lista de entidades.
Descrição | Cota/diretriz |
---|---|
Número de entidades por modelo | 1 a 25 |
Tamanho do documento (UTF-8) | 1 a 5.000 bytes |
Número de itens na lista de entidades | 1 a 1 milhão |
Comprimento da entrada individual (pós-remoção) na lista de entradas | 1 a 5.000 |
Tamanho da lista de entradas (todos os documentos em texto simples combinados) | 5 KB a 200 MB |
A tabela a seguir descreve as cotas relacionadas ao treinamento do modelo com documentos de texto anotados.
Descrição | Cota/diretriz |
---|---|
Número de entidades por modelo/reconhecedor de entidade personalizado | 1 a 25 |
Tamanho do documento (UTF-8) | 1 a 5.000 bytes |
Número de documentos (consulte Anotações em texto simples) | 3 a 200.000 |
Tamanho do corpo do documento (todos os documentos em texto simples combinados) | 5 KB a 200 MB |
Número mínimo de anotações por entidade | 25 |
Análise em tempo real (síncrona)
A tabela a seguir descreve as cotas relacionadas à análise em tempo real de documentos de texto sem formatação.
Descrição | Cota/diretriz |
---|---|
Número máximo de documentos por solicitação síncrona | 1 |
Tamanho máximo do documento de texto (codificação UTF-8) | 5 KB |
Análise assíncrona
A tabela a seguir descreve as cotas relacionadas ao reconhecimento assíncrono de entidades de documentos de texto simples.
Descrição | Cota/diretriz |
---|---|
Tamanho do documento (UTF-8) | 1 byte a 1 MB |
Número máximo de arquivos, um documento por arquivo | 1.000.000 |
Número máximo total de linhas, um documento por linha (para todos os arquivos solicitados) | 1.000.000 |
Tamanho do corpo do documento (todos os documentos em texto simples combinados) | 1 byte a 5 GB |
Reconhecimento de entidades personalizado para documentos semiestruturados
O Amazon Comprehend fornece operações assíncronas e síncronas para analisar documentos semiestruturados com um reconhecedor de entidades personalizado. Você deve treinar o modelo usando documentos em PDF anotados.
Treinamento
A tabela a seguir descreve as cotas relacionadas ao treinamento de um reconhecedor de entidades personalizado (CreateEntityRecognizer) para analisar documentos semiestruturados.
Descrição | Cota/diretriz |
---|---|
Número de entidades por modelo/reconhecedor de entidade personalizado | 1 a 25 |
Tamanho máximo do arquivo de anotação (UTF-8 JSON) | 5 MB |
Número de documentos | 250 a 10.000 |
Tamanho do corpo do documento (todos os documentos em texto simples combinados) | 5 KB a 1 GB |
Número mínimo de anotações por entidade | 100 |
Número máximo de arquivos manifesto aumentados para treinar um reconhecedor de entidades personalizado | 5 |
Número máximo de nomes de atributos para cada arquivo manifesto aumentado | 5 |
Comprimento máximo do nome do atributo | 63 caracteres |
Análise em tempo real (síncrona)
Esta seção descreve as cotas relacionadas à análise em tempo real de documentos semiestruturados.
A tabela a seguir mostra os tamanhos máximos de arquivo dos documentos de entrada. Para todos os tipos de documentos de entrada, o máximo do arquivo de entrada é de uma página, com no máximo 10.000 caracteres.
Tipo de arquivo | Tamanho máximo (API) | Tamanho máximo (console) |
---|---|---|
Documentos de texto em UTF-8 | 10 KB | 10 KB |
Documentos em PDF | 10 MB | 5 MB |
Documentos do Word | 10 MB | 5 MB |
Arquivos de imagem | 10 MB | 5 MB |
Arquivos de saída do Textract | 1 MB | n/a |
Análise assíncrona
Esta seção descreve as cotas para análise assíncrona de documentos semiestruturados.
Descrição | Cota/diretriz |
---|---|
Tamanho da imagem (JPG ou PNG) | 1 byte a 10 MB |
Tamanho da imagem (TIFF) | 1 byte a 10 MB. Máximo de uma página. |
Tamanho do documento (PDF) | 1 byte a 50 MB |
Tamanho do documento (Docx) | 1 byte a 5 MB |
Tamanho do documento (UTF-8) | 1 byte a 1 MB |
Número máximo de arquivos, um documento por arquivo (um documento por linha não é permitido para arquivos de imagem ou documentos em PDF/do Word) | 500 |
Número máximo de páginas para um arquivo PDF ou Docx | 100 |
Tamanho do corpus do documento após a extração do texto (texto simples, todos os arquivos combinados) | 1 byte a 5 GB |
Para obter mais informações sobre limites para imagens, consulte Limites rígidos no Amazon Textract
Cotas para flywheels
Use flywheels para gerenciar o treinamento e o monitoramento de versões de modelos personalizados para classificação personalizada e reconhecimento personalizado de entidades. Para obter mais informações sobre flywheels, consulte Flywheels.
Cotas gerais para flywheels
As cotas a seguir se aplicam flywheels e às iterações de flywheel.
Descrição | Cota/diretriz |
---|---|
Número máximo de flywheels | 50 |
Número máximo de flywheels no status CREATING | 10 |
Número máximo de conjuntos de dados de treinamento por flywheel | 50 |
Número máximo de conjuntos de dados de teste por flywheel | 50 |
Número máximo de conjuntos de dados com status INGESTING | 10 |
Número máximo de iterações de flywheel em andamento por conta | 10 |
Cotas de conjuntos de dados para modelos de classificação personalizados
Quando você ingere um conjunto de dados para um flywheel associado a um modelo de classificação personalizado, as cotas a seguir se aplicam.
Descrição | Cota/diretriz |
---|---|
Número mínimo de documentos de treinamento por classe (modo multirrótulo) | 50 |
Número máximo de documentos de treinamento | 1.000.000 |
Tamanho mínimo do conjunto de dados | 500 bytes |
Tamanho máximo do conjunto de dados | 5 GB |
Tamanho máximo do arquivo para um arquivo, um documento por arquivo | 10 MB |
Cotas de conjuntos de dados para modelos personalizados de reconhecimento de entidades
Quando você ingere um conjunto de dados para um flywheel associado a um modelo de reconhecimento de entidade personalizado, as cotas a seguir se aplicam.
Descrição | Cota/diretriz |
---|---|
Tamanho máximo do documento | 5 KB |
Número mínimo de documentos de treinamento | 3 |
Número máximo de documentos de treinamento | 200.000 |
Número mínimo de anotações por entidade | 25 |
Tamanho máximo do conjunto de dados | 200 MB |