Linee guida e quote - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Linee guida e quote

Se non diversamente specificato, le quote di Amazon Comprehend si intendono per regione. Puoi richiedere un aumento delle quote regolabili se necessario per le tue applicazioni. Per informazioni sulle quote e per richiedere un aumento delle quote, vedere AWS Service Quotas.

Regioni supportate

Amazon Comprehend è disponibile nelle seguenti regioni: AWS

  • Stati Uniti orientali (Ohio)

  • Stati Uniti orientali (Virginia settentrionale)

  • US West (Oregon)

  • Asia Pacifico (Mumbai)

  • Asia Pacifico (Seoul)

  • Asia Pacifico (Singapore)

  • Asia Pacifico (Sydney)

  • Asia Pacifico (Tokyo)

  • Canada (Centrale)

  • Europa (Francoforte)

  • Europa (Irlanda)

  • Europa (Londra)

  • AWS GovCloud (Stati Uniti occidentali)

Per impostazione predefinita, Amazon Comprehend fornisce tutte le operazioni API in ciascuna delle regioni supportate. Per le eccezioni, consulta. Elaborazione dei documenti

Per informazioni sugli endpoint delle API, consulta Amazon Comprehend Regions and Endpoints nel Amazon Web Services General Reference.

Per rivedere le quote correnti in una regione o per richiedere aumenti delle quote per quote regolabili, apri la console Service Quotas.

Quote per i modelli integrati

Amazon Comprehend fornisce modelli integrati per analizzare documenti di testo UTF-8. Amazon Comprehend fornisce operazioni sincrone e asincrone che utilizzano i modelli integrati.

Analisi (sincrona) in tempo reale

Questa sezione descrive le quote relative all'analisi in tempo reale utilizzando i modelli integrati.

Operazioni su un singolo documento

L'API Amazon Comprehend fornisce operazioni che richiedono un singolo documento come input. Le seguenti quote si applicano a queste operazioni.

Quote generali per le operazioni relative a singoli documenti

Le seguenti quote si applicano all'analisi in tempo reale per il rilevamento di entità, frasi chiave o lingua dominante. Per il rilevamento delle entità, queste quote si applicano al rilevamento con i modelli integrati. Per il rilevamento personalizzato delle entità, consulta le quote in. Riconoscimento personalizzato delle entità

Descrizione Quota/Linea guida
Dimensione massima del documento 100 KB
Quote specifiche per le operazioni relative a singoli documenti

Le seguenti quote si applicano all'analisi in tempo reale per rilevare il sentimento, il sentimento mirato e la sintassi.

Descrizione Quota/Linea guida
Dimensione massima del documento 5 KB

Operazioni su più documenti

L'API Amazon Comprehend fornisce operazioni in batch che elaborano più documenti con un'unica richiesta API. Le seguenti quote si applicano alle operazioni batch.

Descrizione Quota/linea guida
Dimensione massima del documento 5 KB
Numero massimo di documenti per richiesta 25

Per ulteriori informazioni sull'utilizzo delle operazioni relative ai documenti batch, vedereElaborazione sincrona di più documenti.

Limitazione delle richieste per richieste in tempo reale (sincrone)

Amazon Comprehend applica la limitazione dinamica alle richieste sincrone. Se la larghezza di banda per l'elaborazione del sistema è disponibile, Amazon Comprehend aumenta gradualmente il numero di richieste elaborate. Per controllare l'utilizzo da parte dell'applicazione delle operazioni API sincrone, ti consigliamo di attivare gli avvisi di fatturazione o di implementare la limitazione della velocità nell'applicazione.

Analisi asincrona

Questa sezione descrive le quote relative all'analisi asincrona utilizzando i modelli integrati.

Le operazioni API asincrone supportano ciascuna un massimo di 10 lavori attivi. Per visualizzare le quote per ogni operazione API, consulta la tabella Service Quotas negli endpoint Amazon Comprehend e le quote nell'Amazon Web Services General Reference.

Per le quote regolabili, puoi richiedere un aumento della quota utilizzando la console Service Quotas.

Quote generali per operazioni asincrone

È possibile eseguire lavori di analisi asincroni utilizzando la console o una qualsiasi delle operazioni API. Start* Per informazioni su quando utilizzare le operazioni asincrone, vedere. Elaborazione asincrona in batch Le seguenti quote si applicano alla maggior parte delle Start* operazioni API per i modelli integrati. Per le eccezioni, vedere. Quote specifiche dell'operazione per lavori asincroni

Descrizione Quota/Linea guida
Dimensione massima di ogni documento nei lavori che rilevano entità, frasi chiave, PII e lingue 1 MB
Dimensione totale massima di tutti i file in una richiesta 5 GB
Dimensione totale minima di tutti i file in una richiesta 500 byte
Numero massimo di file, un documento per file 1.000.000
Numero massimo totale di righe, un documento per riga 1.000.000

Quote specifiche dell'operazione per lavori asincroni

Questa sezione descrive le quote per operazioni asincrone specifiche. Se una quota non è specificata nelle tabelle seguenti, si applica il valore generale della quota.

Sentiment

I lavori di sentiment asincroni, creati con l'StartSentimentDetectionJoboperazione, hanno le seguenti quote.

Descrizione Quota/Linea guida
Dimensione massima di ogni documento di input 5 KB
Sentimento mirato

I job asincroni mirati basati sul sentiment, creati con l'StartTargetedSentimentDetectionJoboperazione, hanno le seguenti quote.

Descrizione Quota/Linea guida
Formati di documenti supportati UTF-8
Dimensione massima di ogni documento in un lavoro 10 KB
Dimensione massima di tutti i documenti di un lavoro 300 MB
Numero massimo di file, un documento per file 30.000
Numero massimo totale di righe, un documento per riga (per tutti i file di una richiesta) 30.000
Eventi

I job di rilevamento degli eventi asincroni, creati con l'StartEventsDetectionJoboperazione, hanno le seguenti quote.

Descrizione Quote
Codifica caratteri UTF-8
Dimensione totale di tutti i file in un lavoro 50 MB
Dimensione massima di ogni documento in un lavoro 10 KB
Numero massimo di file, un documento per file 5.000
Numero massimo totale di righe, un documento per riga (per tutti i file richiesti) 5.000
Modellazione degli argomenti

I lavori di modellazione asincrona degli argomenti, creati con l'StartTopicsDetectionJoboperazione, hanno le seguenti quote.

Descrizione Quota/Linea guida
Codifica caratteri UTF-8
Numero massimo di argomenti da restituire 100
Dimensione massima per un file, un documento per file 100 MB

Per ulteriori informazioni, consultare Modellazione degli argomenti

Limitazione delle richieste per richieste asincrone

Ogni operazione API asincrona supporta un numero massimo di richieste al secondo (per regione, per account) e anche un massimo di 10 lavori attivi. Per visualizzare le quote per ogni operazione API, consulta la tabella Service Quotas negli endpoint Amazon Comprehend e le quote nell'Amazon Web Services General Reference.

Per le quote regolabili, puoi richiedere un aumento della quota utilizzando la console Service Quotas.

Quote per modelli personalizzati

Puoi usare Amazon Comprehend per creare modelli personalizzati per la classificazione personalizzata e il riconoscimento personalizzato delle entità. Questa sezione fornisce le linee guida e le quote relative alla formazione e all'utilizzo di modelli personalizzati. Per ulteriori informazioni sui modelli personalizzati, vedereAmazon Comprehend personalizzato.

Quote generali

Amazon Comprehend stabilisce quote di dimensione generali per ogni tipo di documento di input che puoi analizzare con modelli personalizzati. Per le quote di analisi in tempo reale, consulta. Dimensioni massime dei documenti per l'analisi in tempo reale Per le quote di analisi asincrone, vedere. Ingressi per analisi asincrone personalizzate

Ogni operazione API asincrona supporta un numero massimo di richieste al secondo (per regione, per account) e anche un massimo di 10 lavori attivi. Per visualizzare le quote per ogni operazione API, consulta la tabella Service Quotas negli endpoint Amazon Comprehend e le quote nell'Amazon Web Services General Reference.

Per le quote regolabili, puoi richiedere un aumento della quota utilizzando la console Service Quotas.

Quote per gli endpoint

Crei un endpoint per eseguire analisi in tempo reale con un modello personalizzato. Per informazioni sugli endpoint, consulta. Gestione degli endpoint Amazon Comprehend

Le seguenti quote si applicano agli endpoint. Per informazioni su come richiedere un aumento della quota, vedere AWS Service Quotas.

Descrizione Quota/Linea guida
Numero massimo di endpoint attivi per regione per ogni account 20
Numero massimo di unità di inferenza per regione per ogni account 200
Numero massimo di unità di inferenza per endpoint per regione 50
Velocità effettiva massima per unità di inferenza (caratteri) 100 al secondo
Velocità effettiva massima per unità di inferenza (documenti) 2/secondo

Classificazione dei documenti

Questa sezione descrive le linee guida e le quote per le seguenti operazioni di classificazione dei documenti:

Quote generali per la classificazione dei documenti

La tabella seguente descrive le quote generali relative alla formazione di classificatori personalizzati.

Descrizione Quota/linea guida
Lunghezza massima del nome della classe 5.000 caratteri
Numero di classi (modalità multiclasse) 2—1.000
Numero di classi (modalità multietichetta) 2—100
Formato delle annotazioni
Numero minimo di annotazioni per classe (modalità multiclasse) 10
Numero minimo di annotazioni per classe (modalità multi-etichetta) 10
Numero minimo di annotazioni (modalità multietichetta) 50
Formato di file CSV
Numero minimo di documenti di formazione per classe (modalità multiclasse) 50
Numero minimo di documenti di formazione per classe (modalità multi-etichetta) 10
Numero minimo di documenti di formazione (modalità multietichetta) 50

Classificazione per documenti di testo semplice

Si crea e si addestra un modello di testo semplice utilizzando documenti di input in testo semplice. Amazon Comprehend fornisce operazioni asincrone e in tempo reale per classificare documenti di testo semplice utilizzando un modello di testo semplice.

Addestramento

La tabella seguente descrive le quote relative all'addestramento di un classificatore personalizzato con documenti di testo semplice.

Descrizione Quota/Linea guida
Dimensione totale di tutti i file del lavoro di formazione 5 GB
Numero massimo di file manifest aumentati per l'addestramento di un classificatore personalizzato 5
Numero massimo di nomi di attributi per ogni file manifest aumentato 5
Lunghezza massima del nome dell'attributo 63 caratteri
Analisi in tempo reale (sincrona)

La tabella seguente descrive le quote relative alla classificazione in tempo reale di documenti di testo semplice.

Descrizione Quota/Linea guida
Numero massimo di documenti per richiesta sincrona 1
Dimensione massima del documento di testo (codifica UTF-8) 10 KB
Analisi asincrona

La tabella seguente descrive le quote relative alla classificazione asincrona di documenti di testo semplice.

Descrizione Quota/Linea guida
Dimensione totale di tutti i file in un processo asincrono 5 GB
Dimensione massima per un file, un documento per file 10 MB
Numero massimo di file, un documento per file 1.000.000
Numero massimo totale di righe, un documento per riga (per tutti i file richiesti) 1.000.000

Classificazione per documenti semistrutturati

Questa sezione descrive le linee guida e le quote per la classificazione dei documenti semistrutturati. Per classificare i documenti semistrutturati, utilizzate un modello di documento nativo che avete addestrato con documenti di input nativi.

Addestramento di un modello di documento nativo con documenti semistrutturati

La tabella seguente descrive le quote relative alla formazione di un classificatore personalizzato con documenti semistrutturati, come documenti PDF, documenti Word e file di immagine.

Descrizione Quota/Linea guida
Numero massimo di pagine in tutti i documenti 10.000
Dimensione massima del file di annotazioni (tutte le dimensioni dei file CSV combinate) 5 MB
Dimensione del corpus di documenti (documenti di formazione e test) 10 GB
Dimensioni dei file per i file di formazione e test
Dimensioni del file di immagine (JPG, PNG, TIFF). 1 byte: 10 MB.

File TIFF: massimo una pagina.

Dimensioni della pagina per i documenti PDF 1 byte — 10 MB
Dimensioni della pagina per i documenti Word 1 byte—10 MB
Dimensione JSON dell'output dell'API Amazon Textract 1 byte—1 MB
Analisi (sincrona) in tempo reale

Questa sezione descrive le quote relative alla classificazione in tempo reale dei documenti semistrutturati.

La tabella seguente mostra le dimensioni massime dei file per i documenti di input. Per tutti i tipi di documenti di input, il file di input può contenere al massimo una pagina, con non più di 10.000 caratteri.

Tipo di file Dimensione massima (API) Dimensione massima (console)
Documenti di testo UTF-8 10 KB 10 KB
Documenti PDF 10 MB 5 MB
Documenti Word 10 MB 5 MB
File di immagine 10 MB 5 MB
Dimensioni di output dell'API Amazon Textract 1 MB N/A
Analisi asincrona

La tabella seguente descrive le quote relative alla classificazione asincrona dei documenti semistrutturati.

Descrizione Quota/Linea guida
Numero massimo di pagine in tutti i documenti di input per un lavoro 25.000
Dimensione del corpus del documento 25 GB
Dimensioni del file di immagine (JPG, PNG o TIFF) 1 byte: 10 MB.

File TIFF: massimo una pagina.

Dimensioni della pagina per i documenti PDF 1 byte — 10 MB
Dimensioni della pagina per i documenti Word 1 byte—10 MB
Dimensione JSON dell'output dell'API Textract 1 byte—1 MB.

Riconoscimento personalizzato delle entità

Questa sezione descrive le linee guida e le quote per le seguenti operazioni di riconoscimento personalizzato delle entità:

Riconoscimento personalizzato delle entità per documenti di testo semplice

Amazon Comprehend fornisce operazioni asincrone e di sincronizzazione per analizzare documenti di testo semplice con un riconoscimento di entità personalizzato.

Addestramento

Questa sezione descrive le quote relative all'addestramento di un riconoscitore di entità personalizzato per analizzare documenti di testo semplice. Per addestrare il modello, puoi fornire un elenco di entità o un set di documenti di testo annotati.

La tabella seguente descrive le quote relative all'addestramento del modello con un elenco di entità.

Descrizione Quota/Linea guida
Numero di entità per modello 1—25
Dimensione del documento (UTF-8) 1—5.000 byte
Numero di elementi nell'elenco delle entità 1—1 milione
Lunghezza della singola voce (dopo la striscia) nell'elenco delle voci 1—5.000
Dimensione del corpus dell'elenco di entità (tutti i documenti in testo semplice combinati) 5 KB —200 MB

La tabella seguente descrive le quote relative all'addestramento del modello con documenti di testo annotati.

Descrizione Quota/Linea guida
Numero di entità per modello/riconoscimento di entità personalizzato 1—25
Dimensione del documento (UTF-8) 1—5.000 byte
Numero di documenti (vedi Annotazioni in testo semplice) 3-200.000
Dimensione del corpus del documento (tutti i documenti in testo semplice combinati) 5 KB - 200 MB
Numero minimo di annotazioni per entità 25
Analisi (sincrona) in tempo reale

La tabella seguente descrive le quote relative all'analisi in tempo reale di documenti di testo semplice.

Descrizione Quota/Linea guida
Numero massimo di documenti per richiesta sincrona 1
Dimensione massima del documento di testo (codifica UTF-8) 5 KB
Analisi asincrona

La tabella seguente descrive le quote relative al riconoscimento asincrono delle entità di documenti di testo semplice.

Descrizione Quota/Linea guida
Dimensione del documento (UTF-8) 1 byte—1 MB
Numero massimo di file, un documento per file 1.000.000
Numero massimo totale di righe, un documento per riga (per tutti i file richiesti) 1.000.000
Dimensione del corpus del documento (tutti i documenti in testo semplice combinati) 1 byte: 5 GB

Riconoscimento personalizzato delle entità per documenti semistrutturati

Amazon Comprehend fornisce operazioni asincrone e di sincronizzazione per analizzare documenti semistrutturati con un riconoscimento di entità personalizzato. È necessario addestrare il modello utilizzando documenti PDF annotati.

Addestramento

La tabella seguente descrive le quote relative all'addestramento di un riconoscimento di entità personalizzato (CreateEntityRecognizer) per analizzare documenti semistrutturati.

Descrizione Quota/Linea guida
Numero di entità per modello/riconoscimento di entità personalizzato 1—25
Dimensione massima del file di annotazione (UTF-8 JSON) 5 MB
Numero di documenti 250—10.000
Dimensione del corpus del documento (tutti i documenti in testo semplice combinati) 5 KB—1 GB
Numero minimo di annotazioni per entità 100
Numero massimo di file manifest aumentati per l'addestramento di un riconoscitore di entità personalizzato 5
Numero massimo di nomi di attributi per ogni file manifest aumentato 5
Lunghezza massima del nome dell'attributo 63 caratteri
Analisi in tempo reale (sincrona)

Questa sezione descrive le quote relative all'analisi in tempo reale di documenti semistrutturati.

La tabella seguente mostra le dimensioni massime dei file per i documenti di input. Per tutti i tipi di documenti di input, il file di input può contenere al massimo una pagina, con non più di 10.000 caratteri.

Tipo di file Dimensione massima (API) Dimensione massima (console)
Documenti di testo UTF-8 10 KB 10 KB
Documenti PDF 10 MB 5 MB
Documenti Word 10 MB 5 MB
File di immagine 10 MB 5 MB
Textract dei file di output 1 MB N/A
Analisi asincrona

Questa sezione descrive le quote per l'analisi asincrona di documenti semistrutturati.

Descrizione Quota/Linea guida
Dimensioni dell'immagine (JPG o PNG) 1 byte—10 MB
Dimensione dell'immagine (TIFF) 1 byte: 10 MB. Massimo una pagina.
Dimensioni del documento (PDF) 1 byte: 50 MB
Dimensioni del documento (Docx) 1 byte: 5 MB
Dimensioni del documento (UTF-8) 1 byte—1 MB
Numero massimo di file, un documento per file (un documento per riga non è consentito per file di immagine o documenti PDF/Word) 500
Numero massimo di pagine per un file PDF o Docx 100
Dimensione del corpus del documento dopo l'estrazione del testo (testo semplice, tutti i file combinati) 1 byte: 5 GB

Per ulteriori informazioni sui limiti per le immagini, consulta Hard Limits in Amazon Textract

Quote per i volani

Utilizza i volani per gestire l'addestramento e il monitoraggio delle versioni dei modelli personalizzati per la classificazione personalizzata e il riconoscimento personalizzato delle entità. Per ulteriori informazioni su Flywheels, vedere. Volani

Quote generali per i volani

Le seguenti quote si applicano ai volani e alle iterazioni del volano.

Descrizione Quota/Linea guida
Numero massimo di volani 50
Numero massimo di volani nello stato CREATING 10
Numero massimo di set di dati di addestramento per volano 50
Numero massimo di set di dati di test per volano 50
Numero massimo di set di dati con stato INGESTING 10
Numero massimo di iterazioni del volano in corso per account 10

Quote del set di dati per modelli di classificazione personalizzati

Quando si inserisce un set di dati per un volano associato a un modello di classificazione personalizzato, si applicano le seguenti quote.

Descrizione Quota/linea guida
Numero minimo di documenti di formazione per classe (modalità multietichetta) 50
Numero massimo di documenti di formazione 1.000.000
Dimensione minima del set di dati 500 byte
Dimensione massima del set di dati 5 GB
Dimensione massima per un file, un documento per file 10 MB

Quote del set di dati per modelli di riconoscimento delle entità personalizzati

Quando si inserisce un set di dati per un volano associato a un modello di riconoscimento delle entità personalizzato, si applicano le seguenti quote.

Descrizione Quota/linea guida
Dimensione massima del documento 5 KB
Numero minimo di documenti di formazione 3
Numero massimo di documenti di formazione 200.000
Numero minimo di annotazioni per entità 25
Dimensione massima del set di dati 200 MB