Creazione di un filtro del vocabolario - Amazon Transcribe

Creazione di filtri del vocabolario personalizzato

Creazione di un filtro del vocabolario

Sono disponibili due opzioni per la creazione di un filtro del vocabolario personalizzato:

Salva un elenco di parole separate da righe come file di testo semplice con codifica UTF-8.
- Puoi usare questo approccio con AWS Management Console, AWS CLI o. AWS SDKs
- Se si utilizza il AWS Management Console, è possibile fornire un percorso locale o un Amazon S3 URI per il file di vocabolario personalizzato.
- Se si utilizza AWS CLI o AWS SDKs, è necessario caricare il file di vocabolario personalizzato in un Amazon S3 bucket e includere l'URI nella richiesta. Amazon S3
Includi un elenco di parole separate da virgole direttamente nella tua richiesta API.
- È possibile utilizzare questo approccio con AWS CLI o AWS SDKs utilizzando il parametro. Words

Per esempi di ciascun metodo, consulta Creazione di filtri del vocabolario personalizzato

Cose da tenere a mente quando si crea un filtro del vocabolario personalizzato:

Le parole non distinguono tra maiuscole e minuscole. Ad esempio, "maledizione" e "MALEDIZIONE" sono considerati uguali.
Vengono filtrate solo le corrispondenze esatte delle parole. Ad esempio, se il filtro include "imprecare" ma i file multimediali contengono la parola "impreca" o "imprecando", questi non vengono filtrati. Vengono filtrati solo i casi di "imprecare". È quindi necessario includere tutte le varianti delle parole che si desidera filtrare.
I filtri non si applicano alle parole contenute in altre parole. Ad esempio, se un filtro del vocabolario personalizzato contiene "marino", ma non "sottomarino", "sottomarino" non verrà alterato nella trascrizione.
Ogni voce può contenere solo una parola (senza spazi).
Se salvi il filtro del vocabolario personalizzato come file di testo, deve essere in formato di testo semplice con codifica UTF-8.
Puoi avere fino a 100 Account AWS filtri di vocabolario personalizzati ciascuno, ognuno dei quali può avere una dimensione massima di 50 Kb.
È possibile utilizzare solo caratteri supportati nella propria lingua. Fai riferimento al set di caratteri della tua lingua per i dettagli.

Creazione di filtri del vocabolario personalizzato

Per elaborare un filtro di vocabolario personalizzato da utilizzare con Amazon Transcribe, consulta i seguenti esempi:

Prima di continuare, salva il filtro del vocabolario personalizzato come file di testo (*.txt). Facoltativamente, puoi caricare il file in un bucket. Amazon S3

Accedi alla AWS Management Console.
Nel riquadro di navigazione scegliere Filtro vocabolario. Si aprirà la pagina dei Filtri del vocabolario in cui è possibile visualizzare i filtri del vocabolario personalizzato esistenti o crearne uno nuovo.
Seleziona Crea filtro del vocabolario.

Viene visualizzata la pagina Crea filtro del vocabolario. Inserisci un nome per il nuovo filtro del vocabolario personalizzato.

Seleziona l'opzione Carica file o Posizione S3 nella sorgente di input del vocabolario. Quindi specifica la posizione del file del vocabolario personalizzato.
Facoltativamente, aggiungi i tag al filtro del vocabolario personalizzato. Una volta che hai completato tutti i campi, seleziona Crea filtro del vocabolario nella parte inferiore della pagina. Se non ci sono errori nell'elaborazione del file, tornerai alla pagina dei filtri del vocabolario.

A questo punto, il filtro del vocabolario personalizzato è pronto per l'uso.

AWS Management Console

Prima di continuare, salva il filtro del vocabolario personalizzato come file di testo (*.txt). Facoltativamente, puoi caricare il file in un bucket. Amazon S3

Accedi alla AWS Management Console.
Nel riquadro di navigazione scegliere Filtro vocabolario. Si aprirà la pagina dei Filtri del vocabolario in cui è possibile visualizzare i filtri del vocabolario personalizzato esistenti o crearne uno nuovo.
Seleziona Crea filtro del vocabolario.

Viene visualizzata la pagina Crea filtro del vocabolario. Inserisci un nome per il nuovo filtro del vocabolario personalizzato.

Seleziona l'opzione Carica file o Posizione S3 nella sorgente di input del vocabolario. Quindi specifica la posizione del file del vocabolario personalizzato.
Facoltativamente, aggiungi i tag al filtro del vocabolario personalizzato. Una volta che hai completato tutti i campi, seleziona Crea filtro del vocabolario nella parte inferiore della pagina. Se non ci sono errori nell'elaborazione del file, tornerai alla pagina dei filtri del vocabolario.

A questo punto, il filtro del vocabolario personalizzato è pronto per l'uso.

Questo esempio utilizza il create-vocabulary-filtercomando per trasformare un elenco di parole in un filtro di vocabolario personalizzato utilizzabile. Per ulteriori informazioni, consulta CreateVocabularyFilter.

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro words.


aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--words profane,offensive,Amazon,Transcribe

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro vocabulary-filter-file-uri.


aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt

Ecco un altro esempio di utilizzo del create-vocabulary-filtercomando e un corpo della richiesta che crea un filtro di vocabolario personalizzato.


aws transcribe create-vocabulary-filter \
--cli-input-json file://filepath/my-first-vocab-filter.json

Il file my-first-vocab-filter.json contiene il seguente corpo della richiesta.

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.


{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "Words": [
        "profane","offensive","Amazon","Transcribe"
  ]
}

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro VocabularyFilterFileUri.


{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt"
}

Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

AWS CLI

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro words.


aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--words profane,offensive,Amazon,Transcribe


aws transcribe create-vocabulary-filter \ 
--vocabulary-filter-name my-first-vocabulary-filter \ 
--language-code en-US \ 
--vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt

Ecco un altro esempio di utilizzo del create-vocabulary-filtercomando e un corpo della richiesta che crea un filtro di vocabolario personalizzato.


aws transcribe create-vocabulary-filter \
--cli-input-json file://filepath/my-first-vocab-filter.json

Il file my-first-vocab-filter.json contiene il seguente corpo della richiesta.

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.


{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "Words": [
        "profane","offensive","Amazon","Transcribe"
  ]
}


{
  "VocabularyFilterName": "my-first-vocabulary-filter",
  "LanguageCode": "en-US",
  "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt"
}

Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

Questo esempio utilizza il AWS SDK per Python (Boto3) per creare un filtro di vocabolario personalizzato utilizzando il metodo create_vocabulary_filter. Per ulteriori informazioni, consulta CreateVocabularyFilter.

Per ulteriori esempi di utilizzo dello scenario e degli esempi interservizi AWS SDKs, inclusi quelli relativi a specifiche funzionalità, consultate il capitolo. Esempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    Words = [        
        'profane','offensive','Amazon','Transcribe'
    ]
)


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt'
)

Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

AWS SDK per Python (Boto3)

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    Words = [        
        'profane','offensive','Amazon','Transcribe'
    ]
)


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary-filter"
response = transcribe.create_vocabulary_filter(
    LanguageCode = 'en-US',
    VocabularyFilterName = vocab_name,
    VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt'
)

Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

Nota

Se crei un nuovo Amazon S3 bucket per i tuoi file di filtro del vocabolario personalizzati, assicurati che il IAM ruolo che effettua la CreateVocabularyFilterrichiesta disponga delle autorizzazioni per accedere a questo bucket. Se il ruolo non dispone delle autorizzazioni corrette, la richiesta fallirà. Facoltativamente, puoi specificare un IAM ruolo all'interno della tua richiesta includendo il parametro. DataAccessRoleArn Per ulteriori informazioni sui IAM ruoli e le politiche in Amazon Transcribe, vedereAmazon Transcribe esempi di politiche basate sull'identità.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Filtraggio delle parole

Utilizzare un filtro del vocabolario personalizzato

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Creazione di un filtro del vocabolario

Creazione di filtri del vocabolario personalizzato

AWS Management Console

Nota

AWS CLI

Nota

Nota

AWS SDK per Python (Boto3)

Nota

Nota

Questa pagina ti è stata utile?

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?

Amazon Transcribe schermata della console: la pagina dei «filtri del vocabolario».

Amazon Transcribe schermata della console: la pagina «crea filtro per il vocabolario».