Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di un filtro del vocabolario
Sono disponibili due opzioni per la creazione di un filtro del vocabolario personalizzato:
-
Salva un elenco di parole separate da righe come file di testo semplice con codifica UTF-8.
Puoi usare questo approccio con AWS Management Console, AWS CLI o. AWS SDKs
Se si utilizza il AWS Management Console, è possibile fornire un percorso locale o un Amazon S3 URI per il file di vocabolario personalizzato.
Se si utilizza AWS CLI o AWS SDKs, è necessario caricare il file di vocabolario personalizzato in un Amazon S3 bucket e includere l'URI nella richiesta. Amazon S3
-
Includi un elenco di parole separate da virgole direttamente nella tua richiesta API.
-
È possibile utilizzare questo approccio con AWS CLI o AWS SDKs utilizzando il parametro.
Words
-
Per esempi di ciascun metodo, consulta Creazione di filtri del vocabolario personalizzato
Cose da tenere a mente quando si crea un filtro del vocabolario personalizzato:
-
Le parole non distinguono tra maiuscole e minuscole. Ad esempio, "maledizione" e "MALEDIZIONE" sono considerati uguali.
-
Vengono filtrate solo le corrispondenze esatte delle parole. Ad esempio, se il filtro include "imprecare" ma i file multimediali contengono la parola "impreca" o "imprecando", questi non vengono filtrati. Vengono filtrati solo i casi di "imprecare". È quindi necessario includere tutte le varianti delle parole che si desidera filtrare.
-
I filtri non si applicano alle parole contenute in altre parole. Ad esempio, se un filtro del vocabolario personalizzato contiene "marino", ma non "sottomarino", "sottomarino" non verrà alterato nella trascrizione.
-
Ogni voce può contenere solo una parola (senza spazi).
-
Se salvi il filtro del vocabolario personalizzato come file di testo, deve essere in formato di testo semplice con codifica UTF-8.
-
Puoi avere fino a 100 Account AWS filtri di vocabolario personalizzati ciascuno, ognuno dei quali può avere una dimensione massima di 50 Kb.
-
È possibile utilizzare solo caratteri supportati nella propria lingua. Fai riferimento al set di caratteri della tua lingua per i dettagli.
Creazione di filtri del vocabolario personalizzato
Per elaborare un filtro di vocabolario personalizzato da utilizzare con Amazon Transcribe, consulta i seguenti esempi:
Prima di continuare, salva il filtro del vocabolario personalizzato come file di testo (*.txt). Facoltativamente, puoi caricare il file in un bucket. Amazon S3
-
Accedi alla AWS Management Console
. -
Nel riquadro di navigazione scegliere Filtro vocabolario. Si aprirà la pagina dei Filtri del vocabolario in cui è possibile visualizzare i filtri del vocabolario personalizzato esistenti o crearne uno nuovo.
-
Seleziona Crea filtro del vocabolario.
Viene visualizzata la pagina Crea filtro del vocabolario. Inserisci un nome per il nuovo filtro del vocabolario personalizzato.
Seleziona l'opzione Carica file o Posizione S3 nella sorgente di input del vocabolario. Quindi specifica la posizione del file del vocabolario personalizzato.
-
Facoltativamente, aggiungi i tag al filtro del vocabolario personalizzato. Una volta che hai completato tutti i campi, seleziona Crea filtro del vocabolario nella parte inferiore della pagina. Se non ci sono errori nell'elaborazione del file, tornerai alla pagina dei filtri del vocabolario.
A questo punto, il filtro del vocabolario personalizzato è pronto per l'uso.
Questo esempio utilizza il create-vocabulary-filtercomando per trasformare un elenco di parole in un filtro di vocabolario personalizzato utilizzabile. Per ulteriori informazioni, consulta CreateVocabularyFilter
.
Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro words
.
aws transcribe create-vocabulary-filter \ --vocabulary-filter-name
my-first-vocabulary-filter
\ --language-codeen-US
\ --wordsprofane,offensive,Amazon,Transcribe
Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro vocabulary-filter-file-uri
.
aws transcribe create-vocabulary-filter \ --vocabulary-filter-name
my-first-vocabulary-filter
\ --language-codeen-US
\ --vocabulary-filter-file-uri s3://amzn-s3-demo-bucket
/my-vocabulary-filters
/my-vocabulary-filter
.txt
Ecco un altro esempio di utilizzo del create-vocabulary-filtercomando e un corpo della richiesta che crea un filtro di vocabolario personalizzato.
aws transcribe create-vocabulary-filter \ --cli-input-json file://
filepath
/my-first-vocab-filter
.json
Il file my-first-vocab-filter.json contiene il seguente corpo della richiesta.
Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words
.
{
"VocabularyFilterName": "my-first-vocabulary-filter
",
"LanguageCode": "en-US
",
"Words": [
"profane
","offensive
","Amazon
","Transcribe
"
]
}
Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro VocabularyFilterFileUri
.
{
"VocabularyFilterName": "my-first-vocabulary-filter
",
"LanguageCode": "en-US
",
"VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket
/my-vocabulary-filters
/my-vocabulary-filter
.txt"
}
Nota
Se includi VocabularyFilterFileUri
nella richiesta, non puoi utilizzare Words
; devi scegliere l'uno o l'altro.
Questo esempio utilizza il AWS SDK per Python (Boto3) per creare un filtro di vocabolario personalizzato utilizzando il metodo create_vocabulary_filter.CreateVocabularyFilter
.
Per ulteriori esempi di utilizzo dello scenario e degli esempi interservizi AWS SDKs, inclusi quelli relativi a specifiche funzionalità, consultate il capitolo. Esempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs
Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words
.
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2
')
vocab_name = "my-first-vocabulary-filter
"
response = transcribe.create_vocabulary_filter(
LanguageCode = 'en-US
',
VocabularyFilterName = vocab_name,
Words = [
'profane
','offensive
','Amazon
','Transcribe
'
]
)
Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro VocabularyFilterFileUri
.
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2
')
vocab_name = "my-first-vocabulary-filter
"
response = transcribe.create_vocabulary_filter(
LanguageCode = 'en-US
',
VocabularyFilterName = vocab_name,
VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket
/my-vocabulary-filters
/my-vocabulary-filter
.txt'
)
Nota
Se includi VocabularyFilterFileUri
nella richiesta, non puoi utilizzare Words
; devi scegliere l'uno o l'altro.
Nota
Se crei un nuovo Amazon S3 bucket per i tuoi file di filtro del vocabolario personalizzati, assicurati che il IAM ruolo che effettua la CreateVocabularyFilter
richiesta disponga delle autorizzazioni per accedere a questo bucket. Se il ruolo non dispone delle autorizzazioni corrette, la richiesta fallirà. Facoltativamente, puoi specificare un IAM ruolo all'interno della tua richiesta includendo il parametro. DataAccessRoleArn
Per ulteriori informazioni sui IAM ruoli e le politiche in Amazon Transcribe, vedereAmazon Transcribe esempi di politiche basate sull'identità.