Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Creazione di un filtro del vocabolario - Amazon Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un filtro del vocabolario

Sono disponibili due opzioni per la creazione di un filtro del vocabolario personalizzato:

  1. Salva un elenco di parole separate da righe come file di testo semplice con codifica UTF-8.

    • Puoi usare questo approccio con AWS Management Console, AWS CLI o. AWS SDKs

    • Se si utilizza il AWS Management Console, è possibile fornire un percorso locale o un Amazon S3 URI per il file di vocabolario personalizzato.

    • Se si utilizza AWS CLI o AWS SDKs, è necessario caricare il file di vocabolario personalizzato in un Amazon S3 bucket e includere l'URI nella richiesta. Amazon S3

  2. Includi un elenco di parole separate da virgole direttamente nella tua richiesta API.

    • È possibile utilizzare questo approccio con AWS CLI o AWS SDKs utilizzando il parametro. Words

Per esempi di ciascun metodo, consulta Creazione di filtri del vocabolario personalizzato

Cose da tenere a mente quando si crea un filtro del vocabolario personalizzato:

  • Le parole non distinguono tra maiuscole e minuscole. Ad esempio, "maledizione" e "MALEDIZIONE" sono considerati uguali.

  • Vengono filtrate solo le corrispondenze esatte delle parole. Ad esempio, se il filtro include "imprecare" ma i file multimediali contengono la parola "impreca" o "imprecando", questi non vengono filtrati. Vengono filtrati solo i casi di "imprecare". È quindi necessario includere tutte le varianti delle parole che si desidera filtrare.

  • I filtri non si applicano alle parole contenute in altre parole. Ad esempio, se un filtro del vocabolario personalizzato contiene "marino", ma non "sottomarino", "sottomarino" non verrà alterato nella trascrizione.

  • Ogni voce può contenere solo una parola (senza spazi).

  • Se salvi il filtro del vocabolario personalizzato come file di testo, deve essere in formato di testo semplice con codifica UTF-8.

  • Puoi avere fino a 100 Account AWS filtri di vocabolario personalizzati ciascuno, ognuno dei quali può avere una dimensione massima di 50 Kb.

  • È possibile utilizzare solo caratteri supportati nella propria lingua. Fai riferimento al set di caratteri della tua lingua per i dettagli.

Creazione di filtri del vocabolario personalizzato

Per elaborare un filtro di vocabolario personalizzato da utilizzare con Amazon Transcribe, consulta i seguenti esempi:

Prima di continuare, salva il filtro del vocabolario personalizzato come file di testo (*.txt). Facoltativamente, puoi caricare il file in un bucket. Amazon S3

  1. Accedi alla AWS Management Console.

  2. Nel riquadro di navigazione scegliere Filtro vocabolario. Si aprirà la pagina dei Filtri del vocabolario in cui è possibile visualizzare i filtri del vocabolario personalizzato esistenti o crearne uno nuovo.

  3. Seleziona Crea filtro del vocabolario.

    Amazon Transcribe schermata della console: la pagina dei «filtri del vocabolario».

    Viene visualizzata la pagina Crea filtro del vocabolario. Inserisci un nome per il nuovo filtro del vocabolario personalizzato.

    Seleziona l'opzione Carica file o Posizione S3 nella sorgente di input del vocabolario. Quindi specifica la posizione del file del vocabolario personalizzato.

    Amazon Transcribe schermata della console: la pagina «crea filtro per il vocabolario».
  4. Facoltativamente, aggiungi i tag al filtro del vocabolario personalizzato. Una volta che hai completato tutti i campi, seleziona Crea filtro del vocabolario nella parte inferiore della pagina. Se non ci sono errori nell'elaborazione del file, tornerai alla pagina dei filtri del vocabolario.

    A questo punto, il filtro del vocabolario personalizzato è pronto per l'uso.

Prima di continuare, salva il filtro del vocabolario personalizzato come file di testo (*.txt). Facoltativamente, puoi caricare il file in un bucket. Amazon S3

  1. Accedi alla AWS Management Console.

  2. Nel riquadro di navigazione scegliere Filtro vocabolario. Si aprirà la pagina dei Filtri del vocabolario in cui è possibile visualizzare i filtri del vocabolario personalizzato esistenti o crearne uno nuovo.

  3. Seleziona Crea filtro del vocabolario.

    Amazon Transcribe schermata della console: la pagina dei «filtri del vocabolario».

    Viene visualizzata la pagina Crea filtro del vocabolario. Inserisci un nome per il nuovo filtro del vocabolario personalizzato.

    Seleziona l'opzione Carica file o Posizione S3 nella sorgente di input del vocabolario. Quindi specifica la posizione del file del vocabolario personalizzato.

    Amazon Transcribe schermata della console: la pagina «crea filtro per il vocabolario».
  4. Facoltativamente, aggiungi i tag al filtro del vocabolario personalizzato. Una volta che hai completato tutti i campi, seleziona Crea filtro del vocabolario nella parte inferiore della pagina. Se non ci sono errori nell'elaborazione del file, tornerai alla pagina dei filtri del vocabolario.

    A questo punto, il filtro del vocabolario personalizzato è pronto per l'uso.

Questo esempio utilizza il create-vocabulary-filtercomando per trasformare un elenco di parole in un filtro di vocabolario personalizzato utilizzabile. Per ulteriori informazioni, consulta CreateVocabularyFilter.

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro words.

aws transcribe create-vocabulary-filter \ --vocabulary-filter-name my-first-vocabulary-filter \ --language-code en-US \ --words profane,offensive,Amazon,Transcribe

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro vocabulary-filter-file-uri.

aws transcribe create-vocabulary-filter \ --vocabulary-filter-name my-first-vocabulary-filter \ --language-code en-US \ --vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt

Ecco un altro esempio di utilizzo del create-vocabulary-filtercomando e un corpo della richiesta che crea un filtro di vocabolario personalizzato.

aws transcribe create-vocabulary-filter \ --cli-input-json file://filepath/my-first-vocab-filter.json

Il file my-first-vocab-filter.json contiene il seguente corpo della richiesta.

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.

{ "VocabularyFilterName": "my-first-vocabulary-filter", "LanguageCode": "en-US", "Words": [ "profane","offensive","Amazon","Transcribe" ] }

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro VocabularyFilterFileUri.

{ "VocabularyFilterName": "my-first-vocabulary-filter", "LanguageCode": "en-US", "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt" }
Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

Questo esempio utilizza il create-vocabulary-filtercomando per trasformare un elenco di parole in un filtro di vocabolario personalizzato utilizzabile. Per ulteriori informazioni, consulta CreateVocabularyFilter.

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro words.

aws transcribe create-vocabulary-filter \ --vocabulary-filter-name my-first-vocabulary-filter \ --language-code en-US \ --words profane,offensive,Amazon,Transcribe

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro vocabulary-filter-file-uri.

aws transcribe create-vocabulary-filter \ --vocabulary-filter-name my-first-vocabulary-filter \ --language-code en-US \ --vocabulary-filter-file-uri s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt

Ecco un altro esempio di utilizzo del create-vocabulary-filtercomando e un corpo della richiesta che crea un filtro di vocabolario personalizzato.

aws transcribe create-vocabulary-filter \ --cli-input-json file://filepath/my-first-vocab-filter.json

Il file my-first-vocab-filter.json contiene il seguente corpo della richiesta.

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.

{ "VocabularyFilterName": "my-first-vocabulary-filter", "LanguageCode": "en-US", "Words": [ "profane","offensive","Amazon","Transcribe" ] }

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro VocabularyFilterFileUri.

{ "VocabularyFilterName": "my-first-vocabulary-filter", "LanguageCode": "en-US", "VocabularyFilterFileUri": "s3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt" }
Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

Questo esempio utilizza il AWS SDK per Python (Boto3) per creare un filtro di vocabolario personalizzato utilizzando il metodo create_vocabulary_filter. Per ulteriori informazioni, consulta CreateVocabularyFilter.

Per ulteriori esempi di utilizzo dello scenario e degli esempi interservizi AWS SDKs, inclusi quelli relativi a specifiche funzionalità, consultate il capitolo. Esempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary-filter" response = transcribe.create_vocabulary_filter( LanguageCode = 'en-US', VocabularyFilterName = vocab_name, Words = [ 'profane','offensive','Amazon','Transcribe' ] )

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro VocabularyFilterFileUri.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary-filter" response = transcribe.create_vocabulary_filter( LanguageCode = 'en-US', VocabularyFilterName = vocab_name, VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt' )
Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

Questo esempio utilizza il AWS SDK per Python (Boto3) per creare un filtro di vocabolario personalizzato utilizzando il metodo create_vocabulary_filter. Per ulteriori informazioni, consulta CreateVocabularyFilter.

Per ulteriori esempi di utilizzo dello scenario e degli esempi interservizi AWS SDKs, inclusi quelli relativi a specifiche funzionalità, consultate il capitolo. Esempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs

Opzione 1: È possibile includere l'elenco di parole nella richiesta utilizzando il parametro Words.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary-filter" response = transcribe.create_vocabulary_filter( LanguageCode = 'en-US', VocabularyFilterName = vocab_name, Words = [ 'profane','offensive','Amazon','Transcribe' ] )

Opzione 2: puoi salvare l'elenco di parole come file di testo e caricarlo in un bucket Amazon S3 , quindi includere l'URI del file nella richiesta utilizzando il parametro VocabularyFilterFileUri.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary-filter" response = transcribe.create_vocabulary_filter( LanguageCode = 'en-US', VocabularyFilterName = vocab_name, VocabularyFilterFileUri = 's3://amzn-s3-demo-bucket/my-vocabulary-filters/my-vocabulary-filter.txt' )
Nota

Se includi VocabularyFilterFileUri nella richiesta, non puoi utilizzare Words; devi scegliere l'uno o l'altro.

Nota

Se crei un nuovo Amazon S3 bucket per i tuoi file di filtro del vocabolario personalizzati, assicurati che il IAM ruolo che effettua la CreateVocabularyFilterrichiesta disponga delle autorizzazioni per accedere a questo bucket. Se il ruolo non dispone delle autorizzazioni corrette, la richiesta fallirà. Facoltativamente, puoi specificare un IAM ruolo all'interno della tua richiesta includendo il parametro. DataAccessRoleArn Per ulteriori informazioni sui IAM ruoli e le politiche in Amazon Transcribe, vedereAmazon Transcribe esempi di politiche basate sull'identità.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.