Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzare un filtro di vocabolario personalizzato
Una volta creato il filtro di vocabolario personalizzato, puoi includerlo nelle tue richieste di trascrizione; consulta le sezioni seguenti per gli esempi.
La lingua del filtro del vocabolario personalizzato che includi nella richiesta deve corrispondere al codice della lingua specificato per i file multimediali. Se utilizzi l'identificazione della lingua e specifichi più opzioni linguistiche, puoi includere un filtro di vocabolario personalizzato per lingua specificata. Se le lingue dei filtri del vocabolario personalizzati non corrispondono alla lingua identificata nell'audio, i filtri non vengono applicati alla trascrizione e non vi sono avvisi o errori.
Utilizzo di un filtro di vocabolario personalizzato in una trascrizione batch
Per utilizzare un filtro di vocabolario personalizzato con una trascrizione in batch, consulta i seguenti esempi:
-
Accedere alla AWS Management Console
. -
Nel riquadro di navigazione, scegli Lavori di trascrizione, quindi seleziona Crea lavoro (in alto a destra). Si apre la pagina Specifica i dettagli del lavoro.
Assegna un nome al lavoro e specifica il supporto di input. Facoltativamente, includi qualsiasi altro campo, quindi scegli Avanti.
-
Nella pagina Configura lavoro, nel pannello di rimozione dei contenuti, attiva il filtro del vocabolario.
-
Seleziona il tuo filtro di vocabolario personalizzato dal menu a discesa e specifica il metodo di filtraggio.
-
Seleziona Crea lavoro per eseguire il processo di trascrizione.
Questo esempio utilizza il start-transcription-jobSettings
parametro con iVocabularyFilterMethod
sottoparametriVocabularyFilterName
and. Per ulteriori informazioni, consultare StartTranscriptionJob
e Settings
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings VocabularyFilterName=my-first-vocabulary-filter
,VocabularyFilterMethod=mask
Ecco un altro esempio di utilizzo del start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://my-first-vocabulary-filter-job
.json
Il file my-first-vocabulary-filter-job.json contiene il seguente corpo della richiesta.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US
", "Settings": { "VocabularyFilterName": "my-first-vocabulary-filter
", "VocabularyFilterMethod": "mask
" } }
Questo esempio utilizza ilAWS SDK for Python (Boto3) per includere un filtro di vocabolario personalizzato utilizzando l'Settings
argomento per il metodo start_transcription_jobStartTranscriptionJob
e Settings
.
Per ulteriori esempi di utilizzo degliAWS SDK, inclusi esempi specifici per funzionalità, scenari e interservizi, consulta ilEsempi di codice per l'utilizzo di Amazon Transcribe AWS SDKs capitolo.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US
', Settings = { 'VocabularyFilterName': 'my-first-vocabulary-filter
', 'VocabularyFilterMethod': 'mask
' } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Utilizzo di un filtro di vocabolario personalizzato in una trascrizione in streaming
Per utilizzare un filtro di vocabolario personalizzato con una trascrizione in streaming, consulta i seguenti esempi:
-
Accedi a AWS Management Console
. -
Nel riquadro di navigazione scegli Trascrizione in tempo reale. Scorri verso il basso fino a Impostazioni di rimozione dei contenuti ed espandi questo campo se è ridotto a icona.
-
Attiva il filtro del vocabolario. Selezionare un filtro di vocabolario personalizzato dal menu a discesa e specificare il metodo di filtrazione.
Selezionare tutte le altre impostazioni che si desidera applicare allo stream.
-
A questo punto puoi eseguire la trascrizione del tuo stream. Seleziona Avvia streaming e inizia a parlare. Per terminare la dettatura, seleziona Interrompi streaming.
Questo esempio crea una richiesta HTTP/2 che include il filtro del vocabolario e il metodo di filtro personalizzati. Per ulteriori informazioni sull'utilizzo dello streaming HTTP/2 conAmazon Transcribe, consultaConfigurazione di uno HTTP stream /2. Per maggiori dettagli sui parametri e sulle intestazioni specifici perAmazon Transcribe, consulta StartStreamTranscription
.
POST /stream-transcription HTTP/2 host: transcribestreaming.
us-west-2
.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256:string
X-Amz-Date:20220208
T235959
Z Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code:en-US
x-amzn-transcribe-media-encoding:flac
x-amzn-transcribe-sample-rate:16000
x-amzn-transcribe-vocabulary-filter-name:my-first-vocabulary-filter
x-amzn-transcribe-vocabulary-filter-method:mask
transfer-encoding: chunked
Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioniAWS API sono elencati nella sezione Parametri comuni.
Questo esempio crea un URL predefinito che applica il filtro del vocabolario personalizzato a uno WebSocket stream. Le interruzioni di riga sono state aggiunte per la leggibilità. Per ulteriori informazioni sull'utilizzo WebSocket degli stream conAmazon Transcribe, consultaConfigurazione di uno WebSocket stream. Per ulteriori dettagli sui parametri, vedere StartStreamTranscription
.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US
&media-encoding=flac
&sample-rate=16000
&vocabulary-filter-name=my-first-vocabulary-filter
&vocabulary-filter-method=mask
Le definizioni dei parametri sono disponibili nell'API Reference; i parametri comuni a tutte le operazioniAWS API sono elencati nella sezione Parametri comuni.