Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
StartTranscriptionJob
Trascrive l'audio da un file multimediale e applica eventuali parametri di richiesta aggiuntivi che scegli di includere nella richiesta.
Per effettuare unaStartTranscriptionJob
richiesta, devi prima caricare il tuo file multimediale in un bucket Amazon S3; puoi quindi specificare la posizione Amazon S3 del file utilizzando ilMedia
parametro.
È necessario includere i seguenti parametri nellaStartTranscriptionJob
richiesta:
-
region
: IlRegione AWS luogo in cui stai facendo la tua richiesta. Per un elenco dei dispositiviRegioni AWS supportati con Amazon Transcribe, consulta gli endpoint e le quote di Amazon Transcribe. -
TranscriptionJobName
: un nome personalizzato che crei per il tuo lavoro di trascrizione e che sia unico all'interno del tuoAccount AWS. -
Media
(MediaFileUri
): la posizione Amazon S3 del tuo file multimediale. -
Uno dei
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
: Se conosci la lingua del tuo file multimediale, specificala utilizzando ilLanguageCode
parametro; puoi trovare tutti i codici di lingua validi nella tabella Lingue supportate. Se non conosci le lingue parlate nei tuoi media, usane unaIdentifyLanguage
oIdentifyMultipleLanguages
lascia che Amazon Transcribe identifichi le lingue per te.
Sintassi della richiesta
{
"ContentRedaction": {
"PiiEntityTypes": [ "string
" ],
"RedactionOutput": "string
",
"RedactionType": "string
"
},
"IdentifyLanguage": boolean
,
"IdentifyMultipleLanguages": boolean
,
"JobExecutionSettings": {
"AllowDeferredExecution": boolean
,
"DataAccessRoleArn": "string
"
},
"KMSEncryptionContext": {
"string
" : "string
"
},
"LanguageCode": "string
",
"LanguageIdSettings": {
"string
" : {
"LanguageModelName": "string
",
"VocabularyFilterName": "string
",
"VocabularyName": "string
"
}
},
"LanguageOptions": [ "string
" ],
"Media": {
"MediaFileUri": "string
",
"RedactedMediaFileUri": "string
"
},
"MediaFormat": "string
",
"MediaSampleRateHertz": number
,
"ModelSettings": {
"LanguageModelName": "string
"
},
"OutputBucketName": "string
",
"OutputEncryptionKMSKeyId": "string
",
"OutputKey": "string
",
"Settings": {
"ChannelIdentification": boolean
,
"MaxAlternatives": number
,
"MaxSpeakerLabels": number
,
"ShowAlternatives": boolean
,
"ShowSpeakerLabels": boolean
,
"VocabularyFilterMethod": "string
",
"VocabularyFilterName": "string
",
"VocabularyName": "string
"
},
"Subtitles": {
"Formats": [ "string
" ],
"OutputStartIndex": number
},
"Tags": [
{
"Key": "string
",
"Value": "string
"
}
],
"TranscriptionJobName": "string
"
}
Parametri della richiesta
Per informazioni sui parametri comuni a tutte le azioni, vedere Parametri comuni.
La richiesta accetta i seguenti dati in formato JSON.
- ContentRedaction
-
Consente di eliminare o contrassegnare le informazioni di identificazione personale (PII) specificate nella trascrizione. Se si utilizza
ContentRedaction
, è necessario includere anche i sottoparametri:PiiEntityTypes
RedactionOutput
, eRedactionType
.Tipo: ContentRedaction oggetto
Required: No
- IdentifyLanguage
-
Abilita l'identificazione automatica della lingua nella richiesta di lavoro di trascrizione. Utilizzate questo parametro se il file multimediale contiene una sola lingua. Se i tuoi file multimediali contengono più lingue, usali
IdentifyMultipleLanguages
invece.Se lo includi
IdentifyLanguage
, puoi facoltativamente includere un elenco di codici di lingua, utilizzandoLanguageOptions
, che ritieni possano essere presenti nel tuo file multimediale. Sono incluseLanguageOptions
limitazioni soloIdentifyLanguage
alle opzioni linguistiche specificate, che possono migliorare la precisione della trascrizione.Se desideri applicare un modello linguistico personalizzato, un vocabolario personalizzato o un filtro di vocabolario personalizzato alla tua richiesta di identificazione automatica della lingua, includi
LanguageIdSettings
i relativi sottoparametri (VocabularyName
LanguageModelName
, eVocabularyFilterName
). Se includiLanguageIdSettings
, includi ancheLanguageOptions
.Tieni presente che devi includere uno dei
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
nella tua richiesta. Se includi più di uno di questi parametri, il processo di trascrizione fallisce.Tipo: Booleano
Required: No
- IdentifyMultipleLanguages
-
Consente l'identificazione automatica multilingue nella richiesta di lavoro di trascrizione. Utilizzate questo parametro se il file multimediale contiene più di una lingua. Se i tuoi file multimediali contengono una sola lingua, usali
IdentifyLanguage
invece.Se lo includi
IdentifyMultipleLanguages
, puoi facoltativamente includere un elenco di codici di lingua, utilizzandoLanguageOptions
, che ritieni possano essere presenti nel tuo file multimediale. Sono incluseLanguageOptions
limitazioni soloIdentifyLanguage
alle opzioni linguistiche specificate, che possono migliorare la precisione della trascrizione.Se desideri applicare un vocabolario personalizzato o un filtro di vocabolario personalizzato alla tua richiesta di identificazione automatica della lingua, includi
LanguageIdSettings
i relativi sottoparametri (VocabularyName
eVocabularyFilterName
). Se includiLanguageIdSettings
, includi ancheLanguageOptions
.Tieni presente che devi includere uno dei
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
nella tua richiesta. Se includi più di uno di questi parametri, il processo di trascrizione fallisce.Tipo: Booleano
Required: No
- JobExecutionSettings
-
Consente di controllare il modo in cui viene elaborato il lavoro di trascrizione. Attualmente, l'unica
JobExecutionSettings
modifica che puoi scegliere è abilitare l'accodamento dei lavori utilizzando ilAllowDeferredExecution
sottoparametro.Se includi
JobExecutionSettings
nella tua richiesta, devi includere anche i sottoparametri:AllowDeferredExecution
eDataAccessRoleArn
.Tipo: JobExecutionSettings oggetto
Required: No
- KMSEncryptionContext
-
Una mappa di coppie chiave/valore in testo normale e non segrete, note come coppie di contesto di crittografia, che forniscono un ulteriore livello di sicurezza per i tuoi dati. Per ulteriori informazioni, vedere Contesto diAWS KMS crittografia e Chiavi asimmetriche inAWS KMS.
Tipo: mappatura stringa a stringa
Voci di mappatura: numero massimo di 10 elementi.
Limitazioni di lunghezza della chiave: la lunghezza minima è 1. La lunghezza massima è 2000 caratteri.
Modello di chiave:
.*\S.*
Valore dei vincoli di lunghezza: lunghezza minima di 1. La lunghezza massima è 2000 caratteri.
Modello di valore:
.*\S.*
Required: No
- LanguageCode
-
Il codice della lingua che rappresenta la lingua parlata nel file multimediale di input.
Se non sei sicuro della lingua parlata nel tuo file multimediale, valuta la possibilità di utilizzare
IdentifyLanguage
oIdentifyMultipleLanguages
abilitare l'identificazione automatica della lingua.Tieni presente che devi includere uno dei
LanguageCode
IdentifyLanguage
, oIdentifyMultipleLanguages
nella tua richiesta. Se includi più di uno di questi parametri, il processo di trascrizione fallisce.Per un elenco delle lingue supportate e dei codici di lingua associati, consulta la tabella Lingue supportate.
Nota
Per trascrivere il parlato in arabo standard moderno (
ar-SA
), il file multimediale deve essere codificato con una frequenza di campionamento di 16.000 Hz o superiore.Tipo: String
Valori validi:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
Required: No
- LanguageIdSettings
-
Se utilizzi l'identificazione automatica della lingua nella tua richiesta e desideri applicare un modello linguistico personalizzato, un vocabolario personalizzato o un filtro di vocabolario personalizzato,
LanguageIdSettings
includi i sottoparametri pertinenti (VocabularyName
LanguageModelName
, eVocabularyFilterName
). Tieni presente che l'identificazione multilingue (IdentifyMultipleLanguages
) non supporta modelli linguistici personalizzati.LanguageIdSettings
supporta da due a cinque codici linguistici. A ogni codice linguistico che includi può essere associato un modello linguistico personalizzato, un vocabolario personalizzato e un filtro di vocabolario personalizzato. I codici di lingua specificati devono corrispondere alle lingue dei modelli linguistici personalizzati associati, dei vocabolari personalizzati e dei filtri di vocabolario personalizzati.Si consiglia di includerlo
LanguageOptions
durante l'utilizzoLanguageIdSettings
per garantire che venga identificato il dialetto linguistico corretto. Ad esempio, se specifichi un vocabolario personalizzato in usoen-US
ma Amazon Transcribe determina che la lingua parlata nei tuoi file multimediali è la stessaen-AU
, il vocabolario personalizzato non viene applicato alla trascrizione. Se includiLanguageOptions
e includien-US
come unico dialetto in lingua inglese, il tuo vocabolario personalizzato viene applicato alla trascrizione.Se desideri includere un modello linguistico personalizzato nella tua richiesta ma non desideri utilizzare l'identificazione automatica della lingua, utilizza invece il
ModelSettings
parametro con ilLanguageModelName
sottoparametro. Se desideri includere un vocabolario personalizzato o un filtro di vocabolario personalizzato (o entrambi) nella tua richiesta ma non desideri utilizzare l'identificazione automatica della lingua, utilizza invece ilSettings
parametro con il sottoparametroVocabularyName
orVocabularyFilterName
(o entrambi).Tipo: mappatura da stringa aLanguageIdSettings oggetto
Voci di mappatura: numero massimo di 5 elementi.
Chiavi valide:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
Required: No
- LanguageOptions
-
È possibile specificare due o più codici di lingua che rappresentano le lingue che si ritiene possano essere presenti nei file multimediali. Non è consigliabile includerne più di cinque. Se non sei sicuro delle lingue presenti, non includere questo parametro.
Se includi
LanguageOptions
nella richiesta, devi includere ancheIdentifyLanguage
.Per ulteriori informazioni, consulta Lingue supportate.
Per trascrivere il parlato in arabo standard moderno (
ar-SA
), il file multimediale deve essere codificato con una frequenza di campionamento di 16.000 Hz o superiore.Tipo: matrice di stringhe
Membri dell’array: numero minimo di 1 elemento.
Valori validi:
af-ZA | ar-AE | ar-SA | da-DK | de-CH | de-DE | en-AB | en-AU | en-GB | en-IE | en-IN | en-US | en-WL | es-ES | es-US | fa-IR | fr-CA | fr-FR | he-IL | hi-IN | id-ID | it-IT | ja-JP | ko-KR | ms-MY | nl-NL | pt-BR | pt-PT | ru-RU | ta-IN | te-IN | tr-TR | zh-CN | zh-TW | th-TH | en-ZA | en-NZ | vi-VN | sv-SE
Required: No
- Media
-
Descrive la posizione Amazon S3 del file multimediale che desideri utilizzare nella richiesta.
Tipo: Media oggetto
Campo obbligatorio: sì
- MediaFormat
-
Specifica il formato del file multimediale di input.
Tipo: String
Valori validi:
mp3 | mp4 | wav | flac | ogg | amr | webm
Required: No
- MediaSampleRateHertz
-
La frequenza di campionamento, in hertz, della traccia audio nel file multimediale di ingresso.
Se non specifichi la frequenza di campionamento dei file multimediali, Amazon Transcribe la determina automaticamente. Se si specifica la frequenza di campionamento, questa deve corrispondere a quella rilevata da Amazon Transcribe. Se c'è una mancata corrispondenza tra il valore specificato e il valore rilevato, il processo ha esito negativo. Nella maggior parte dei casi, puoi omettere
MediaSampleRateHertz
e lasciare che Amazon Transcribe determini la frequenza di campionamento.Tipo: integer
Intervallo valido: valore minimo pari a 8000. Valore massimo pari a.
Required: No
- ModelSettings
-
Specifica il modello linguistico personalizzato che desideri includere nel tuo lavoro di trascrizione. Se includi
ModelSettings
nella tua richiesta, devi includere ilLanguageModelName
sottoparametro.Per ulteriori informazioni, consulta Modelli linguistici personalizzati.
Tipo: ModelSettings oggetto
Required: No
- OutputBucketName
-
Il nome del bucket Amazon S3 in cui desideri archiviare l'output di trascrizione. Non includere il
S3://
prefisso del bucket specificato.Se vuoi che il tuo output vada in una sottocartella di questo bucket, specificalo usando il
OutputKey
parametro; accettaOutputBucketName
solo il nome di un bucket.Ad esempio, se desideri che l'output venga archiviato in
S3://DOC-EXAMPLE-BUCKET
, impostaOutputBucketName
suDOC-EXAMPLE-BUCKET
. Tuttavia, se desideri che l'output venga archiviato inS3://DOC-EXAMPLE-BUCKET/test-files/
, impostaOutputBucketName
suDOC-EXAMPLE-BUCKET
eOutputKey
sutest-files/
.Tieni presente che Amazon Transcribe deve avere l'autorizzazione per utilizzare la posizione specificata. Puoi modificare le autorizzazioni di Amazon S3 utilizzando il AWS Management Console
. Vedi anche Autorizzazioni richieste per i ruoli utente IAM. Se non lo specifichi
OutputBucketName
, la trascrizione viene inserita in un bucket Amazon S3 gestito dal servizio e ti viene fornito un URI per accedere alla trascrizione.Tipo: String
Limitazioni di lunghezza: lunghezza massima di 64.
Modello:
[a-z0-9][\.\-a-z0-9]{1,61}[a-z0-9]
Required: No
- OutputEncryptionKMSKeyId
-
Chiave KMS che desideri utilizzare per crittografare l'output della trascrizione.
Se usi una chiave che si trova nella correnteAccount AWS, puoi specificare la tua chiave KMS in quattro modi:
-
Usa l'ID della chiave KMS stesso. Ad esempio,
1234abcd-12ab-34cd-56ef-1234567890ab
. -
Utilizza un alias per l'ID della chiave KMS. Ad esempio,
alias/ExampleAlias
. -
Utilizza l'Amazon Resource Name (ARN) per l'ID della chiave KMS. Ad esempio,
arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab
. -
Utilizza l'ARN per l'alias della chiave KMS. Ad esempio,
arn:aws:kms:region:account-ID:alias/ExampleAlias
.
Se usi una chiave che si trova in una posizione Account AWSdiversa da quella attualeAccount AWS, puoi specificare la tua chiave KMS in due modi:
-
Usa l'ARN per l'ID della chiave KMS. Ad esempio,
arn:aws:kms:region:account-ID:key/1234abcd-12ab-34cd-56ef-1234567890ab
. -
Utilizza l'ARN per l'alias della chiave KMS. Ad esempio,
arn:aws:kms:region:account-ID:alias/ExampleAlias
.
Se non specifichi una chiave di crittografia, l'output viene crittografato con la chiave Amazon S3 (SSE-S3) (SSE-S3) di default (SSE-S3).
Se si specifica una chiave KMS per crittografare l'output, è necessario specificare anche una posizione di output utilizzando il
OutputLocation
parametro.Si noti che il ruolo che effettua laStartCallAnalyticsJob richiesta deve avere l'autorizzazione per utilizzare la chiave KMS specificata.
Tipo: String
Limitazioni di lunghezza: lunghezza minima di 1. La lunghezza massima è 2048 caratteri.
Modello:
^[A-Za-z0-9][A-Za-z0-9:_/+=,@.-]{0,2048}$
Required: No
-
- OutputKey
-
Utilizzalo in combinazione con
OutputBucketName
per specificare la posizione di output della trascrizione e, facoltativamente, un nome univoco per il file di output. Il nome predefinito per l'output della trascrizione è lo stesso che hai specificato per il lavoro di trascrizione (TranscriptionJobName
).Di seguito sono elencati alcuni esempi di come utilizzare
OutputKey
:-
Se si specifica 'DOC-EXAMPLE-BUCKET' come
OutputBucketName
e 'my-transcript.json' comeOutputKey
, il percorso di output della trascrizione ès3://DOC-EXAMPLE-BUCKET/my-transcript.json
. -
Se specifichi 'my-first-transcription' come
TranscriptionJobName
, 'DOC-EXAMPLE-BUCKET' come e 'my-transcript' comeOutputKey
, il percorso di output della trascrizione ès3://DOC-EXAMPLE-BUCKET/my-transcript/my-first-transcription.json
.OutputBucketName
-
Se si specifica 'DOC-EXAMPLE-BUCKET' come
OutputBucketName
e 'test-files/my-transcript.json' comeOutputKey
, il percorso di output della trascrizione ès3://DOC-EXAMPLE-BUCKET/test-files/my-transcript.json
. -
Se specifichi 'my-first-transcription' come
TranscriptionJobName
, 'DOC-EXAMPLE-BUCKET' come e 'test-files/my-transcript' come percorso di output dellaOutputKey
trascrizione ès3://DOC-EXAMPLE-BUCKET/test-files/my-transcript/my-first-transcription.json
.OutputBucketName
Se specifichi il nome di una sottocartella del bucket Amazon S3 che non esiste, ne viene creata una automaticamente.
Tipo: String
Limitazioni di lunghezza: lunghezza minima di 1. La lunghezza massima è 1024 caratteri.
Modello:
[a-zA-Z0-9-_.!*'()/]{1,1024}$
Required: No
-
- Settings
-
Specifica impostazioni opzionali aggiuntive nellaStartTranscriptionJob richiesta, tra cui l'identificazione del canale, le trascrizioni alternative, il partizionamento dei diffusori. Puoi usarlo per applicare vocabolari personalizzati e filtri di vocabolario.
Se desideri includere un vocabolario personalizzato o un filtro di vocabolario personalizzato (o entrambi) nella tua richiesta ma non desideri utilizzare l'identificazione automatica della lingua, usalo
Settings
con il sottoparametroVocabularyName
orVocabularyFilterName
(o entrambi).Se utilizzi l'identificazione automatica della lingua nella tua richiesta e desideri includere un modello linguistico personalizzato, un vocabolario personalizzato o un filtro di vocabolario personalizzato, utilizza invece il
LanguageIdSettings
parametro conVocabularyFilterName
i sottoparametriVocabularyName
o.LanguageModelName
Tipo: Settings oggetto
Required: No
- Subtitles
-
Produce file di sottotitoli per i file multimediali di input. È possibile specificare i formati WebVTT (*.vtt) e SubRip (*.srt).
Tipo: Subtitles oggetto
Required: No
- Tags
-
Aggiunge uno o più tag personalizzati, ciascuno sotto forma di coppia chiave:valore, a un nuovo processo di trascrizione nel momento in cui inizi questo nuovo lavoro.
Per ulteriori informazioni sull'uso dei tag con Amazon Transcribe, consulta Risorse di tagging.
Tipo: matrice di oggetti Tag
Membri dell’array: numero minimo di 1 elemento. Numero massimo di elementi.
Required: No
- TranscriptionJobName
-
Un nome univoco, scelto da te, per il tuo lavoro di trascrizione. Il nome specificato viene utilizzato anche come nome predefinito del file di output della trascrizione. Se desideri specificare un nome diverso per l'output della trascrizione, usa il
OutputKey
parametro.Questo nome fa distinzione tra maiuscole e minuscole, non può contenere spazi e deve essere univoco all'interno di unAccount AWS. Se si tenta di creare un nuovo lavoro con lo stesso nome di un lavoro esistente, viene visualizzato un
ConflictException
errore.Tipo: String
Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.
Pattern:
^[0-9a-zA-Z._-]+
Campo obbligatorio: sì
Sintassi della risposta
{
"TranscriptionJob": {
"CompletionTime": number,
"ContentRedaction": {
"PiiEntityTypes": [ "string" ],
"RedactionOutput": "string",
"RedactionType": "string"
},
"CreationTime": number,
"FailureReason": "string",
"IdentifiedLanguageScore": number,
"IdentifyLanguage": boolean,
"IdentifyMultipleLanguages": boolean,
"JobExecutionSettings": {
"AllowDeferredExecution": boolean,
"DataAccessRoleArn": "string"
},
"LanguageCode": "string",
"LanguageCodes": [
{
"DurationInSeconds": number,
"LanguageCode": "string"
}
],
"LanguageIdSettings": {
"string" : {
"LanguageModelName": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
}
},
"LanguageOptions": [ "string" ],
"Media": {
"MediaFileUri": "string",
"RedactedMediaFileUri": "string"
},
"MediaFormat": "string",
"MediaSampleRateHertz": number,
"ModelSettings": {
"LanguageModelName": "string"
},
"Settings": {
"ChannelIdentification": boolean,
"MaxAlternatives": number,
"MaxSpeakerLabels": number,
"ShowAlternatives": boolean,
"ShowSpeakerLabels": boolean,
"VocabularyFilterMethod": "string",
"VocabularyFilterName": "string",
"VocabularyName": "string"
},
"StartTime": number,
"Subtitles": {
"Formats": [ "string" ],
"OutputStartIndex": number,
"SubtitleFileUris": [ "string" ]
},
"Tags": [
{
"Key": "string",
"Value": "string"
}
],
"Transcript": {
"RedactedTranscriptFileUri": "string",
"TranscriptFileUri": "string"
},
"TranscriptionJobName": "string",
"TranscriptionJobStatus": "string"
}
}
Elementi di risposta
Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.
I dati seguenti vengono restituiti in formato JSON mediante il servizio.
- TranscriptionJob
-
Fornisce informazioni dettagliate sul processo di trascrizione corrente, incluso lo stato del lavoro e, se applicabile, il motivo dell'errore.
Tipo: TranscriptionJob oggetto
Errori
Per informazioni sugli errori comuni a tutte le operazioni, consultare Errori comuni.
- BadRequestException
-
La tua richiesta non ha superato uno o più test di convalida. Ciò può verificarsi quando l'entità che stai cercando di eliminare non esiste o se si trova in uno stato non terminale (ad esempio
IN PROGRESS
). Per ulteriori informazioni, consulta il campo del messaggio di eccezione.Codice di stato HTTP: 400
- ConflictException
-
Esiste già una risorsa con questo nome. I nomi delle risorse devono essere univoci all'interno di unAccount AWS.
Codice di stato HTTP: 400
- InternalFailureException
-
Si è verificato un errore interno. Controlla il messaggio di errore, correggi il problema e riprova con la richiesta.
Codice di stato HTTP: 500
- LimitExceededException
-
Hai inviato troppe richieste o il file di input è troppo lungo. Attendi prima di riprovare la richiesta oppure utilizza un file più piccolo e riprova la richiesta.
Codice di stato HTTP: 400
Vedi anche
Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: