Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
StartMedicalStreamTranscription
Avvia un HTTP/2 o uno WebSocket stream bidirezionale in cui l'audio viene trasmesso in streaming ad Amazon Transcribe Medical e i risultati della trascrizione vengono trasmessi all'applicazione.
I parametri seguenti sono obbligatori:
-
language-code
-
media-encoding
-
sample-rate
Per ulteriori informazioni sullo streaming con Amazon Transcribe Medical, consulta Trascrizione dell'audio in streaming.
Sintassi della richiesta
POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
}
}
}
Parametri della richiesta URI:
La richiesta utilizza i seguenti parametri URI.
- ContentIdentificationType
-
Indica tutte le informazioni sanitarie personali (PHI) identificate nella trascrizione.
L'identificazione del contenuto viene eseguita a livello di segmento; PHI viene contrassegnato al momento della trascrizione completa di un segmento audio.
Per ulteriori informazioni, vedere Identificazione delle informazioni sanitarie personali (PHI) in una trascrizione.
Valori validi:
PHI
- EnableChannelIdentification
-
Consente l'identificazione dei canali nell'audio multicanale.
L'identificazione dei canali trascrive l'audio su ciascun canale in modo indipendente, quindi aggiunge l'uscita per ciascun canale in un'unica trascrizione.
Se disponi di audio multicanale e non abiliti l'identificazione dei canali, l'audio viene trascritto in modo continuo e la trascrizione non viene separata per canale.
Se includi
EnableChannelIdentification
nella tua richiesta, devi includere ancheNumberOfChannels
.Per ulteriori informazioni, consulta Trascrizione dell'audio multicanale.
- LanguageCode
-
Specifica il codice della lingua che rappresenta la lingua parlata nell'audio.
Importante
Amazon Transcribe Medical supporta solo l'inglese americano (
en-US
).Valori validi:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
Campo obbligatorio: sì
- MediaEncoding
-
Specifica la codifica utilizzata per l'audio in ingresso. I formati supportati sono:
-
FLAC
-
Audio codificato OPUS in un contenitore Ogg
-
PCM (solo formati audio little-endian firmati a 16 bit, che non includono WAV)
Per ulteriori informazioni, consulta Formati multimediali.
Valori validi:
pcm | ogg-opus | flac
Campo obbligatorio: sì
-
- MediaSampleRateHertz
-
Frequenza di campionamento dell'audio in ingresso (in hertz). Amazon Transcribe Medical supporta un intervallo da 16.000 Hz a 48.000 Hz. Nota che la frequenza di campionamento specificata deve corrispondere a quella dell'audio.
Intervallo valido: valore minimo pari a 8000. Valore massimo pari a 48000.
Campo obbligatorio: sì
- NumberOfChannels
-
Specifica il numero di canali nel tuo streaming audio. Questo valore deve essere
2
dato che sono supportati solo due canali. Se l'audio non contiene più canali, non includere questo parametro nella richiesta.Se includi
NumberOfChannels
nella tua richiesta, devi includere ancheEnableChannelIdentification
.Intervallo valido: valore minimo pari a 2.
- SessionId
-
Specifica un nome per la tua sessione di trascrizione. Se non includi questo parametro nella tua richiesta, Amazon Transcribe Medical genera un ID e lo restituisce nella risposta.
Limitazioni di lunghezza: lunghezza fissa di 36.
Pattern:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Abilita il partizionamento degli altoparlanti (diarizzazione) nell'output di trascrizione. Il partizionamento degli altoparlanti etichetta il discorso dei singoli altoparlanti nel file multimediale.
Per ulteriori informazioni, consulta Partitioning speaker (diarizzazione).
- Specialty
-
Specifica la specialità medica contenuta nell'audio.
Valori validi:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
Campo obbligatorio: sì
- Type
-
Specifica il tipo di audio in ingresso. Ad esempio, scegli
DICTATION
un fornitore che detta le note ai pazienti eCONVERSATION
per un dialogo tra un paziente e un medico.Valori validi:
CONVERSATION | DICTATION
Campo obbligatorio: sì
- VocabularyName
-
Specifica il nome del vocabolario personalizzato che desideri utilizzare durante l'elaborazione della trascrizione. Nota che i nomi dei vocabolari fanno distinzione tra maiuscole e minuscole.
Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.
Pattern:
^[0-9a-zA-Z._-]+
Corpo della richiesta
La richiesta accetta i seguenti dati in formato JSON.
- AudioStream
-
Un flusso codificato di blob audio. I flussi audio sono codificati come HTTP/2 o frame di WebSocket dati.
Per ulteriori informazioni, consulta Trascrizione dell'audio in streaming.
Tipo: AudioStream oggetto
Campo obbligatorio: sì
Sintassi della risposta
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"TranscriptResultStream": {
"BadRequestException": {
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"TranscriptEvent": {
"Transcript": {
"Results": [
{
"Alternatives": [
{
"Entities": [
{
"Category": "string",
"Confidence": number,
"Content": "string",
"EndTime": number,
"StartTime": number
}
],
"Items": [
{
"Confidence": number,
"Content": "string",
"EndTime": number,
"Speaker": "string",
"StartTime": number,
"Type": "string"
}
],
"Transcript": "string"
}
],
"ChannelId": "string",
"EndTime": number,
"IsPartial": boolean,
"ResultId": "string",
"StartTime": number
}
]
}
}
}
}
Elementi di risposta
Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.
La risposta restituisce le seguenti intestazioni HTTP.
- ContentIdentificationType
-
Mostra se l'identificazione dei contenuti è stata abilitata per la trascrizione.
Valori validi:
PHI
- EnableChannelIdentification
-
Mostra se l'identificazione del canale è stata abilitata per la trascrizione.
- LanguageCode
-
Fornisce il codice della lingua specificato nella richiesta. Deve essere
en-US
.Valori validi:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- MediaEncoding
-
Fornisce la codifica multimediale specificata nella richiesta.
Valori validi:
pcm | ogg-opus | flac
- MediaSampleRateHertz
-
Fornisce la frequenza di campionamento specificata nella richiesta.
Intervallo valido: valore minimo pari a 8000. Valore massimo pari a 48000.
- NumberOfChannels
-
Fornisce il numero di canali che hai specificato nella tua richiesta.
Intervallo valido: valore minimo pari a 2.
- RequestId
-
Fornisce l'identificatore per la tua richiesta di streaming.
- SessionId
-
Fornisce l'identificatore per la sessione di trascrizione.
Limitazioni di lunghezza: lunghezza fissa di 36.
Pattern:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Indica se il partizionamento degli altoparlanti è stato abilitato per la trascrizione.
- Specialty
-
Fornisce la specialità medica specificata nella richiesta.
Valori validi:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
- Type
-
Fornisce il tipo di audio specificato nella richiesta.
Valori validi:
CONVERSATION | DICTATION
- VocabularyName
-
Fornisce il nome del vocabolario personalizzato specificato nella richiesta.
Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.
Pattern:
^[0-9a-zA-Z._-]+
I dati seguenti vengono restituiti in formato JSON mediante il servizio.
- TranscriptResultStream
-
Fornisce informazioni dettagliate sulla tua sessione di streaming.
Tipo: MedicalTranscriptResultStream oggetto
Errori
Per informazioni sugli errori comuni a tutte le operazioni, consultare Errori comuni.
- BadRequestException
-
Uno o più argomenti dell'
StartCallAnalyticsStreamTranscription
operazioneStartStreamTranscription
StartMedicalStreamTranscription
, or non erano validi. Ad esempio,MediaEncoding
o haLanguageCode
utilizzato valori non supportati. Controlla i parametri specificati e riprova la richiesta.Codice di stato HTTP: 400
- ConflictException
-
È iniziato un nuovo stream con lo stesso ID di sessione. Lo stream corrente è stato interrotto.
Codice di stato HTTP: 409
- InternalFailureException
-
Si è verificato un problema durante l'elaborazione dell'audio. Amazon Transcribe ha terminato l'elaborazione.
Codice di stato HTTP: 500
- LimitExceededException
-
Il tuo cliente ha superato uno dei limiti di Amazon Transcribe. Questo è in genere il limite di lunghezza dell'audio. Suddividi il flusso audio in blocchi più piccoli e riprova la richiesta.
Codice di stato HTTP: 429
- ServiceUnavailableException
-
Il servizio al momento non è disponibile. Prova la tua richiesta più tardi.
Codice di stato HTTP: 503
Vedi anche
Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: