StartMedicalStreamTranscription - Transcribe

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

StartMedicalStreamTranscription

Avvia un HTTP/2 o uno WebSocket stream bidirezionale in cui l'audio viene trasmesso in streaming ad Amazon Transcribe Medical e i risultati della trascrizione vengono trasmessi all'applicazione.

I parametri seguenti sono obbligatori:

  • language-code

  • media-encoding

  • sample-rate

Per ulteriori informazioni sullo streaming con Amazon Transcribe Medical, consulta Trascrizione dell'audio in streaming.

Sintassi della richiesta

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

Parametri della richiesta URI:

La richiesta utilizza i seguenti parametri URI.

ContentIdentificationType

Indica tutte le informazioni sanitarie personali (PHI) identificate nella trascrizione.

L'identificazione del contenuto viene eseguita a livello di segmento; PHI viene contrassegnato al momento della trascrizione completa di un segmento audio.

Per ulteriori informazioni, vedere Identificazione delle informazioni sanitarie personali (PHI) in una trascrizione.

Valori validi: PHI

EnableChannelIdentification

Consente l'identificazione dei canali nell'audio multicanale.

L'identificazione dei canali trascrive l'audio su ciascun canale in modo indipendente, quindi aggiunge l'uscita per ciascun canale in un'unica trascrizione.

Se disponi di audio multicanale e non abiliti l'identificazione dei canali, l'audio viene trascritto in modo continuo e la trascrizione non viene separata per canale.

Se includiEnableChannelIdentification nella tua richiesta, devi includere ancheNumberOfChannels.

Per ulteriori informazioni, consulta Trascrizione dell'audio multicanale.

LanguageCode

Specifica il codice della lingua che rappresenta la lingua parlata nell'audio.

Importante

Amazon Transcribe Medical supporta solo l'inglese americano (en-US).

Valori validi: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

Campo obbligatorio: sì

MediaEncoding

Specifica la codifica utilizzata per l'audio in ingresso. I formati supportati sono:

  • FLAC

  • Audio codificato OPUS in un contenitore Ogg

  • PCM (solo formati audio little-endian firmati a 16 bit, che non includono WAV)

Per ulteriori informazioni, consulta Formati multimediali.

Valori validi: pcm | ogg-opus | flac

Campo obbligatorio: sì

MediaSampleRateHertz

Frequenza di campionamento dell'audio in ingresso (in hertz). Amazon Transcribe Medical supporta un intervallo da 16.000 Hz a 48.000 Hz. Nota che la frequenza di campionamento specificata deve corrispondere a quella dell'audio.

Intervallo valido: valore minimo pari a 8000. Valore massimo pari a 48000.

Campo obbligatorio: sì

NumberOfChannels

Specifica il numero di canali nel tuo streaming audio. Questo valore deve essere2 dato che sono supportati solo due canali. Se l'audio non contiene più canali, non includere questo parametro nella richiesta.

Se includiNumberOfChannels nella tua richiesta, devi includere ancheEnableChannelIdentification.

Intervallo valido: valore minimo pari a 2.

SessionId

Specifica un nome per la tua sessione di trascrizione. Se non includi questo parametro nella tua richiesta, Amazon Transcribe Medical genera un ID e lo restituisce nella risposta.

Limitazioni di lunghezza: lunghezza fissa di 36.

Pattern: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Abilita il partizionamento degli altoparlanti (diarizzazione) nell'output di trascrizione. Il partizionamento degli altoparlanti etichetta il discorso dei singoli altoparlanti nel file multimediale.

Per ulteriori informazioni, consulta Partitioning speaker (diarizzazione).

Specialty

Specifica la specialità medica contenuta nell'audio.

Valori validi: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Campo obbligatorio: sì

Type

Specifica il tipo di audio in ingresso. Ad esempio, scegliDICTATION un fornitore che detta le note ai pazienti eCONVERSATION per un dialogo tra un paziente e un medico.

Valori validi: CONVERSATION | DICTATION

Campo obbligatorio: sì

VocabularyName

Specifica il nome del vocabolario personalizzato che desideri utilizzare durante l'elaborazione della trascrizione. Nota che i nomi dei vocabolari fanno distinzione tra maiuscole e minuscole.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

Corpo della richiesta

La richiesta accetta i seguenti dati in formato JSON.

AudioStream

Un flusso codificato di blob audio. I flussi audio sono codificati come HTTP/2 o frame di WebSocket dati.

Per ulteriori informazioni, consulta Trascrizione dell'audio in streaming.

Tipo: AudioStream oggetto

Campo obbligatorio: sì

Sintassi della risposta

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

La risposta restituisce le seguenti intestazioni HTTP.

ContentIdentificationType

Mostra se l'identificazione dei contenuti è stata abilitata per la trascrizione.

Valori validi: PHI

EnableChannelIdentification

Mostra se l'identificazione del canale è stata abilitata per la trascrizione.

LanguageCode

Fornisce il codice della lingua specificato nella richiesta. Deve essere en-US.

Valori validi: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

MediaEncoding

Fornisce la codifica multimediale specificata nella richiesta.

Valori validi: pcm | ogg-opus | flac

MediaSampleRateHertz

Fornisce la frequenza di campionamento specificata nella richiesta.

Intervallo valido: valore minimo pari a 8000. Valore massimo pari a 48000.

NumberOfChannels

Fornisce il numero di canali che hai specificato nella tua richiesta.

Intervallo valido: valore minimo pari a 2.

RequestId

Fornisce l'identificatore per la tua richiesta di streaming.

SessionId

Fornisce l'identificatore per la sessione di trascrizione.

Limitazioni di lunghezza: lunghezza fissa di 36.

Pattern: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Indica se il partizionamento degli altoparlanti è stato abilitato per la trascrizione.

Specialty

Fornisce la specialità medica specificata nella richiesta.

Valori validi: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

Fornisce il tipo di audio specificato nella richiesta.

Valori validi: CONVERSATION | DICTATION

VocabularyName

Fornisce il nome del vocabolario personalizzato specificato nella richiesta.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

TranscriptResultStream

Fornisce informazioni dettagliate sulla tua sessione di streaming.

Tipo: MedicalTranscriptResultStream oggetto

Errori

Per informazioni sugli errori comuni a tutte le operazioni, consultare Errori comuni.

BadRequestException

Uno o più argomenti dell'StartCallAnalyticsStreamTranscriptionoperazioneStartStreamTranscriptionStartMedicalStreamTranscription, or non erano validi. Ad esempio,MediaEncoding o haLanguageCode utilizzato valori non supportati. Controlla i parametri specificati e riprova la richiesta.

Codice di stato HTTP: 400

ConflictException

È iniziato un nuovo stream con lo stesso ID di sessione. Lo stream corrente è stato interrotto.

Codice di stato HTTP: 409

InternalFailureException

Si è verificato un problema durante l'elaborazione dell'audio. Amazon Transcribe ha terminato l'elaborazione.

Codice di stato HTTP: 500

LimitExceededException

Il tuo cliente ha superato uno dei limiti di Amazon Transcribe. Questo è in genere il limite di lunghezza dell'audio. Suddividi il flusso audio in blocchi più piccoli e riprova la richiesta.

Codice di stato HTTP: 429

ServiceUnavailableException

Il servizio al momento non è disponibile. Prova la tua richiesta più tardi.

Codice di stato HTTP: 503

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: