StartMedicalStreamTranscription - Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

StartMedicalStreamTranscription

Inicia una WebSocket transmisión o transmisión de HTTP/2 bidireccional donde el audio se transmite a Amazon Transcribe Medical y los resultados de la transcripción se transmiten a la aplicación.

Se requieren los siguientes parámetros:

  • language-code

  • media-encoding

  • sample-rate

Para obtener más información sobre la transmisión con Amazon Transcribe Medical, consulte Transcribir audio en streaming.

Sintaxis de la solicitud

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

Parámetros de solicitud del URI

La solicitud utiliza los siguientes parámetros URI.

ContentIdentificationType

Etiqueta toda la información sanitaria personal (PHI) identificada en la transcripción.

La identificación del contenido se realiza a nivel de segmento; la PHI se marca cuando se completa la transcripción de un segmento de audio.

Para obtener más información, consulte Cómo identificar la información de salud personal (PHI) en una transcripción.

Valores válidos: PHI

EnableChannelIdentification

Permite la identificación de canales en audio multicanal.

La identificación de canales transcribe el audio de cada canal de forma independiente y, a continuación, añade la salida de cada canal a una transcripción.

Si tiene audio multicanal y no habilita la identificación de canales, el audio se transcribe de forma continua y la transcripción no está separada por canal.

Si incluyeEnableChannelIdentification en la solicitud, también debe incluirNumberOfChannels.

Para obtener más información, consulte Transcribir audio multicanal.

LanguageCode

Especifique el código de idioma que representa el idioma que se habla en el audio.

importante

Amazon Transcribe Medical solo admite el inglés de EE. UU. (en-US).

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

Obligatorio: sí

MediaEncoding

Especifique la codificación utilizada para el audio de entrada. Los formatos admitidos son:

  • FLAC

  • Audio codificado en OPUS en un contenedor Ogg

  • PCM (solo formatos de audio little-endian firmados de 16 bits, que no incluyen WAV)

Para obtener más información, consulte la Formatos de medios de.

Valores válidos: pcm | ogg-opus | flac

Obligatorio: sí

MediaSampleRateHertz

La frecuencia de muestreo del audio de entrada (en hercios). Amazon Transcribe Medical admite un rango de 16 000 Hz a 48 000 Hz. Tenga en cuenta que la frecuencia de muestreo que especifique debe coincidir con la del audio.

Rango válido: valor mínimo de 8000. Valor máximo de 48000.

Obligatorio: sí

NumberOfChannels

Especifica el número de canales de la transmisión de audio. Este valor debe serlo2, ya que solo se admiten dos canales. Si el audio no contiene varios canales, no incluyas este parámetro en la solicitud.

Si incluyeNumberOfChannels en la solicitud, también debe incluirEnableChannelIdentification.

Rango válido: valor mínimo de 2.

SessionId

Especifique un nombre para la sesión de transcripción. Si no incluye este parámetro en la solicitud, Amazon Transcribe Medical generará un identificador y lo devolverá en la respuesta.

Limitaciones de longitud: longitud fija de 36.

Patrón: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Permite la partición de los altavoces (diarización) en la salida de transcripción. La partición de altavoces etiqueta la voz de los altavoces individuales del archivo multimedia.

Para obtener más información, consulte Partitioning de altavoces (diarización).

Specialty

Especifique la especialidad médica que contiene el audio.

Valores válidos: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Obligatorio: sí

Type

Especifique el tipo de audio de entrada. Por ejemplo, elijaDICTATION un proveedor que dicte las notas del paciente yCONVERSATION un diálogo entre un paciente y un profesional médico.

Valores válidos: CONVERSATION | DICTATION

Obligatorio: sí

VocabularyName

Especifique el nombre del vocabulario personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de vocabulario distinguen entre mayúsculas y minúsculas.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

Cuerpo de la solicitud

La solicitud acepta los siguientes datos en formato JSON.

AudioStream

Un flujo codificado de manchas de audio. Las transmisiones de audio se codifican como HTTP/2 o marcos WebSocket de datos.

Para obtener más información, consulte Transcribir audio en streaming.

Tipo: objeto AudioStream

Obligatorio: sí

Sintaxis de la respuesta

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

La respuesta devuelve los siguientes encabezados HTTP.

ContentIdentificationType

Muestra si la identificación de contenido estaba habilitada para la transcripción.

Valores válidos: PHI

EnableChannelIdentification

Muestra si la identificación de canales estaba habilitada para la transcripción.

LanguageCode

Proporciona el código de idioma que especificó en la solicitud. Debe ser en-US.

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

MediaEncoding

Proporciona la codificación multimedia que especificó en la solicitud.

Valores válidos: pcm | ogg-opus | flac

MediaSampleRateHertz

Proporciona la frecuencia de muestreo que especificó en la solicitud.

Rango válido: valor mínimo de 8000. Valor máximo de 48000.

NumberOfChannels

Proporciona el número de canales que especificó en la solicitud.

Rango válido: valor mínimo de 2.

RequestId

Proporciona el identificador de tu solicitud de streaming.

SessionId

Proporciona el identificador de la sesión de transcripción.

Limitaciones de longitud: longitud fija de 36.

Patrón: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Muestra si la partición de altavoces estaba habilitada para la transcripción.

Specialty

Proporciona la especialidad médica que especificó en su solicitud.

Valores válidos: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

Proporciona el tipo de audio que especificó en la solicitud.

Valores válidos: CONVERSATION | DICTATION

VocabularyName

Proporciona el nombre del vocabulario personalizado que especificó en la solicitud.

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.

Patrón: ^[0-9a-zA-Z._-]+

El servicio devuelve los datos siguientes en formato JSON.

TranscriptResultStream

Proporciona información detallada sobre la sesión de streaming.

Tipo: objeto MedicalTranscriptResultStream

Errores

Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.

BadRequestException

Uno o más argumentos de laStartCallAnalyticsStreamTranscription operaciónStartStreamTranscriptionStartMedicalStreamTranscription, o no eran válidos. Por ejemplo,MediaEncoding oLanguageCode usó valores no admitidos. Compruebe los parámetros especificados y vuelva a intentar realizar la solicitud.

Código de estado HTTP: 400

ConflictException

Se inició una nueva transmisión con el mismo ID de sesión. La transmisión actual ha finalizado.

Código de estado HTTP: 409

InternalFailureException

Se produjo un problema al procesar el audio. Amazon Transcribe ha finalizado el procesamiento.

Código de estado HTTP: 500

LimitExceededException

Su cliente ha superado uno de los límites de Amazon Transcribe. Este suele ser el límite de longitud del audio. Divida la transmisión de audio en fragmentos más pequeños y vuelva a intentar realizar la solicitud.

Código de estado HTTP: 429

ServiceUnavailableException

El servicio no está disponible en este momento. Prueba tu solicitud más tarde.

Código de estado HTTP: 503

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: