Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
StartMedicalStreamTranscription
Inicia una WebSocket transmisión o transmisión de HTTP/2 bidireccional donde el audio se transmite a Amazon Transcribe Medical y los resultados de la transcripción se transmiten a la aplicación.
Se requieren los siguientes parámetros:
-
language-code
-
media-encoding
-
sample-rate
Para obtener más información sobre la transmisión con Amazon Transcribe Medical, consulte Transcribir audio en streaming.
Sintaxis de la solicitud
POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
}
}
}
Parámetros de solicitud del URI
La solicitud utiliza los siguientes parámetros URI.
- ContentIdentificationType
-
Etiqueta toda la información sanitaria personal (PHI) identificada en la transcripción.
La identificación del contenido se realiza a nivel de segmento; la PHI se marca cuando se completa la transcripción de un segmento de audio.
Para obtener más información, consulte Cómo identificar la información de salud personal (PHI) en una transcripción.
Valores válidos:
PHI
- EnableChannelIdentification
-
Permite la identificación de canales en audio multicanal.
La identificación de canales transcribe el audio de cada canal de forma independiente y, a continuación, añade la salida de cada canal a una transcripción.
Si tiene audio multicanal y no habilita la identificación de canales, el audio se transcribe de forma continua y la transcripción no está separada por canal.
Si incluye
EnableChannelIdentification
en la solicitud, también debe incluirNumberOfChannels
.Para obtener más información, consulte Transcribir audio multicanal.
- LanguageCode
-
Especifique el código de idioma que representa el idioma que se habla en el audio.
importante
Amazon Transcribe Medical solo admite el inglés de EE. UU. (
en-US
).Valores válidos:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
Obligatorio: sí
- MediaEncoding
-
Especifique la codificación utilizada para el audio de entrada. Los formatos admitidos son:
-
FLAC
-
Audio codificado en OPUS en un contenedor Ogg
-
PCM (solo formatos de audio little-endian firmados de 16 bits, que no incluyen WAV)
Para obtener más información, consulte la Formatos de medios de.
Valores válidos:
pcm | ogg-opus | flac
Obligatorio: sí
-
- MediaSampleRateHertz
-
La frecuencia de muestreo del audio de entrada (en hercios). Amazon Transcribe Medical admite un rango de 16 000 Hz a 48 000 Hz. Tenga en cuenta que la frecuencia de muestreo que especifique debe coincidir con la del audio.
Rango válido: valor mínimo de 8000. Valor máximo de 48000.
Obligatorio: sí
- NumberOfChannels
-
Especifica el número de canales de la transmisión de audio. Este valor debe serlo
2
, ya que solo se admiten dos canales. Si el audio no contiene varios canales, no incluyas este parámetro en la solicitud.Si incluye
NumberOfChannels
en la solicitud, también debe incluirEnableChannelIdentification
.Rango válido: valor mínimo de 2.
- SessionId
-
Especifique un nombre para la sesión de transcripción. Si no incluye este parámetro en la solicitud, Amazon Transcribe Medical generará un identificador y lo devolverá en la respuesta.
Limitaciones de longitud: longitud fija de 36.
Patrón:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Permite la partición de los altavoces (diarización) en la salida de transcripción. La partición de altavoces etiqueta la voz de los altavoces individuales del archivo multimedia.
Para obtener más información, consulte Partitioning de altavoces (diarización).
- Specialty
-
Especifique la especialidad médica que contiene el audio.
Valores válidos:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
Obligatorio: sí
- Type
-
Especifique el tipo de audio de entrada. Por ejemplo, elija
DICTATION
un proveedor que dicte las notas del paciente yCONVERSATION
un diálogo entre un paciente y un profesional médico.Valores válidos:
CONVERSATION | DICTATION
Obligatorio: sí
- VocabularyName
-
Especifique el nombre del vocabulario personalizado que desea utilizar al procesar la transcripción. Tenga en cuenta que los nombres de vocabulario distinguen entre mayúsculas y minúsculas.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
Cuerpo de la solicitud
La solicitud acepta los siguientes datos en formato JSON.
- AudioStream
-
Un flujo codificado de manchas de audio. Las transmisiones de audio se codifican como HTTP/2 o marcos WebSocket de datos.
Para obtener más información, consulte Transcribir audio en streaming.
Tipo: objeto AudioStream
Obligatorio: sí
Sintaxis de la respuesta
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"TranscriptResultStream": {
"BadRequestException": {
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"TranscriptEvent": {
"Transcript": {
"Results": [
{
"Alternatives": [
{
"Entities": [
{
"Category": "string",
"Confidence": number,
"Content": "string",
"EndTime": number,
"StartTime": number
}
],
"Items": [
{
"Confidence": number,
"Content": "string",
"EndTime": number,
"Speaker": "string",
"StartTime": number,
"Type": "string"
}
],
"Transcript": "string"
}
],
"ChannelId": "string",
"EndTime": number,
"IsPartial": boolean,
"ResultId": "string",
"StartTime": number
}
]
}
}
}
}
Elementos de respuesta
Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.
La respuesta devuelve los siguientes encabezados HTTP.
- ContentIdentificationType
-
Muestra si la identificación de contenido estaba habilitada para la transcripción.
Valores válidos:
PHI
- EnableChannelIdentification
-
Muestra si la identificación de canales estaba habilitada para la transcripción.
- LanguageCode
-
Proporciona el código de idioma que especificó en la solicitud. Debe ser
en-US
.Valores válidos:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- MediaEncoding
-
Proporciona la codificación multimedia que especificó en la solicitud.
Valores válidos:
pcm | ogg-opus | flac
- MediaSampleRateHertz
-
Proporciona la frecuencia de muestreo que especificó en la solicitud.
Rango válido: valor mínimo de 8000. Valor máximo de 48000.
- NumberOfChannels
-
Proporciona el número de canales que especificó en la solicitud.
Rango válido: valor mínimo de 2.
- RequestId
-
Proporciona el identificador de tu solicitud de streaming.
- SessionId
-
Proporciona el identificador de la sesión de transcripción.
Limitaciones de longitud: longitud fija de 36.
Patrón:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
Muestra si la partición de altavoces estaba habilitada para la transcripción.
- Specialty
-
Proporciona la especialidad médica que especificó en su solicitud.
Valores válidos:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
- Type
-
Proporciona el tipo de audio que especificó en la solicitud.
Valores válidos:
CONVERSATION | DICTATION
- VocabularyName
-
Proporciona el nombre del vocabulario personalizado que especificó en la solicitud.
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 200 caracteres.
Patrón:
^[0-9a-zA-Z._-]+
El servicio devuelve los datos siguientes en formato JSON.
- TranscriptResultStream
-
Proporciona información detallada sobre la sesión de streaming.
Tipo: objeto MedicalTranscriptResultStream
Errores
Para obtener información sobre los errores comunes a todas las acciones, consulteErrores comunes.
- BadRequestException
-
Uno o más argumentos de la
StartCallAnalyticsStreamTranscription
operaciónStartStreamTranscription
StartMedicalStreamTranscription
, o no eran válidos. Por ejemplo,MediaEncoding
oLanguageCode
usó valores no admitidos. Compruebe los parámetros especificados y vuelva a intentar realizar la solicitud.Código de estado HTTP: 400
- ConflictException
-
Se inició una nueva transmisión con el mismo ID de sesión. La transmisión actual ha finalizado.
Código de estado HTTP: 409
- InternalFailureException
-
Se produjo un problema al procesar el audio. Amazon Transcribe ha finalizado el procesamiento.
Código de estado HTTP: 500
- LimitExceededException
-
Su cliente ha superado uno de los límites de Amazon Transcribe. Este suele ser el límite de longitud del audio. Divida la transmisión de audio en fragmentos más pequeños y vuelva a intentar realizar la solicitud.
Código de estado HTTP: 429
- ServiceUnavailableException
-
El servicio no está disponible en este momento. Prueba tu solicitud más tarde.
Código de estado HTTP: 503
Véase también
Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: