Crear un archivo de texto para su vocabulario médico personalizado - Amazon Transcribe

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crear un archivo de texto para su vocabulario médico personalizado

Para crear un vocabulario personalizado, debe crear un archivo de texto en formato UTF-8. En este archivo, se crea una tabla de cuatro columnas, en la que cada columna especifica un campo. Cada campo indica a Amazon Transcribe Medical cómo se pronuncian los términos específicos del dominio o cómo debe mostrarlos en las transcripciones. El archivo de texto que contiene estos campos se guarda en un bucket de Amazon S3 .

Entender cómo dar formato a un archivo de texto

Para crear un vocabulario médico personalizado, escriba los nombres de las columnas como una fila de encabezado. Ingrese los valores de cada columna debajo de la fila de encabezado.

Los nombres de las cuatro columnas de la tabla son los siguientes:

  • Phrase: columna obligatoria, valores obligatorios

  • IPA: columna obligatoria, los valores pueden ser opcionales

  • SoundsLike: columna obligatoria, los valores pueden ser opcionales

  • DisplayAs: columna obligatoria, los valores pueden ser opcionales

Al crear un vocabulario personalizado, asegúrese de:

  • Separe cada columna con un único carácter de tabulación. Amazon Transcribe muestra un mensaje de error si intenta separar las columnas con espacios o varios caracteres de tabulación.

  • Asegúrese de que no haya espacios finales ni espacios en blanco después de cada valor de una columna.

Asegúrese de que los valores que ingresa para cada columna:

Ingresar valores para las columnas de la tabla

La siguiente información muestra cómo especificar valores para las cuatro columnas de la tabla:

  • Phrase: palabra o frase que deben reconocerse. Debe escribir valores en esta columna.

    Si la entrada es una frase, separe las palabras con guiones (-). Por ejemplo, escriba cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy como cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy.

    Escriba acrónimos u otras palabras cuyas letras deben pronunciarse individualmente como letras simples seguidas de puntos, como D.N.A. o S.T.E.M.I.. Para introducir la forma plural de un acrónimo, como «»STEMIs, separe la «s» del acrónimo con un guión: "S.T.E.M.I-s" Puede utilizar letras mayúsculas o minúsculas para los acrónimos.

    La columna Phrase es obligatoria. Puede utilizar cualquiera de los caracteres permitidos en el idioma de entrada. Para conocer los caracteres permitidos, consulte Juego de caracteres para medicina Amazon Transcribe. Si no especifica la DisplayAs columna, Amazon Transcribe Medical utilizará el contenido de la columna en el archivo de salida. Phrase

  • IPA (columna obligatoria, los valores pueden ser opcionales): para especificar la pronunciación de una palabra o frase, puede incluir caracteres del Alfabeto Fonético Internacional (IPA) en esta columna. La columna IPA no puede contener espacios iniciales o finales y sólo debe utilizarse un espacio para separar cada fonema de la entrada. Por ejemplo, en inglés escribiría la frase acute-respiratory-distress-syndrome como ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m. Escribiría la frase A.L.L. como eɪ ɛ l ɛ l.

    Incluso si no especifica el contenido de la columna IPA, debe incluir una columna IPA en blanco. Si incluye valores en la columna IPA, no puede proporcionar valores para la columna SoundsLike.

    Para obtener una lista de caracteres IPA permitidos para un idioma específico, consulte Juego de caracteres para medicina Amazon Transcribe. El inglés estadounidense es el único idioma disponible en Amazon Transcribe Medicina.

  • SoundsLike (la columna es obligatoria, los valores pueden ser opcionales): puede dividir una palabra o frase en segmentos más pequeños y proporcionar una pronunciación para cada segmento utilizando la ortografía estándar del idioma para imitar la forma en que suena la palabra. Por ejemplo, puede proporcionar sugerencias de pronunciación para la frase cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy de este modo: sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy. La sugerencia para la frase atrioventricular-nodal-reentrant-tachycardia sería: ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia. Separe cada parte de la sugerencia con un guion (-).

    Incluso si no proporciona valores para la columna SoundsLike, debe incluir una columna SoundsLike en blanco. Si incluye valores en la columna SoundsLike, no puede proporcionar valores para la columna IPA.

    Puede utilizar cualquiera de los caracteres permitidos en el idioma de entrada. Para obtener una lista de los caracteres permitidos, consulte Juego de caracteres para medicina Amazon Transcribe.

  • DisplayAs (columna obligatoria, los valores pueden ser opcionales): define el aspecto de la palabra o frase cuando se imprime. Por ejemplo, si la palabra o frase es cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy, puede indicar que debe mostrarse como cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy para que el guion no aparezca. También puede especificar DisplayAs como CADASIL si desea mostrar el acrónimo en lugar del término completo en la salida.

    Si no especifica la DisplayAs columna, Amazon Transcribe Medical utilizará la Phrase columna del archivo de entrada en la salida.

    Puede utilizar cualquier carácter UTF-8 en la columna DisplayAs.

Incluya espacios sólo para los valores de las columnas IPA y DisplayAs.

Para crear el archivo de texto de su vocabulario personalizado, coloque cada palabra o frase del archivo de texto en una línea separada. Separe las columnas con caracteres de tabulación. Incluya espacios solo para los valores de las columnas IPA y DisplayAs. Guarda el archivo con la extensión .txt en un compartimento Amazon S3 en el mismo Región de AWS lugar en el que usaste Amazon Transcribe Medical para crear tu vocabulario personalizado.

Si edita el archivo de texto en Windows, asegúrese de que el archivo está en formato LF y no en formato CRLF. De lo contrario, no podrá crear su vocabulario personalizado. Algunos editores de texto le permiten cambiar el formato con los comandos Find (Buscar) y Replace (Reemplazar).

En los ejemplos siguientes se muestra texto que puede utilizar para crear vocabularios personalizados. Para crear un vocabulario personalizado a partir de estos ejemplos, copie un ejemplo en un editor de texto, reemplace [TAB] por un carácter de tabulación y cargue el archivo de texto guardado en Amazon S3.

Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]

Puede especificar las columnas en cualquier orden. Los siguientes ejemplos muestran otras estructuras válidas para el archivo de entrada de vocabulario personalizado.

Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L. [TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia

Para facilitar la lectura, las siguientes tablas muestran los ejemplos anteriores con mayor claridad en formato html. Están destinadas únicamente a ilustrar los ejemplos.

Phrase IPA SoundsLike DisplayAs
acute-respiratory-distress-syndrome acute respiratory distress syndrome
A.L.L. eɪ ɛ l ɛ l ALL
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
Phrase SoundsLike IPA DisplayAs
acute-respiratory-distress-syndrome acute respiratory distress syndrome
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
A.L.L. eɪ ɛ l ɛ l ALL
DisplayAs SoundsLike IPA Phrase
acute respiratory distress syndrome acute-respiratory-distress-syndrome
ALL eɪ ɛ l ɛ l A.L.L.
ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia atrioventricular-nodal-reentrant-tachycardia