Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Crear un archivo de texto para su vocabulario médico personalizado
Para crear un vocabulario personalizado, debe crear un archivo de texto en formato UTF-8. En este archivo, se crea una tabla de cuatro columnas, en la que cada columna especifica un campo. Cada campo indica a Amazon Transcribe Medical cómo se pronuncian los términos específicos del dominio o cómo debe mostrarlos en las transcripciones. El archivo de texto que contiene estos campos se guarda en un bucket de Amazon S3 .
Entender cómo dar formato a un archivo de texto
Para crear un vocabulario médico personalizado, escriba los nombres de las columnas como una fila de encabezado. Ingrese los valores de cada columna debajo de la fila de encabezado.
Los nombres de las cuatro columnas de la tabla son los siguientes:
-
Phrase
: columna obligatoria, valores obligatorios -
IPA
: columna obligatoria, los valores pueden ser opcionales -
SoundsLike
: columna obligatoria, los valores pueden ser opcionales -
DisplayAs
: columna obligatoria, los valores pueden ser opcionales
Al crear un vocabulario personalizado, asegúrese de:
-
Separe cada columna con un único carácter de tabulación. Amazon Transcribe muestra un mensaje de error si intenta separar las columnas con espacios o varios caracteres de tabulación.
-
Asegúrese de que no haya espacios finales ni espacios en blanco después de cada valor de una columna.
Asegúrese de que los valores que ingresa para cada columna:
-
Tengan menos de 256 caracteres, guiones incluidos
-
Utilice sólo caracteres del conjunto de caracteres permitido; consulte Juego de caracteres para medicina Amazon Transcribe.
Ingresar valores para las columnas de la tabla
La siguiente información muestra cómo especificar valores para las cuatro columnas de la tabla:
-
Phrase
: palabra o frase que deben reconocerse. Debe escribir valores en esta columna.Si la entrada es una frase, separe las palabras con guiones (-). Por ejemplo, escriba
cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy
comocerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy
.Escriba acrónimos u otras palabras cuyas letras deben pronunciarse individualmente como letras simples seguidas de puntos, como
D.N.A.
oS.T.E.M.I.
. Para introducir la forma plural de un acrónimo, como «»STEMIs, separe la «s» del acrónimo con un guión: "S.T.E.M.I-s
" Puede utilizar letras mayúsculas o minúsculas para los acrónimos.La columna
Phrase
es obligatoria. Puede utilizar cualquiera de los caracteres permitidos en el idioma de entrada. Para conocer los caracteres permitidos, consulte Juego de caracteres para medicina Amazon Transcribe. Si no especifica laDisplayAs
columna, Amazon Transcribe Medical utilizará el contenido de la columna en el archivo de salida.Phrase
-
IPA
(columna obligatoria, los valores pueden ser opcionales): para especificar la pronunciación de una palabra o frase, puede incluir caracteres del Alfabeto Fonético Internacional (IPA)en esta columna. La columna IPA
no puede contener espacios iniciales o finales y sólo debe utilizarse un espacio para separar cada fonema de la entrada. Por ejemplo, en inglés escribiría la fraseacute-respiratory-distress-syndrome
comoə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m
. Escribiría la fraseA.L.L.
comoeɪ ɛ l ɛ l
.Incluso si no especifica el contenido de la columna
IPA
, debe incluir una columnaIPA
en blanco. Si incluye valores en la columnaIPA
, no puede proporcionar valores para la columnaSoundsLike
.Para obtener una lista de caracteres IPA permitidos para un idioma específico, consulte Juego de caracteres para medicina Amazon Transcribe. El inglés estadounidense es el único idioma disponible en Amazon Transcribe Medicina.
-
SoundsLike
(la columna es obligatoria, los valores pueden ser opcionales): puede dividir una palabra o frase en segmentos más pequeños y proporcionar una pronunciación para cada segmento utilizando la ortografía estándar del idioma para imitar la forma en que suena la palabra. Por ejemplo, puede proporcionar sugerencias de pronunciación para la frasecerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy
de este modo:sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy
. La sugerencia para la fraseatrioventricular-nodal-reentrant-tachycardia
sería:ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
. Separe cada parte de la sugerencia con un guion (-).Incluso si no proporciona valores para la columna
SoundsLike
, debe incluir una columnaSoundsLike
en blanco. Si incluye valores en la columnaSoundsLike
, no puede proporcionar valores para la columnaIPA
.Puede utilizar cualquiera de los caracteres permitidos en el idioma de entrada. Para obtener una lista de los caracteres permitidos, consulte Juego de caracteres para medicina Amazon Transcribe.
-
DisplayAs
(columna obligatoria, los valores pueden ser opcionales): define el aspecto de la palabra o frase cuando se imprime. Por ejemplo, si la palabra o frase escerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy
, puede indicar que debe mostrarse comocerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy
para que el guion no aparezca. También puede especificarDisplayAs
comoCADASIL
si desea mostrar el acrónimo en lugar del término completo en la salida.Si no especifica la
DisplayAs
columna, Amazon Transcribe Medical utilizará laPhrase
columna del archivo de entrada en la salida.Puede utilizar cualquier carácter UTF-8 en la columna
DisplayAs
.
Incluya espacios sólo para los valores de las columnas IPA
y DisplayAs
.
Para crear el archivo de texto de su vocabulario personalizado, coloque cada palabra o frase del archivo de texto en una línea separada. Separe las columnas con caracteres de tabulación. Incluya espacios solo para los valores de las columnas IPA
y DisplayAs
. Guarda el archivo con la extensión .txt
en un compartimento Amazon S3 en el mismo Región de AWS lugar en el que usaste Amazon Transcribe Medical para crear tu vocabulario personalizado.
Si edita el archivo de texto en Windows, asegúrese de que el archivo está en formato LF
y no en formato CRLF
. De lo contrario, no podrá crear su vocabulario personalizado. Algunos editores de texto le permiten cambiar el formato con los comandos Find (Buscar) y Replace (Reemplazar).
En los ejemplos siguientes se muestra texto que puede utilizar para crear vocabularios personalizados. Para crear un vocabulario personalizado a partir de estos ejemplos, copie un ejemplo en un editor de texto, reemplace [TAB]
por un carácter de tabulación y cargue el archivo de texto guardado en Amazon S3.
Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]
Puede especificar las columnas en cualquier orden. Los siguientes ejemplos muestran otras estructuras válidas para el archivo de entrada de vocabulario personalizado.
Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs
acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome
A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL
atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase
acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome
ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L.
[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia
Para facilitar la lectura, las siguientes tablas muestran los ejemplos anteriores con mayor claridad en formato html. Están destinadas únicamente a ilustrar los ejemplos.
Phrase | IPA | SoundsLike | DisplayAs |
---|---|---|---|
acute-respiratory-distress-syndrome | acute respiratory distress syndrome | ||
A.L.L. | eɪ ɛ l ɛ l | ALL | |
atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia |
Phrase | SoundsLike | IPA | DisplayAs |
---|---|---|---|
acute-respiratory-distress-syndrome | acute respiratory distress syndrome | ||
atrioventricular-nodal-reentrant-tachycardia | ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia | ||
A.L.L. | eɪ ɛ l ɛ l | ALL |
DisplayAs | SoundsLike | IPA | Phrase |
---|---|---|---|
acute respiratory distress syndrome | acute-respiratory-distress-syndrome | ||
ALL | eɪ ɛ l ɛ l | A.L.L. | |
ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia | atrioventricular-nodal-reentrant-tachycardia |