Création d’un fichier texte pour votre vocabulaire personnalisé médical - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création d’un fichier texte pour votre vocabulaire personnalisé médical

Pour créer un vocabulaire personnalisé, vous devez créer un fichier texte au format UTF-8. Dans ce fichier, créez un tableau à quatre colonnes, chaque colonne spécifiant un champ. Chaque champ indique à Amazon Transcribe Medical comment les termes spécifiques au domaine sont prononcés ou comment les afficher dans vos transcriptions. Stockez le fichier texte contenant ces champs dans un compartiment Amazon S3 .

Formatage de votre fichier texte

Pour créer un vocabulaire personnalisé médical, entrez les noms des colonnes sous forme de ligne d’en-tête. Entrez les valeurs de chaque colonne sous la ligne d’en-tête.

Les noms des quatre colonnes du tableau sont les suivants :

  • Phrase – colonne obligatoire, valeurs obligatoires

  • IPA – colonne obligatoire, valeurs facultatives

  • SoundsLike – colonne obligatoire, valeurs facultatives

  • DisplayAs – colonne obligatoire, valeurs facultatives

Avant de créer un vocabulaire personnalisé :

  • Séparez chaque colonne par un seul caractère de tabulation. Amazon Transcribe renvoie un message d'erreur si vous essayez de séparer les colonnes par des espaces ou par plusieurs caractères de tabulation.

  • Assurez-vous qu’il n’y a pas d’espaces de fin ou d’espaces blanc après chaque valeur d’une colonne.

Assurez-vous que les valeurs que vous entrez pour chaque colonne :

Saisie de valeurs pour les colonnes du tableau

Les informations suivantes expliquent comment définir des valeurs pour les quatre colonnes du tableau :

  • Phrase – Terme ou expression qui doit être reconnu. Vous devez entrer des valeurs dans cette colonne.

    Si l’entrée est une expression, séparez les termes par un trait d’union (-). Par exemple, entrez cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy en tant que cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy.

    Saisissez les acronymes ou les autres termes dont les lettres doivent être prononcées individuellement en séparant les lettres par un point, par exemple D.N.A. ou S.T.E.M.I.. Pour saisir le pluriel d'un acronyme, tel que « »STEMIs, séparez le « s » de l'acronyme par un trait d'union : « S.T.E.M.I-s » Vous pouvez utiliser des lettres majuscules ou minuscules pour les acronymes.

    La colonne Phrase est obligatoire. Vous pouvez utiliser n’importe quel caractère autorisé pour la langue saisie. Pour connaître les caractères autorisés, veuillez consulter Jeu de caractères pour Amazon Transcribe Medical. Si vous ne spécifiez pas la DisplayAs colonne, Amazon Transcribe Medical utilise le contenu de la Phrase colonne dans le fichier de sortie.

  • IPA (la colonne est obligatoire, les valeurs peuvent être facultatives) – Pour spécifier la prononciation d’un mot ou d’une expression, vous pouvez inclure des caractères de l’alphabet phonétique international (API) dans cette colonne. La colonne IPA ne peut pas inclure des espaces de début ou de fin, et vous devez utiliser un seul espace pour séparer chaque phonème dans la saisie. Par exemple, en anglais, pour l’expression acute-respiratory-distress-syndrome, vous saisissez ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m. Pour l’expression A.L.L., vous saisissez eɪ ɛ l ɛ l.

    Même si vous ne spécifiez pas le contenu de la colonne IPA, vous devez inclure une colonne IPA vide. Si vous incluez des valeurs dans la colonne IPA, vous ne pouvez pas fournir de valeurs pour la colonne SoundsLike.

    Pour obtenir la liste des caractères phonétiques de l’alphabet phonétique international autorisés pour une langue spécifique, veuillez consulter Jeu de caractères pour Amazon Transcribe Medical. L'anglais américain est la seule langue disponible en Amazon Transcribe médecine.

  • SoundsLike (la colonne est obligatoire, les valeurs peuvent être facultatives) – Vous pouvez décomposer un mot ou une expression en plusieurs segments et attribuer une prononciation à chaque segment à l’aide de l’orthographe standard pour imiter la prononciation du mot. Par exemple, en anglais, vous pouvez fournir des conseils pour la prononciation de l’expression cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy : sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy. Le conseil pour l’expression atrioventricular-nodal-reentrant-tachycardia serait : ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia. Les parties de l’indication doivent être séparées par un trait d’union (-).

    Même si vous ne spécifiez pas de valeurs pour la colonne SoundsLike, vous devez inclure une colonne SoundsLike vide. Si vous incluez des valeurs dans la colonne SoundsLike, vous ne pouvez pas fournir de valeurs pour la colonne IPA.

    Vous pouvez utiliser n’importe quel caractère autorisé pour la langue saisie. Pour obtenir la liste des caractères autorisés, veuillez consulter Jeu de caractères pour Amazon Transcribe Medical.

  • DisplayAs (la colonne est obligatoire, les valeurs peuvent être facultatives) – Définit l’affichage du mot ou de l’expression. Par exemple, si le terme ou l’expression est cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy, vous pouvez décider d’afficher cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy afin que les tirets n’apparaissent pas. Vous pouvez également spécifier DisplayAs comme CADASIL si vous souhaitez afficher l’acronyme au lieu du terme complet dans la sortie.

    Si vous ne spécifiez pas de DisplayAs colonne, Amazon Transcribe Medical utilise la Phrase colonne du fichier d'entrée dans la sortie.

    Vous pouvez utiliser n’importe quel caractère UTF-8 dans la colonne DisplayAs.

Vous pouvez inclure des espaces uniquement pour les valeurs des colonnes IPA et DisplayAs.

Pour créer le fichier texte de votre vocabulaire personnalisé, placez chaque mot ou expression de votre fichier texte sur une ligne distincte. Séparez les colonnes par des caractères de tabulation. Incluez des espaces uniquement pour les valeurs des colonnes IPA et DisplayAs. Enregistrez le fichier avec l'extension .txt dans un Amazon S3 compartiment dans Région AWS lequel vous utilisez Amazon Transcribe Medical pour créer votre vocabulaire personnalisé.

Si vous modifiez votre fichier texte dans Windows, assurez-vous que votre fichier est au format LF et non au format CRLF. Sinon, vous ne pourrez pas créer votre glossaire personnalisé. Certains éditeurs de texte vous permettent de modifier la mise en forme à l’aide des commandes Rechercher et Remplacer.

Les exemples suivants montrent du texte que vous pouvez utiliser pour créer des glossaires personnalisés. Pour créer un glossaire personnalisé à partir de ces exemples, copiez un exemple dans un éditeur de texte, remplacez [TAB] par un caractère de tabulation et téléchargez le fichier texte enregistré dans Amazon S3.

Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]

Vous pouvez entrer des colonnes dans n’importe quel ordre. Les exemples suivants montrent d’autres structures valides pour le fichier d’entrée du glossaire personnalisé.

Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L. [TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia

Pour faciliter la lecture, les tableaux suivants montrent plus clairement les exemples précédents au format html. Ils ne sont destinés qu’à illustrer les exemples.

Expression IPA SoundsLike DisplayAs
acute-respiratory-distress-syndrome acute respiratory distress syndrome
A.L.L. eɪ ɛ l ɛ l ALL
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
Expression SoundsLike IPA DisplayAs
acute-respiratory-distress-syndrome acute respiratory distress syndrome
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
A.L.L. eɪ ɛ l ɛ l ALL
DisplayAs SoundsLike IPA Expression
acute respiratory distress syndrome acute-respiratory-distress-syndrome
ALL eɪ ɛ l ɛ l A.L.L.
ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia atrioventricular-nodal-reentrant-tachycardia