Erstellen einer Textdatei für Ihr benutzerdefiniertes medizinisches Vokabular - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen einer Textdatei für Ihr benutzerdefiniertes medizinisches Vokabular

Um ein benutzerdefiniertes Vokabular zu erstellen, erstellen Sie eine Textdatei im UTF-8-Format. In dieser Datei erstellen Sie eine vierspaltige Tabelle, wobei jede Spalte ein Feld angibt. Jedes Feld teilt Amazon Transcribe Medical mit, wie die domänenspezifischen Begriffe ausgesprochen werden oder wie diese Begriffe in Ihren Transkriptionen angezeigt werden sollen. Sie speichern die Textdatei, die diese Felder enthält, in einem Amazon S3 -Bucket.

Verstehen, wie man eine Textdatei formatiert

Um ein medizinisches benutzerdefiniertes Vokabular zu erstellen, geben Sie die Spaltennamen in einem Header ein. Sie geben die Werte für jede Spalte unterhalb des Headers ein.

Im Folgenden sind die Namen der vier Spalten der Tabelle aufgeführt:

  • Phrase – Spalte erforderlich, Werte erforderlich

  • IPA – Spalte erforderlich, Werte können optional sein

  • SoundsLike – Spalte erforderlich, Werte können optional sein

  • DisplayAs – Spalte erforderlich, Werte können optional sein

Wenn Sie ein benutzerdefiniertes Vokabular erstellen, stellen Sie sicher, dass Sie:

  • Trennen Sie jede Spalte durch ein einzelnes Tabulatorzeichen. Amazon Transcribe gibt eine Fehlermeldung aus, wenn Sie versuchen, die Spalten durch Leerzeichen oder mehrere Tabulatorzeichen zu trennen.

  • Vergewissern Sie sich, dass nach jedem Wert in einer Spalte keine Leerzeichen oder Leerstellen folgen.

Achten Sie darauf, dass die Werte, die Sie für jede Spalte eingeben:

Eingabe von Werten für die Spalten der Tabelle

Die folgenden Informationen zeigen Ihnen, wie Sie Werte für die vier Spalten der Tabelle angeben können:

  • Phrase – Das Wort oder die Formulierung, die erkannt werden soll. Sie müssen in dieser Spalte Werte eingeben.

    Trennen Sie die Wörter durch einen Bindestrich (-) voneinander, wenn es sich bei dem Eintrag um einen Ausdruck handelt. Geben Sie beispielsweise cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy als cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy ein.

    Geben Sie Akronyme oder andere Wörter, deren Buchstaben einzeln ausgesprochen werden sollen, als einzelne Buchstaben gefolgt von Punkten ein, z. B. D.N.A. oder S.T.E.M.I.. Um die Pluralform eines Akronyms einzugeben, z. B. "“STEMIs, trennen Sie das „s“ vom Akronym durch einen Bindestrich: "S.T.E.M.I-s" Sie können Groß- oder Kleinbuchstaben für Akronyme verwenden.

    Die Spalte Phrase ist obligatorisch. Sie können jedes zulässige Zeichen für die Eingabesprache verwenden. Zulässige Zeichen finden Sie unter Zeichensatz für Medizinprodukte Amazon Transcribe. Wenn Sie die Spalte nicht angeben, verwendet Amazon Transcribe Medical den Inhalt der DisplayAs Spalte in der Ausgabedatei. Phrase

  • IPA (Spalte erforderlich, Werte können optional sein) – Um die Aussprache eines Wortes oder Satzes anzugeben, können Sie in dieser Spalte Zeichen des Internationalen Phonetischen Alphabets (IPA) angeben. Die Spalte IPA darf keine Leerzeichen zu Beginn oder am Ende enthalten und Sie müssen ein einzelnes Leerzeichen verwenden, um jedes Phonem in der Eingabe voneinander zu trennen. Auf Englisch geben Sie beispielsweise den Ausdruck acute-respiratory-distress-syndrome folgendermaßen ein: ə k j u t ɹ ɛ s p ɪ ɹ ə t ɔ ɹ i d ɪ s t ɹ ɛ s s ɪ n d ɹ oʊ m. Geben Sie beispielsweise den Ausdruck A.L.L. folgendermaßen ein: eɪ ɛ l ɛ l.

    Auch wenn Sie den Inhalt der IPA-Spalte nicht angeben, müssen Sie eine leere IPA-Spalte einfügen. Wenn Sie Werte in die Spalte IPA einfügen, können Sie keine Werte für die Spalte SoundsLike angeben.

    Eine Liste der zulässigen IPA-Zeichen für eine bestimmte Sprache finden Sie unter Zeichensatz für Medizinprodukte Amazon Transcribe. US-Englisch ist die einzige Sprache, die in Amazon Transcribe Medical verfügbar ist.

  • SoundsLike (Spalte erforderlich, Werte können optional sein) – Sie können ein Wort oder einen Satz in kleinere Segmente unterteilen und für jedes Segment eine Aussprache in der Standardorthografie der Sprache angeben, um den Klang des Wortes nachzuahmen. Geben Sie beispielsweise Aussprachehinweise für den Ausdruck cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy folgendermaßen ein: sir-e-brul-aut-o-som-ul-dah-mi-nant-ar-ter-ri-o-pa-thy-with-sub-cor-ti-cul-in-farcts-and-lewk-o-en-ce-phul-ah-pu-thy. Der Hinweis für den Ausdruck atrioventricular-nodal-reentrant-tachycardia würde wie folgt aussehen: ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia. Alle Teile des Hinweises werden durch einen Bindestrich (-) voneinander getrennt.

    Selbst wenn Sie keine Werte für die Spalte SoundsLike angeben, müssen Sie eine leere Spalte SoundsLike einfügen. Wenn Sie Werte in die Spalte SoundsLike einfügen, können Sie keine Werte für die Spalte IPA angeben.

    Sie können jedes zulässige Zeichen für die Eingabesprache verwenden. Die Liste der zulässigen Zeichen finden Sie unter Zeichensatz für Medizinprodukte Amazon Transcribe.

  • DisplayAs (Spalte erforderlich, Werte können optional sein) – Legt fest, wie das Wort oder die Formulierung bei der Ausgabe aussieht. Beispiel: Wenn das Wort oder der Ausdruck cerebral-autosomal-dominant-arteriopathy-with-subcortical-infarcts-and-leukoencephalopathy lautet, können Sie die Darstellungsform auf cerebral autosomal dominant arteriopathy with subcortical infarcts and leukoencephalopathy festlegen, damit der Bindestrich nicht angezeigt wird. Sie können DisplayAs auch als CADASIL angeben, wenn Sie das Akronym anstelle des vollständigen Begriffs in der Ausgabe anzeigen möchten.

    Wenn Sie die DisplayAs Spalte nicht angeben, verwendet Amazon Transcribe Medical die Phrase Spalte aus der Eingabedatei in der Ausgabe.

    Sie können in die Spalte DisplayAs beliebige UTF-8-Zeichen eingeben.

Sie können Leerzeichen nur für die Werte in den Spalten IPA und DisplayAs eingeben.

Um die Textdatei Ihres benutzerdefinierten Vokabulars zu erstellen, setzen Sie jedes Wort oder jeden Satz in Ihrer Textdatei in eine eigene Zeile. Trennen Sie die Spalten durch Tabulatorzeichen. Fügen Sie Leerzeichen nur für Werte in den Spalten IPA und DisplayAs ein. Speichern Sie die Datei mit der Erweiterung .txt in einem Amazon S3 Bucket in derselben AWS-Region Datei, in der Sie Amazon Transcribe Medical verwenden, um Ihr benutzerdefiniertes Vokabular zu erstellen.

Wenn Sie Ihre Textdatei in Windows bearbeiten, stellen Sie sicher, dass Ihre Datei im LF-Format und nicht im CRLF-Format vorliegt. Andernfalls können Sie Ihr benutzerdefiniertes Vokabular nicht erstellen. Einige Texteditoren ermöglichen es Ihnen, die Formatierung mit den Befehlen Suchen und Ersetzen zu ändern.

Die folgenden Beispiele zeigen Text, mit dem Sie benutzerdefinierte Vokabulare erstellen können. Um ein benutzerdefiniertes Vokabular aus diesen Beispielen zu erstellen, kopieren Sie ein Beispiel in einen Texteditor, ersetzen Sie [TAB] durch ein Tabulatorzeichen und laden Sie die gespeicherte Textdatei auf Amazon S3 hoch.

Phrase[TAB]IPA[TAB]SoundsLike[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB]eɪ ɛ l ɛ l[TAB][TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB][TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB]

Sie können Spalten in beliebiger Reihenfolge eingeben. Die folgenden Beispiele zeigen andere gültige Strukturen für die Eingabedatei des benutzerdefinierten Vokabulars.

Phrase[TAB]SoundsLike[TAB]IPA[TAB]DisplayAs acute-respiratory-distress-syndrome[TAB][TAB][TAB]acute respiratory distress syndrome A.L.L.[TAB][TAB]eɪ ɛ l ɛ l[TAB]ALL atrioventricular-nodal-reentrant-tachycardia[TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]
DisplayAs[TAB]SoundsLike[TAB]IPA[TAB]Phrase acute respiratory distress syndrome[TAB][TAB][TAB]acute-respiratory-distress-syndrome ALL[TAB][TAB]eɪ ɛ l ɛ l[TAB]A.L.L. [TAB]ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia[TAB][TAB]atrioventricular-nodal-reentrant-tachycardia

Zur besseren Lesbarkeit sind in den folgenden Tabellen die vorhergehenden Beispiele in HTML-Format deutlicher dargestellt. Sie dienen nur zur Veranschaulichung der Beispiele.

Phrase IPA SoundsLike DisplayAs
acute-respiratory-distress-syndrome acute respiratory distress syndrome
A.L.L. eɪ ɛ l ɛ l ALL
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
Phrase SoundsLike IPA DisplayAs
acute-respiratory-distress-syndrome acute respiratory distress syndrome
atrioventricular-nodal-reentrant-tachycardia ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia
A.L.L. eɪ ɛ l ɛ l ALL
DisplayAs SoundsLike IPA Phrase
acute respiratory distress syndrome acute-respiratory-distress-syndrome
ALL eɪ ɛ l ɛ l A.L.L.
ay-tree-o-ven-trick-u-lar-node-al-re-entr-ant-tack-ih-card-ia atrioventricular-nodal-reentrant-tachycardia