Erstellen eines benutzerdefinierten Vokabulars mithilfe einer Liste - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen eines benutzerdefinierten Vokabulars mithilfe einer Liste

Sie können mithilfe der AWS SDKsAWS Management Console,AWS CLI, oder benutzerdefinierte Vokabeln aus Listen erstellen.

  • AWS Management Console: Sie müssen eine Textdatei mit Ihrem benutzerdefinierten Wortschatz erstellen und hochladen. Sie können zeilengetrennte oder kommagetrennte Einträge verwenden. Beachten Sie, dass Ihre Liste als Textdatei (*.txt) im LF Format gespeichert werden muss. Wenn Sie ein anderes Format verwenden, z. B. CRLF wird Ihr benutzerdefiniertes Vokabular von nicht akzeptiertAmazon Transcribe.

  • AWS CLIund AWSSDKs: Sie müssen Ihr benutzerdefiniertes Vokabular als durch Kommas getrennte Einträge in Ihren API-Aufruf aufnehmen, indem Sie die Flagge verwenden. Phrases

Wenn ein Eintrag mehrere Wörter enthält, müssen Sie jedes Wort mit einer Silbentrennung trennen. Sie geben beispielsweise „Los Angeles“ als Los-Angeles und „Andorra la Vella“ als an. Andorra-la-Vella

Hier finden Sie Beispiele für die beiden gültigen Listenformate. Methodenspezifische Erstellen benutzerdefinierter Vokabellisten Beispiele finden Sie unter.

  • Durch Kommas getrennte Einträge:

    Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
  • Zeilengetrennte Einträge:

    Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
Wichtig

Sie können nur Zeichen verwenden, die für Ihre Sprache unterstützt werden. Einzelheiten entnehmen Sie dem Zeichensatz Ihrer Sprache.

Benutzerdefinierte Vokabellisten werden bei der CreateMedicalVocabularyOperation nicht unterstützt. Wenn Sie ein benutzerdefiniertes medizinisches Vokabular erstellen, müssen Sie ein Tabellenformat verwenden. Anweisungen Erstellen eines benutzerdefinierten Vokabulars mithilfe einer Tabelle finden Sie unter.

Erstellen benutzerdefinierter Vokabellisten

Um eine benutzerdefinierte Vokabelliste für die Verwendung mit zu verarbeitenAmazon Transcribe, sehen Sie sich die folgenden Beispiele an:

In diesem Beispiel wird der Befehl create-vocabulary mit einer benutzerdefinierten Vokabeldatei im Listenformat verwendet. Weitere Informationen finden Sie unter CreateVocabulary.

aws transcribe create-vocabulary \ --vocabulary-name my-first-vocabulary \ --language-code en-US \ --phrases {CLI,Eva-Maria,ABCs}

Hier ist ein weiteres Beispiel mit dem Befehl create-vocabulary und einem Anforderungstext, der Ihr benutzerdefiniertes Vokabular erstellt.

aws transcribe create-vocabulary \ --cli-input-json file://filepath/my-first-vocab-list.json

Die Datei my-first-vocab-list.json enthält den folgenden Anfragetext.

{ "VocabularyName": "my-first-vocabulary", "LanguageCode": "en-US", "Phrases": [ "CLI","Eva-Maria","ABCs" ] }

Sobald der VocabularyState Wert von PENDING auf geändert READY wurde, ist Ihr benutzerdefinierter Wortschatz mit einer Transkription einsatzbereit. Um den aktuellen Status Ihres eine benutzerdefinierte Vokririken

aws transcribe get-vocabulary \ --vocabulary-name my-first-vocabulary

In diesem Beispiel wird der verwendetAWS SDK for Python (Boto3), um mithilfe der Methode create_vocabulary ein benutzerdefiniertes Vokabular aus einer Liste zu erstellen. Weitere Informationen finden Sie unter CreateVocabulary.

Weitere Beispiele für die Verwendung der AWS SDKs, einschließlich funktionsspezifischer, szenariospezifischer und dienstübergreifender Beispiele, finden Sie in diesem Kapitel. Codebeispiele für Amazon Transcribe mit AWS SDKs

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_vocabulary( LanguageCode = 'en-US', VocabularyName = vocab_name, Phrases = [ 'CLI','Eva-Maria','ABCs' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Anmerkung

Wenn Sie einen neuen Amazon S3 Bucket für Ihre benutzerdefinierten Vokabeldateien erstellen, stellen Sie sicher, dass die IAM Rolle, die die CreateVocabularyAnfrage stellt, über Zugriffsberechtigungen für diesen Bucket verfügt. Wenn die Rolle nicht über die richtigen Berechtigungen verfügt, schlägt Ihre Anfrage fehl. Sie können optional eine IAM Rolle in Ihrer Anfrage angeben, indem Sie den DataAccessRoleArn Parameter angeben. Weitere Informationen zu IAM Rollen und Richtlinien in Amazon Transcribe finden Sie unterAmazon Transcribe Beispiele für identitätsbasierte Politik.