Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Erstellen eines benutzerdefinierten Vokabulars mithilfe einer Liste
Sie können mithilfe der AWS SDKsAWS Management Console,AWS CLI, oder benutzerdefinierte Vokabeln aus Listen erstellen.
-
AWS Management Console: Sie müssen eine Textdatei mit Ihrem benutzerdefinierten Wortschatz erstellen und hochladen. Sie können zeilengetrennte oder kommagetrennte Einträge verwenden. Beachten Sie, dass Ihre Liste als Textdatei (*.txt) im
LF
Format gespeichert werden muss. Wenn Sie ein anderes Format verwenden, z. B.CRLF
wird Ihr benutzerdefiniertes Vokabular von nicht akzeptiertAmazon Transcribe. -
AWS CLIund AWSSDKs: Sie müssen Ihr benutzerdefiniertes Vokabular als durch Kommas getrennte Einträge in Ihren API-Aufruf aufnehmen, indem Sie die Flagge verwenden.
Phrases
Wenn ein Eintrag mehrere Wörter enthält, müssen Sie jedes Wort mit einer Silbentrennung trennen. Sie geben beispielsweise „Los Angeles“ als Los-Angeles
und „Andorra la Vella“ als an. Andorra-la-Vella
Hier finden Sie Beispiele für die beiden gültigen Listenformate. Methodenspezifische Erstellen benutzerdefinierter Vokabellisten Beispiele finden Sie unter.
-
Durch Kommas getrennte Einträge:
Los-Angeles,CLI,Eva-Maria,ABCs,Andorra-la-Vella
-
Zeilengetrennte Einträge:
Los-Angeles CLI Eva-Maria ABCs Andorra-la-Vella
Wichtig
Sie können nur Zeichen verwenden, die für Ihre Sprache unterstützt werden. Einzelheiten entnehmen Sie dem Zeichensatz Ihrer Sprache.
Benutzerdefinierte Vokabellisten werden bei der CreateMedicalVocabulary
Operation nicht unterstützt. Wenn Sie ein benutzerdefiniertes medizinisches Vokabular erstellen, müssen Sie ein Tabellenformat verwenden. Anweisungen Erstellen eines benutzerdefinierten Vokabulars mithilfe einer Tabelle finden Sie unter.
Erstellen benutzerdefinierter Vokabellisten
Um eine benutzerdefinierte Vokabelliste für die Verwendung mit zu verarbeitenAmazon Transcribe, sehen Sie sich die folgenden Beispiele an:
In diesem Beispiel wird der Befehl create-vocabulary mit einer benutzerdefinierten Vokabeldatei im Listenformat verwendet. Weitere Informationen finden Sie unter CreateVocabulary
.
aws transcribe create-vocabulary \ --vocabulary-name
my-first-vocabulary
\ --language-codeen-US
\ --phrases {CLI,Eva-Maria,ABCs
}
Hier ist ein weiteres Beispiel mit dem Befehl create-vocabulary und einem Anforderungstext, der Ihr benutzerdefiniertes Vokabular erstellt.
aws transcribe create-vocabulary \ --cli-input-json file://
filepath
/my-first-vocab-list
.json
Die Datei my-first-vocab-list.json enthält den folgenden Anfragetext.
{ "VocabularyName": "
my-first-vocabulary
", "LanguageCode": "en-US
", "Phrases": [ "CLI
","Eva-Maria
","ABCs
" ] }
Sobald der VocabularyState
Wert von PENDING
auf geändert READY
wurde, ist Ihr benutzerdefinierter Wortschatz mit einer Transkription einsatzbereit. Um den aktuellen Status Ihres eine benutzerdefinierte Vokririken
aws transcribe get-vocabulary \ --vocabulary-name
my-first-vocabulary
In diesem Beispiel wird der verwendetAWS SDK for Python (Boto3), um mithilfe der Methode create_vocabulary ein benutzerdefiniertes VokabularCreateVocabulary
.
Weitere Beispiele für die Verwendung der AWS SDKs, einschließlich funktionsspezifischer, szenariospezifischer und dienstübergreifender Beispiele, finden Sie in diesem Kapitel. Codebeispiele für Amazon Transcribe mit AWS SDKs
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') vocab_name = "my-first-vocabulary
" response = transcribe.create_vocabulary( LanguageCode = 'en-US
', VocabularyName = vocab_name, Phrases = [ 'CLI
','Eva-Maria
','ABCs
' ] ) while True: status = transcribe.get_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Anmerkung
Wenn Sie einen neuen Amazon S3 Bucket für Ihre benutzerdefinierten Vokabeldateien erstellen, stellen Sie sicher, dass die IAM Rolle, die die CreateVocabulary
Anfrage stellt, über Zugriffsberechtigungen für diesen Bucket verfügt. Wenn die Rolle nicht über die richtigen Berechtigungen verfügt, schlägt Ihre Anfrage fehl. Sie können optional eine IAM Rolle in Ihrer Anfrage angeben, indem Sie den DataAccessRoleArn
Parameter angeben. Weitere Informationen zu IAM Rollen und Richtlinien in Amazon Transcribe finden Sie unterAmazon Transcribe Beispiele für identitätsbasierte Politik.