Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Alternative Transkriptionen
BeimAmazon Transcribe Transkribieren von Audio werden verschiedene Versionen desselben Transkripts erstellt und jeder Version wird ein Konfidenzwert zugewiesen. In einer typischen Transkription erhalten Sie nur die Version mit dem höchsten Konfidenzwert.
Wenn Sie alternative Transkriptionen aktivieren, werden andere Versionen Ihres TranskriptsAmazon Transcribe zurückgegeben, die ein niedrigeres Konfidenzniveau aufweisen. Sie können wählen, ob Sie bis zu 10 alternative Transkriptionen zurückgeben möchten. Wenn Sie eine größere Anzahl von Alternativen als die angegebene AnzahlAmazon Transcribe angeben, wird nur die tatsächliche Anzahl der Alternativen zurückgegeben.
Alle Alternativen befinden sich in derselben Transkriptionsausgabedatei und werden auf Segmentebene dargestellt. Segmente sind natürliche Sprachpausen, z. B. ein Sprecherwechsel oder eine Audiopause.
Alternative Transkriptionen sind nur für Batch-Transkriptionen verfügbar.
Ihre Transkriptionsausgabe ist folgendermaßen strukturiert. Die Ellipsen (...
) geben Sie in den Codebeispielen an, wo der Inhalt der Kürze halber entfernt wurde.
Eine vollständige endgültige Transkription für ein bestimmtes Segment.
"results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
Ein Konfidenzwert für jedes Wort im vorherigen
transcript
Abschnitt."items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
-
Ihre alternativen Transkriptionen befinden sich im
segments
Teil Ihrer Transkriptionsausgabe. Die Alternativen für jedes Segment sind nach absteigendem Konfidenzwert sortiert."segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ {
...
"transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" },...
{ "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" }, -
Ein Status am Ende Ihrer Transkriptionsausgabe.
"status": "COMPLETED" }
Alternative Transkriptionen anfordern
Sie können alternative Transkriptionen mit den AWS Management ConsoleAWS CLI, oder AWSSDKs anfordern. Beispiele finden Sie im Folgenden:
-
Melden Sie sich an der AWS Management Console
an. -
Wählen Sie im Navigationsbereich Transkriptionsaufträge und dann Job erstellen (oben rechts) aus. Dadurch wird die Seite „Jobdetails angeben“ geöffnet.
-
Füllen Sie auf der Seite „Jobdetails angeben“ alle Felder aus, die Sie einbeziehen möchten, und wählen Sie dann Weiter aus. Dadurch gelangen Sie zur Seite Job konfigurieren — optional.
Wählen Sie Alternative Ergebnisse aus und geben Sie die maximale Anzahl alternativer Transkriptionsergebnisse an, die Sie in Ihrem Transkript haben möchten.
-
Wählen Sie Job erstellen aus, um Ihren Transkriptionsjob auszuführen.
In diesem Beispiel werden der start-transcription-jobShowAlternatives
Parameter verwendet. Weitere Informationen erhalten Sie unter StartTranscriptionJob
und ShowAlternatives
.
Beachten Sie, dass Sie, wenn Sie diesShowAlternatives=true
in Ihrer Anfrage angeben, auch angeben müssenMaxAlternatives
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings ShowAlternatives=true,MaxAlternatives=4
Hier ist ein weiteres Beispiel für die Verwendung des start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://filepath
/my-first-alt-transcription-job.json
Die Datei my-first-alt-transcription-job.json enthält den folgenden Anforderungstext.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US
", "Settings": { "ShowAlternatives": true, "MaxAlternatives":4
} }
Im folgenden Beispiel wird das verwendetAWS SDK for Python (Boto3), um alternative Transkriptionen anzufordern, indem dasShowAlternatives
Argument für die Methode start_transcription_jobStartTranscriptionJob
und ShowAlternatives
.
Weitere Beispiele für die Verwendung derAWS SDKs, einschließlich funktionsspezifischer, szenariospezifischer und dienstübergreifender Beispiele, finden Sie imCodebeispiele für Amazon Transcribe mit SDKs AWS Kapitel.
Beachten Sie, dass Sie, wenn Sie dies'ShowAlternatives':True
in Ihrer Anfrage angeben, auch angeben müssenMaxAlternatives
.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US
', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4
} ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)