Alternative Transkriptionen - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Alternative Transkriptionen

BeimAmazon Transcribe Transkribieren von Audio werden verschiedene Versionen desselben Transkripts erstellt und jeder Version wird ein Konfidenzwert zugewiesen. In einer typischen Transkription erhalten Sie nur die Version mit dem höchsten Konfidenzwert.

Wenn Sie alternative Transkriptionen aktivieren, werden andere Versionen Ihres TranskriptsAmazon Transcribe zurückgegeben, die ein niedrigeres Konfidenzniveau aufweisen. Sie können wählen, ob Sie bis zu 10 alternative Transkriptionen zurückgeben möchten. Wenn Sie eine größere Anzahl von Alternativen als die angegebene AnzahlAmazon Transcribe angeben, wird nur die tatsächliche Anzahl der Alternativen zurückgegeben.

Alle Alternativen befinden sich in derselben Transkriptionsausgabedatei und werden auf Segmentebene dargestellt. Segmente sind natürliche Sprachpausen, z. B. ein Sprecherwechsel oder eine Audiopause.

Alternative Transkriptionen sind nur für Batch-Transkriptionen verfügbar.

Ihre Transkriptionsausgabe ist folgendermaßen strukturiert. Die Ellipsen (... ) geben Sie in den Codebeispielen an, wo der Inhalt der Kürze halber entfernt wurde.

  1. Eine vollständige endgültige Transkription für ein bestimmtes Segment.

    "results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
  2. Ein Konfidenzwert für jedes Wort im vorherigentranscript Abschnitt.

    "items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
  3. Ihre alternativen Transkriptionen befinden sich imsegments Teil Ihrer Transkriptionsausgabe. Die Alternativen für jedes Segment sind nach absteigendem Konfidenzwert sortiert.

    "segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ { ... "transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" }, ... { "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" },
  4. Ein Status am Ende Ihrer Transkriptionsausgabe.

    "status": "COMPLETED" }

Alternative Transkriptionen anfordern

Sie können alternative Transkriptionen mit den AWS Management ConsoleAWS CLI, oder AWSSDKs anfordern. Beispiele finden Sie im Folgenden:

  1. Melden Sie sich an der AWS Management Console an.

  2. Wählen Sie im Navigationsbereich Transkriptionsaufträge und dann Job erstellen (oben rechts) aus. Dadurch wird die Seite „Jobdetails angeben“ geöffnet.

    Amazon TranscribeKonsolenseite „Auftragsdetails angeben“. Im Bereich „Auftragseinstellungen“ können Sie einen Namen für Ihren Transkriptionsjob angeben, einen Modelltyp auswählen und Ihre Spracheinstellungen festlegen.
  3. Füllen Sie auf der Seite „Jobdetails angeben“ alle Felder aus, die Sie einbeziehen möchten, und wählen Sie dann Weiter aus. Dadurch gelangen Sie zur Seite Job konfigurieren — optional.

    Wählen Sie Alternative Ergebnisse aus und geben Sie die maximale Anzahl alternativer Transkriptionsergebnisse an, die Sie in Ihrem Transkript haben möchten.

    Amazon TranscribeKonsolenseite „Job konfigurieren“. Im Bereich „Audioeinstellungen“ können Sie Alternative Ergebnisse aktivieren und die maximale Anzahl von Alternativen angeben, die in Ihrer Transkriptionsausgabe enthalten sein sollen.
  4. Wählen Sie Job erstellen aus, um Ihren Transkriptionsjob auszuführen.

In diesem Beispiel werden der start-transcription-jobBefehl und derShowAlternatives Parameter verwendet. Weitere Informationen erhalten Sie unter StartTranscriptionJob und ShowAlternatives.

Beachten Sie, dass Sie, wenn Sie diesShowAlternatives=true in Ihrer Anfrage angeben, auch angeben müssenMaxAlternatives.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings ShowAlternatives=true,MaxAlternatives=4

Hier ist ein weiteres Beispiel für die Verwendung des start-transcription-jobBefehls und ein Anforderungstext, der alternative Transkriptionen enthält.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://filepath/my-first-alt-transcription-job.json

Die Datei my-first-alt-transcription-job.json enthält den folgenden Anforderungstext.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 4 } }

Im folgenden Beispiel wird das verwendetAWS SDK for Python (Boto3), um alternative Transkriptionen anzufordern, indem dasShowAlternatives Argument für die Methode start_transcription_job verwendet wird. Weitere Informationen erhalten Sie unter StartTranscriptionJob und ShowAlternatives.

Weitere Beispiele für die Verwendung derAWS SDKs, einschließlich funktionsspezifischer, szenariospezifischer und dienstübergreifender Beispiele, finden Sie imCodebeispiele für Amazon Transcribe mit SDKs AWS Kapitel.

Beachten Sie, dass Sie, wenn Sie dies'ShowAlternatives':True in Ihrer Anfrage angeben, auch angeben müssenMaxAlternatives.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4 } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)