Alternative Transkriptionen - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Alternative Transkriptionen

Bei der Amazon Transcribe Transkription von Audio werden verschiedene Versionen desselben Transkripts erstellt und jeder Version ein Konfidenzwert zugewiesen. Bei einer typischen Transkription erhalten Sie nur die Version mit dem höchsten Konfidenzwert.

Wenn Sie alternative Transkriptionen aktivieren, werden andere Versionen Ihres Transkripts Amazon Transcribe zurückgegeben, die ein niedrigeres Konfidenzniveau aufweisen. Sie können sich bis zu 10 alternative Transkriptionen zurückgeben lassen. Wenn Sie eine größere Anzahl von Alternativen angeben als angegeben, Amazon Transcribe wird nur die tatsächliche Anzahl von Alternativen zurückgegeben.

Alle Alternativen befinden sich in der gleichen Transkriptionsausgabedatei und werden auf Segmentebene dargestellt. Segmente sind natürliche Sprechpausen, z. B. wenn der Sprecher wechselt oder eine Pause im Ton gemacht wird.

Alternative Transkriptionen sind nur für Batch-Transkriptionen verfügbar.

Ihre Transkriptionsausgabe ist wie folgt aufgebaut. Die Auslassungspunkte (...) in den Codebeispielen geben der Kürze halber an, wo Inhalt entfernt wurde.

  1. Eine vollständige abschließende Transkription für ein bestimmtes Segment.

    "results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
  2. Ein Konfidenzwert für jedes Wort im vorangegangenen transcript-Abschnitt .

    "items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
  3. Ihre alternativen Transkriptionen befinden sich im segments-Teil Ihrer Transkriptionsausgabe. Die Alternativen für jedes Segment sind nach absteigendem Konfidenzwert geordnet.

    "segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ { ... "transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" }, ... { "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" },
  4. Ein Status am Ende der Transkriptionsausgabe.

    "status": "COMPLETED" }

Anforderung alternativer Transkriptionen

Mit dem AWS SDKs, oder können Sie alternative Transkriptionen anfordern. AWS CLIBeispiele finden Sie im Folgenden: AWS Management Console

  1. Melden Sie sich an der AWS Management Console an.

  2. Wählen Sie im Navigationsbereich Transkriptionsaufträge und dann Auftrag erstellen (oben rechts). Dies öffnet die Seite Auftragsdetails angeben.

    Amazon Transcribe Konsolenseite „Auftragsdetails angeben“. Im Bereich „Auftragseinstellungen“ können Sie einen Namen für Ihren Transkriptionsauftrag angeben, einen Modelltyp auswählen und Ihre Spracheinstellungen festlegen.
  3. Füllen Sie alle Felder aus, die Sie auf der Seite Auftragsdetails angeben möchten, und wählen Sie dann Weiter. Dadurch gelangen Sie zur Seite Auftrag konfigurieren – optional.

    Wählen Sie Alternative Ergebnisse und geben Sie die maximale Anzahl der alternativen Transkriptionsergebnisse an, die Sie in Ihrem Transkript haben möchten.

    Amazon Transcribe Konsolenseite „Job konfigurieren“. Im Bereich „Audioeinstellungen“ können Sie die Option "Alternative Ergebnisse“ aktivieren und die maximale Anzahl der Alternativen angeben, die Sie in Ihre Transkriptionsausgabe aufnehmen möchten.
  4. Wählen Sie Auftrag erstellen, um Ihren Transkriptionsauftrag auszuführen.

In diesem Beispiel werden der start-transcription-jobBefehl und ShowAlternatives der Parameter verwendet. Weitere Informationen erhalten Sie unter StartTranscriptionJob und ShowAlternatives.

Beachten Sie, dass Sie, wenn Sie ShowAlternatives=true in Ihrer Anfrage angeben, auch MaxAlternatives angeben müssen.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \ --output-bucket-name amzn-s3-demo-bucket \ --output-key my-output-files/ \ --language-code en-US \ --settings ShowAlternatives=true,MaxAlternatives=4

Hier ist ein weiteres Beispiel, in dem der start-transcription-jobBefehl verwendet wird, und ein Anforderungstext, der alternative Transkriptionen enthält.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://filepath/my-first-alt-transcription-job.json

Die Datei my-first-alt-transcription-job.json enthält den folgenden Anfragetext.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 4 } }

Im folgenden Beispiel werden alternative Transkriptionen mithilfe des AWS SDK for Python (Boto3)ShowAlternatives Arguments für die Methode start_transcription_job angefordert. Weitere Informationen erhalten Sie unter StartTranscriptionJob und ShowAlternatives.

Weitere Beispiele für die Verwendung der AWS SDKs, einschließlich funktionsspezifischer, szenarienspezifischer und dienstübergreifender Beispiele, finden Sie im Kapitel. Codebeispiele für Amazon Transcribe mit AWS SDKs

Beachten Sie, dass Sie, wenn Sie 'ShowAlternatives':True in Ihrer Anfrage angeben, auch MaxAlternatives angeben müssen.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4 } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)