Anforderung alternativer Transkriptionen

Alternative Transkriptionen

Bei der Amazon Transcribe Transkription von Audio werden verschiedene Versionen desselben Transkripts erstellt und jeder Version ein Konfidenzwert zugewiesen. Bei einer typischen Transkription erhalten Sie nur die Version mit dem höchsten Konfidenzwert.

Wenn Sie alternative Transkriptionen aktivieren, werden andere Versionen Ihres Transkripts Amazon Transcribe zurückgegeben, die ein niedrigeres Konfidenzniveau aufweisen. Sie können sich bis zu 10 alternative Transkriptionen zurückgeben lassen. Wenn Sie eine größere Anzahl von Alternativen angeben als angegeben, Amazon Transcribe wird nur die tatsächliche Anzahl von Alternativen zurückgegeben.

Alle Alternativen befinden sich in der gleichen Transkriptionsausgabedatei und werden auf Segmentebene dargestellt. Segmente sind natürliche Sprechpausen, z. B. wenn der Sprecher wechselt oder eine Pause im Ton gemacht wird.

Alternative Transkriptionen sind nur für Batch-Transkriptionen verfügbar.

Ihre Transkriptionsausgabe ist wie folgt aufgebaut. Die Auslassungspunkte (...) in den Codebeispielen geben der Kürze halber an, wo Inhalt entfernt wurde.

Eine vollständige abschließende Transkription für ein bestimmtes Segment.


"results": {
    "language_code": "en-US",
    "transcripts": [
        {
            "transcript": "The amazon is the largest rainforest on the planet."
        }
    ],

Ein Konfidenzwert für jedes Wort im vorangegangenen transcript-Abschnitt .


"items": [
    {
        "start_time": "1.15",
        "end_time": "1.35",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "The"
            }
        ],
        "type": "pronunciation"
    },
    {
        "start_time": "1.35",
        "end_time": "2.05",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "amazon"
            }
        ],
        "type": "pronunciation"
    },

Ihre alternativen Transkriptionen befinden sich im segments-Teil Ihrer Transkriptionsausgabe. Die Alternativen für jedes Segment sind nach absteigendem Konfidenzwert geordnet.


"segments": [
            {
                "start_time": "1.04",
                "end_time": "5.065",
                "alternatives": [
                    {    
                ...
                        "transcript": "The amazon is the largest rain forest on the planet.",
                        "items": [
                            {
                             "start_time": "1.15",
                                "confidence": "1.0",
                                "end_time": "1.35",
                                "type": "pronunciation",
                                "content": "The"
                            },
                            ...
                            {
                                "start_time": "3.06",
                                "confidence": "0.0037",
                                "end_time": "3.38",
                                "type": "pronunciation",
                                "content": "rain"
                            },
                            {
                                "start_time": "3.38",
                                "confidence": "0.0037",
                                "end_time": "3.96",
                                "type": "pronunciation",
                                "content": "forest"
                            },

Ein Status am Ende der Transkriptionsausgabe.
```
"status": "COMPLETED"
}
```

Anforderung alternativer Transkriptionen

Mit dem AWS SDKs, oder können Sie alternative Transkriptionen anfordern. AWS CLIBeispiele finden Sie im Folgenden: AWS Management Console

Melden Sie sich an der AWS Management Console an.
Wählen Sie im Navigationsbereich Transkriptionsaufträge und dann Auftrag erstellen (oben rechts). Dies öffnet die Seite Auftragsdetails angeben.
Füllen Sie alle Felder aus, die Sie auf der Seite Auftragsdetails angeben möchten, und wählen Sie dann Weiter. Dadurch gelangen Sie zur Seite Auftrag konfigurieren – optional.

Wählen Sie Alternative Ergebnisse und geben Sie die maximale Anzahl der alternativen Transkriptionsergebnisse an, die Sie in Ihrem Transkript haben möchten.
Wählen Sie Auftrag erstellen, um Ihren Transkriptionsauftrag auszuführen.

In diesem Beispiel werden der start-transcription-jobBefehl und ShowAlternatives der Parameter verwendet. Weitere Informationen erhalten Sie unter StartTranscriptionJob und ShowAlternatives.

Beachten Sie, dass Sie, wenn Sie ShowAlternatives=true in Ihrer Anfrage angeben, auch MaxAlternatives angeben müssen.


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings ShowAlternatives=true,MaxAlternatives=4

Hier ist ein weiteres Beispiel, in dem der start-transcription-jobBefehl verwendet wird, und ein Anforderungstext, der alternative Transkriptionen enthält.


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-alt-transcription-job.json

Die Datei my-first-alt-transcription-job.json enthält den folgenden Anfragetext.


{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "ShowAlternatives": true,
        "MaxAlternatives": 4
   }
}

Im folgenden Beispiel werden alternative Transkriptionen mithilfe des AWS SDK for Python (Boto3)ShowAlternatives Arguments für die Methode start_transcription_job angefordert. Weitere Informationen erhalten Sie unter StartTranscriptionJob und ShowAlternatives.

Weitere Beispiele für die Verwendung der AWS SDKs, einschließlich funktionsspezifischer, szenarienspezifischer und dienstübergreifender Beispiele, finden Sie im Kapitel. Codebeispiele für Amazon Transcribe mit AWS SDKs

Beachten Sie, dass Sie, wenn Sie 'ShowAlternatives':True in Ihrer Anfrage angeben, auch MaxAlternatives angeben müssen.


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'ShowAlternatives':True, 
        'MaxAlternatives':4
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Identifizierung von Streaming-Sprachen

Verbesserung der Transkriptionsgenauigkeit