Dateneingabe und -ausgabe - Amazon Transcribe

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Dateneingabe und -ausgabe

Amazon Transcribe nimmt Audiodaten als Mediendatei in einem Amazon S3 Bucket oder als Medienstream auf und konvertiert sie in Textdaten.

Wenn Sie Mediendateien transkribieren, die in einem Amazon S3 Bucket gespeichert sind, führen Sie Batch-Transkriptionen durch. Wenn Sie Medien-Streams transkribieren, führen Sie Streaming-Transkriptionen durch. Für diese beiden Verfahren gelten unterschiedliche Regeln und Anforderungen.

Bei Batch-Transkriptionen können Sie AuftragswarteschlangenWarteschlange tesch verwenden, wenn Sie nicht alle Ihre Transkriptionsaufträge gleichzeitig bearbeiten müssen. Auf diese Weise können Amazon Transcribe Sie Ihre Transkriptionsaufträge verfolgen und sie bearbeiten, wenn Slots verfügbar sind.

Anmerkung

Amazon Transcribe kann Ihre Inhalte vorübergehend speichern, um die Qualität seiner Analysemodelle kontinuierlich zu verbessern. Weitere Informationen finden Sie unter. Amazon Transcribe FAQ Um die Löschung von Inhalten zu beantragen, die möglicherweise von gespeichert wurden Amazon Transcribe, öffnen Sie einen Fall mit AWS Support.

Medienformate

Die unterstützten Medientypen unterscheiden sich zwischen Batch-Transkriptionen und Streaming-Transkriptionen, wobei verlustfreie Formate für beide empfohlen werden. Einzelheiten sind der folgenden Tabelle zu entnehmen:

Stapel

Streaming

Unterstützte Formate

  • AMR

  • FLAC

  • M4A

  • MP3

  • MP4

  • ogg

  • WebM

  • WAV

  • FLAC

  • Ogg Opus

  • PCMKodierung

Empfohlene Formate

  • FLAC

  • WAVmit PCM 16-Bit-Kodierung

  • FLAC

  • PCMsigniertes 16-Bit-Little-Endian-Audio (beachten Sie, dass dies nicht beinhaltet) WAV

Die besten Ergebnisse erzielen Sie, wenn Sie ein verlustfreies Format verwenden, z. B. FLAC oder mit 16-Bit-Kodierung. WAV PCM

Anmerkung

Streaming-Transkriptionen werden nicht in allen Sprachen unterstützt. Einzelheiten finden Sie in der Spalte „Dateneingabe“ in der Tabelle „Unterstützte Sprachen“.

Audiokanäle

Amazon Transcribe unterstützt Einkanal- und Zweikanal-Medien. Medien mit mehr als zwei Kanälen werden derzeit nicht unterstützt.

Wenn Ihr Audiomaterial mehrere Sprecher auf einem Kanal enthält und Sie die einzelnen Sprecher in Ihrer Transkriptionsausgabe partitionieren und beschriften möchten, können Sie die Sprecherpartitionierung (Diarisierung) verwenden.

Wenn Ihr Audiomaterial Sprache auf zwei separaten Kanälen enthält, können Sie die Kanalidentifikation verwenden, um jeden Kanal separat in Ihrem Transkript zu transkribieren.

Beide Optionen erzeugen eine einzige Transkriptionsdatei.

Anmerkung

Wenn Sie die Sprecherpartitionierung oder die Kanalidentifizierungnicht aktivieren, wird Ihr Transkripttext als ein durchgehender Abschnitt bereitgestellt.

Samplerate

Bei Batch-Transkriptionsaufträgen können Sie eine Samplerate angeben, dieser Parameter ist jedoch optional. Wenn Sie dies in Ihrer Anfrage angeben, vergewissern Sie sich, dass der von Ihnen angegebene Wert mit der tatsächlichen Samplerate in Ihrem Audiomaterial übereinstimmt. Wenn Sie eine Samplerate angeben, die nicht zu Ihrem Audiomaterial passt, kann Ihr Auftrag fehlschlagen.

Bei Streaming-Transkriptionen müssen Sie in Ihrem Antrag eine Samplerate angeben. Wie bei Batch-Transkriptionsaufträgen müssen Sie sicherstellen, dass der von Ihnen angegebene Wert mit der tatsächlichen Samplerate in Ihrem Audio übereinstimmt.

Sampleraten für Low-Fidelity-Audio, wie z. B. Telefonaufnahmen, verwenden normalerweise 8.000 Hz. Amazon Transcribe Unterstützt Werte zwischen 16.000 Hz und 48.000 Hz für Hi-Fidelity-Audio.

Output

Die Transkriptionsausgabe erfolgt im Format. JSON Der erste Teil Ihrer Abschrift enthält das eigentliche Transkript in Absatzform, gefolgt von zusätzlichen Daten für jedes Wort und Satzzeichen. Die bereitgestellten Daten hängen von den Features ab, die Sie in Ihrer Anfrage angeben. Ihr Transkript enthält mindestens die Startzeit, die Endzeit und den Konfidenzwert für jedes Wort. Der folgende Abschnitt zeigt ein Beispiel für die Ausgabe einer einfachen Transkriptionsanfrage, die keine zusätzlichen Optionen oder Features enthielt.

Alle Batch-Transkripte werden in Amazon S3 Buckets gespeichert. Sie können wählen, ob Sie Ihr Transkript in Ihrem eigenen Amazon S3 Bucket speichern oder einen sicheren Standard-Bucket Amazon Transcribe verwenden möchten. Weitere Informationen zum Erstellen und Verwenden von Amazon S3 -Buckets finden Sie unter Arbeiten mit Buckets.

Wenn Sie möchten, dass Ihr Transkript in einem Amazon S3 Bucket gespeichert wird, den Sie besitzen, geben Sie die Buckets URI in Ihrer Transkriptionsanfrage an. Stellen Sie sicher, dass Sie Amazon Transcribe Schreibberechtigungen für diesen Bucket erteilen, bevor Sie mit der Batch-Transkription beginnen. Wenn Sie Ihren eigenen Eimer angeben, verbleibt Ihr Transkript in diesem Bucket, bis Sie es entfernen.

Wenn Sie keinen Amazon S3 Bucket angeben, Amazon Transcribe verwendet es einen sicheren, vom Service verwalteten Bucket und stellt Ihnen einen temporären Bucket zur Verfügung, den URI Sie zum Herunterladen Ihres Transkripts verwenden können. Beachten Sie, dass temporäre URIs Dateien 15 Minuten lang gültig sind. Wenn Sie bei der Verwendung der bereitgestellten Informationen eine AccessDenied Fehlermeldung erhaltenURI, GetTranscriptionJob fordern Sie eine neue temporäre Datei URI für Ihr Transkript an.

Wenn Sie sich für einen Standard-Bucket entscheiden, wird Ihr Transkript gelöscht, wenn Ihr Auftrag abläuft (90 Tage). Wenn Sie Ihr Transkript nach diesem Ablaufdatum aufbewahren möchten, müssen Sie es herunterladen.

Streaming-Transkripte werden über dieselbe Methode zurückgegeben, die Sie für Ihren Stream verwenden.

Tipp

Wenn Sie Ihre JSON Ausgabe in ein turn-by-turn Transkript im Word-Format konvertieren möchten, sehen Sie sich dieses GitHub Beispiel an (für Python3). Dieses Skript funktioniert mit Protokollen von Analyse nach Anrufen und Standard-Batch-Protokollen mit aktivierter Diarisierung.

Beispielausgabe

Transkripte bieten eine vollständige Transkription in Absatzform, gefolgt von einer word-for-word Aufschlüsselung, die Daten für jedes Wort und jedes Satzzeichen enthält. Dazu gehören die Startzeit, die Endzeit, ein Vertrauenswert und ein Typ (pronunciation oder punctuation).

Das folgende Beispiel stammt von einem einfachen Batch-Transkriptionsauftrag, der keine zusätzlichen Features enthielt. Mit jedem zusätzlichen Feature, die Sie auf Ihre Transkriptionsanfrage anwenden, erhalten Sie zusätzliche Daten in Ihrer Transkriptionsausgabedatei.

Einfache Batch-Transkripte enthalten zwei Hauptabschnitte:

  1. transcripts: enthält das gesamte Transkript in einem Textblock.

  2. items: Enthält Informationen zu jedem Wort und Satzzeichen aus dem transcripts-Abschnitt.

  3. audio_segments: Ein Audiosegment ist ein bestimmter Teil einer Audioaufnahme, der ununterbrochen gesprochene Sprache mit minimalen Pausen oder Unterbrechungen enthält. Dieses Segment erfasst einen natürlichen Sprachfluss und wird audio_segments mit einer Start- und Endzeit aufgenommen. Das items Element innerhalb eines Audiosegments ist eine Folge von Kennungen, die jedem Element innerhalb des Segments entsprechen.

Jedes zusätzliche Feature, das Sie in Ihre Transkriptionsanfrage aufnehmen, führt zu zusätzlichen Informationen in Ihrem Transkript.

{ "jobName": "my-first-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "Welcome to Amazon Transcribe." } ], "items": [ { "id": 0, "start_time": "0.64", "end_time": "1.09", "alternatives": [ { "confidence": "1.0", "content": "Welcome" } ], "type": "pronunciation" }, { "id": 1, "start_time": "1.09", "end_time": "1.21", "alternatives": [ { "confidence": "1.0", "content": "to" } ], "type": "pronunciation" }, { "id": 2, "start_time": "1.21", "end_time": "1.74", "alternatives": [ { "confidence": "1.0", "content": "Amazon" } ], "type": "pronunciation" }, { "id": 3, "start_time": "1.74", "end_time": "2.56", "alternatives": [ { "confidence": "1.0", "content": "Transcribe" } ], "type": "pronunciation" }, { "id": 4, "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ], "audio_segments": [ { "id": 0, "transcript": "Welcome to Amazon Transcribe.", "start_time": "0.64", "end_time": "2.56", "items": [ 0, 1, 2, 3, 4 ] } ] }, "status": "COMPLETED" }