Best Practices Umgang mit LimitExceededException Fehlern

Transkribieren gestreamter Audiodaten

Mithilfe von Amazon Transcribe Streaming können Sie in Echtzeit Transkriptionen für Ihre Medieninhalte erstellen. Im Gegensatz zu Batch-Transkriptionen, bei denen Mediendateien hochgeladen werden, werden Streaming-Medien in Echtzeit übertragen. Amazon Transcribe Amazon Transcribe gibt dann ein Transkript zurück, ebenfalls in Echtzeit.

Streaming kann sowohl aufgezeichnete Medien (Filme, Musik und Podcasts) als auch Echtzeitmedien (Live-Nachrichtensendungen) umfassen. Zu den häufigsten Streaming-Anwendungsfällen Amazon Transcribe gehören Live-Untertitel für Sportveranstaltungen und die Echtzeitüberwachung von Callcenter-Audio.

Streaming-Inhalte werden in Form von aufeinanderfolgenden Datenpaketen oder „Chunks“ geliefert, die Amazon Transcribe sofort transkribiert. Zu den Vorteilen von Streaming gegenüber Batchverarbeitung gehören Echtzeit-Sprache-zu-Text-Funktionen in Ihren Anwendungen und schnellere Transkriptionszeiten. Diese höhere Geschwindigkeit kann jedoch in einigen Fällen zu Einschränkungen bei der Genauigkeit führen.

Amazon Transcribe bietet die folgenden Optionen für das Streaming:

Um Streaming-Audio im zu transkribieren AWS-Managementkonsole, sprechen Sie in das Mikrofon Ihres Computers.

Tipp

SDK-Codebeispiele finden Sie im AWS Samples-Repository unter. GitHub

Folgende Audioformate werden für Streaming-Transkriptionen unterstützt:

FLAC
OPUS-encoded Audio in einem Ogg-Container
PCM (nur signierte 16-Bit Little-Endian-Audioformate, die WAV nicht enthalten)

Verlustfreie Formate (FLAC oder PCM) werden empfohlen.

Anmerkung

Streaming-Transkriptionen werden nicht in allen Sprachen unterstützt. Einzelheiten finden Sie in der Spalte „Dateneingabe“ in der Tabelle „Unterstützte Sprachen“.

Informationen zur Verfügbarkeit von Streaming-Transkriptionen in der Amazon Transcribe Region finden Sie unter: Amazon Transcribe Endpunkte und Kontingente.

Best Practices

Die folgenden Empfehlungen verbessern die Effizienz der Streaming-Transkription:

Verwenden Sie nach Möglichkeit Audio. PCM-encoded
Stellen Sie sicher, dass Ihr Stream so nah wie möglich an Echtzeit ist.
Die Latenzzeit hängt von der Größe der Audio-Blöcke ab. Wenn Sie bei Ihrem Audiotyp (z. B. PCM) die Möglichkeit haben, die Chunk-Größe anzugeben, stellen Sie jeden Chunk auf einen Wert zwischen 50 ms und 200 ms ein. Sie können die Größe des Audio-Chunks mit der folgenden Formel berechnen:
```
chunk_size_in_bytes = chunk_duration_in_millisecond / 1000 * audio_sample_rate * 2
```
Verwenden Sie eine einheitliche Chunk-Größe.
Stellen Sie sicher, dass Sie die Anzahl der Audiokanäle korrekt angeben.
Bei einkanaligem PCM-Audio besteht jedes Sample aus zwei Bytes, sodass jeder Chunk aus einer geraden Anzahl von Bytes bestehen sollte.
Bei Zweikanal-PCM-Audio besteht jedes Sample aus vier Bytes, sodass jeder Chunk ein Vielfaches von 4 Bytes sein sollte.
Wenn Ihr Audiostream keine Sprache enthält, kodieren und senden Sie die gleiche Menge an Stille. So ist beispielsweise Stille bei PCM ein Stream von null Bytes.
Vergewissern Sie sich, dass Sie die richtige Abtastrate für Ihr Audiomaterial angeben. Nehmen Sie nach Möglichkeit mit einer Abtastrate von 16.000 Hz auf; dies ist der beste Kompromiss zwischen Qualität und Datenmenge, die über das Netzwerk übertragen wird. Beachten Sie, dass die meisten High-End-Mikrofone mit 44.100 Hz oder 48.000 Hz aufnehmen.

Umgang mit LimitExceededException Fehlern

Verfügt wie jedes verteilte System Amazon Transcribe über Schutzmechanismen, die einen übermäßigen Ressourcenverbrauch erkennen und entsprechend reagieren. LimitExceededExceptionFehler können auftreten, wenn einer dieser Mechanismen ausgelöst wird. Für diesen Fehler gibt es drei unterschiedliche Ursachen:

Das Kontingent für den gleichzeitigen Stream-Service wurde überschritten: Dies ist die häufigste Ursache. Sie tritt auf, wenn Sie Ihr Kontingent für den gleichzeitigen Stream-Service überschreiten. Um diesen Fehler zu beheben, versuchen Sie es erneut mit exponentiellem Backoff. Wenn Sie dieses Limit ständig erreichen, fordern Sie über die Service Quota-Konsole eine Erhöhung der Service Quotas an. Sie können sich auch an das AWS Support Center wenden, um Unterstützung zu erhalten. Weitere Informationen zu Wiederholungsstrategien finden Sie unter Verhalten bei Wiederholungsversuchen im Referenzhandbuch für AWS SDKs und Tools.
Die maximale Sitzungsdauer wurde überschritten: Dieser Fehler tritt auf, wenn ein Stream die maximal zulässige Sitzungsdauer überschreitet. Dies ist ein fester Grenzwert, der nicht erhöht werden kann. Um mit dem Transkribieren fortzufahren, starten Sie eine neue Streaming-Sitzung.
Die Anzahl der gleichzeitigen Streams ist zu schnell gestiegen: Dies ist eine seltene Ursache. Dies kann auftreten, wenn Sie die Anzahl der gleichzeitigen Streams zu schnell erhöhen, z. B. bei Auslastungstests. Dabei handelt es sich um einen Schutzmechanismus auf Systemebene ohne einstellbares Kontingent. Um diesen Fehler zu beheben, versuchen Sie es erneut mit exponentiellem Backoff und erhöhen Sie schrittweise die Anzahl gleichzeitiger Streams. Weitere Informationen zu Wiederholungsstrategien finden Sie unter Wiederholungsverhalten im Referenzhandbuch für SDKs und Tools.AWS Sie können auch AWS re:POST besuchen oder den AWS Premium-Support kontaktieren.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Transkribieren mit HTTP oder WebSockets

Streaming und Teilergebnisse