Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Kontingente in Amazon Polly
Amazon Polly wendet Kontingente auf den Kundenverkehr an, indem es übermäßige Anfragen ablehnt. Das Standardkontingent für SynthesizeSpeech
Anfragen mit Standardstimmen beträgt 80 Transaktionen pro Sekunde (tps) in einer einzigen Region für eine einzelne. AWS-Konto Wenn die Grenzwerte nicht erhöht würden und Sie 100 SynthesizeSpeech
Anfragen pro Sekunde mit einer Standardsprache generieren würden, wären 80 Anfragen pro Sekunde erfolgreich, und 20 Anfragen pro Sekunde würden von Amazon Polly gedrosselt. Diese Anfragen würden eine Antwort mit dem HTTP-Status 400 und einem entsprechenden Antwort-Header zurückgeben. ThrottlingException
Amazon Polly drosselt außerdem den Datenverkehr für alle Operationen auf der Grundlage der Anforderungsrate.
Beispiele für Einschränkungen bei der Sprachsynthese
-
Synthetisieren Sie die ersten 24 Buchstaben des englischen Alphabets Buchstabe für Buchstabe. Wenn die Synthese jedes Buchstabens weniger als 50 Millisekunden dauern würde, würde bei einem Operationslimit von acht Tps die Synthese von 24 Buchstaben mindestens drei Sekunden dauern. Während dieser Zeit könnten Sie bis zu acht Buchstaben pro Sekunde synthetisieren. Alle weiteren Anfragen würden gedrosselt. Da die Anfragen nur eine kurze Zeit dauern, würden sie ohne Überschneidung seriell synthetisiert.
-
Synthetisieren Sie 16 Textabsätze. Wenn jeder Absatz innerhalb von zwei Sekunden oder weniger synthetisiert und auf Kundenseite vollständig empfangen würde, würde die Synthetisierung aller 16 Artikel mindestens vier Sekunden dauern, bis alle 16 Artikel zusammengefasst sind. In der ersten Sekunde könnten Sie bis zu acht Anfragen starten. Bei gleichzeitigen Anfragen würde jeder Versuch, eine neue Synthese zu starten, aufgrund der Parallelitätsbegrenzung gedrosselt. Sie könnten die verbleibenden acht Absätze nach den ersten zwei Sekunden zusammenfassen, nachdem der erste Stapel von Anfragen abgeschlossen ist.
Beachten Sie bei der Verwendung von Amazon Polly die folgenden Beschränkungen.
Themen
Unterstützte -Regionen
Eine Liste der AWS Regionen, in denen Amazon Polly verfügbar ist, finden Sie unter Amazon Polly Endpoints and Quotas in der. Allgemeine Amazon Web Services-Referenz
-
Informationen zu Regionen, die generative Stimmen unterstützen, finden Sie unter Generative Stimmen.
-
Informationen zu Regionen, die Stimmen in Langform unterstützen, finden Sie unter Stimmen in Langform.
-
Informationen zu Regionen, die neuronale Stimmen unterstützen, finden Sie unter neuronale Kompatibilität mit Funktionen und Regionen TTS.
Kontingente und Drosselungsraten
In der folgenden Tabelle sind die Drosselungsraten pro Amazon Polly Polly-Vorgang definiert. Sie können den verwenden AWS Management Console , um bei Bedarf Kontingenterhöhungen für die einstellbaren Kontingente zu beantragen.
Operation |
Limit |
---|---|
Lexikon |
|
|
Beliebige 2 Transaktionen pro Sekunde (TPS) kombiniert von diesen Operationen. Maximal zulässige Steigerung von 4 TPS. |
Sprache |
|
|
80 TPS, bei einem Steigerungsmaximum von 100 TPS |
|
Generative Stimme: 8 Tips Langform-Stimme: 8 Tps mit einem Burst-Limit von 10 Tps Neuronale Stimme: 8 TPS mit einem Burst-Limit von 10 TPS Standardstimme: 80 TPS mit einem Burst-Limit von 100 TPS |
|
Generative Stimme: 1 Tps Langform-Stimme: 1 Tps Neuronale Stimme: 1 TPS Standardstimme: 10 TPS mit einem Burst-Limit von 12 TPS |
|
Zulässiges Maximum: 10 TPS insgesamt |
Gleichzeitige Anforderungen
Für generatives Sprechen unterstützt Amazon Polly bis zu 26 gleichzeitige Anfragen. Für Sprachanrufe in Langform unterstützt Amazon Polly bis zu 26 gleichzeitige Anfragen. Für neuronale Sprache unterstützt Amazon Polly 8 Tps mit einem Burst-Limit von 10 Tps für bis zu 18 gleichzeitige Anfragen. Amazon Polly unterstützt auch Limits für gleichzeitige Anfragen. Für Standardsprache unterstützt Amazon Polly 80 Tps für bis zu 80 gleichzeitige Anfragen.
Bewährte Methoden zur Minderung der Drosselung
-
Versuchen Sie erneut, Drosselungen mit Backoff und Jitter durchzuführen, damit Sie die Last über einen kurzen Zeitraum verteilen und unerwartete Auslastungsspitzen bewältigen können, ohne die Verfügbarkeit zu beeinträchtigen. AWS-Codebeispiel-Katalog ist in vielen Programmiersprachen bereits standardmäßig dafür konfiguriert. Einzelheiten finden Sie unter Verhalten bei Wiederholungsversuchen von Funktionen.
-
Verwenden Sie Amazon Polly Polly-Metriken. Amazon Polly veröffentlicht automatisch, um Ihre aktuelle Nutzung CloudWatch zu analysieren und das Nutzungswachstum zu prognostizieren.
Anmerkung
Bevor Sie eine Erhöhung des Kontingents beantragen (falls zutreffend), berechnen Sie Ihren TPS-Bedarf anhand der Richtlinien auf dieser Seite. Amazon Polly sichert nur die benötigten Rechenressourcen entsprechend der Kundennachfrage, um Ihre Kosten niedrig zu halten.
Lexika für die Aussprache
-
Pro Konto können maximal 100 Lexika gespeichert werden.
-
Als Lexikonname dürfen alphanumerische Zeichenfolgen mit maximal 20 Zeichen verwendet werden.
-
Jedes Lexikon kann bis zu 40.000 Zeichen groß sein. (Beachten Sie, dass die Größe des Lexikons die Latenz des SynthesizeSpeech Vorgangs beeinflusst.)
-
Sie dürfen je <phoneme>- oder <alias>-Ersatz in einem Lexikon maximal 100 Zeichen angeben.
Weitere Informationen zur Verwendung von Lexika finden Sie unter Verwaltung von Lexika.
SynthesizeSpeech API-Operationen
Beachten Sie bei der Schätzung der Nutzung vonSynthesizeSpeech
, dass die Wiedergabe des von Amazon Polly produzierten Audios, insbesondere für interaktive Anwendungen, in der Regel mindestens einige Sekunden dauert. Dadurch wird die Anzahl der Anfragen reduziertSynthesizeSpeech
, selbst bei einer großen Anzahl gleichzeitiger Nutzer. Darüber hinaus drosselt Amazon Polly SynthesizeSpeech
Anfragen nach der Anzahl der gleichzeitigen Anfragen, die es synthetisiert. Es gibt keine separate Einstellung für gleichzeitige Anfragen. Das Limit für gleichzeitige Anfragen entspricht immer der Anzahl der zulässigen TPs und wird entsprechend skaliert.
Beispielanwendung mit Kurzgeschichte. Sie können Amazon Polly verwenden, um eine Anwendung zu erstellen, die eine Reihe von Kurzgeschichten abspielt. Bei dieser Art von App würde die erste Geschichte abgespielt werden, dann die nächste usw., bis ein Benutzer die Anwendung beendet. Die Synthese jeder Geschichte würde etwa 0,5 Sekunden und das Abspielen 10 Sekunden dauern. In diesem Szenario könnten Sie damit rechnen, dass alle 10 Sekunden, SynthesizeSpeech
die der Kunde mit der Anwendung verbracht hat, ein Anruf eingeht. Dies würde einem Anruf pro Sekunde für jeweils 10 Kunden entsprechen, die die Anwendung gleichzeitig verwenden. Wenn Sie 1000 Kunden hätten, die die Anwendung gleichzeitig nutzen, könnten Sie mit einer durchschnittlichen Anrufrate SynthesizeSpeech
von nur 100 Transaktionen pro Sekunde rechnen.
Bei der Verwendung der API-Operation SynthesizeSpeech
gelten folgende Einschränkungen:
-
Der Eingabetext darf maximal 3 500 berechnete Zeichen enthalten (6 000 Zeichen insgesamt). SSML-Tags werden nicht als berechnete Zeichen gezählt.
-
Sie dürfen maximal fünf Lexika angeben, die auf den Eingabetext angewendet werden sollen.
-
Der Ausgabe-Audiostream (Synthese) ist auf 10 Minuten beschränkt. Danach wird jeglicher verbleibende Sprechtext abgeschnitten.
Weitere Informationen finden Sie unter SynthesizeSpeech.
Anmerkung
Einige Einschränkungen der API-Operation SynthesizeSpeech
können mit der API-Operation StartSythensizeSpeechTask
umgangen werden. Weitere Informationen finden Sie unter Lange Audiodateien.
SpeechSynthesisTask API-Operationen
Folgende Einschränkungen gelten bei der Verwendung der API-Operationen StartSpeechSynthesisTask
, GetSpeechSynthesisTask
und ListSpeechSynthesisTasks
:
-
Der Eingabetext darf maximal 100 000 kostenpflichtige Zeichen enthalten (200 000 Zeichen insgesamt). SSML-Tags werden nicht als berechnete Zeichen gezählt.
-
Sie dürfen maximal fünf Lexika angeben, die auf den Eingabetext angewendet werden sollen.
Speech Synthesis Markup Language (SSML)
Bei der Verwendung von SSML sind folgende Einschränkungen zu beachten:
-
Die Tags
<audio>
,<lexicon>
,<lookup>
und<voice>
werden nicht unterstützt. -
Elemente des Typs
<break>
dürfen jeweils maximal 10 Sekunden angeben. -
Das Tag
<prosody>
unterstützt für das Attribut "rate" keine niedrigeren Werte als –80 %.
Weitere Informationen finden Sie unter Sprache aus SSML Dokumenten generieren.