轉錄串流音訊

使用 Amazon Transcribe 串流，您可以為媒體內容產生即時轉錄。與涉及上傳媒體檔案的批次轉錄不同，串流媒體會 Amazon Transcribe 即時交付至。 Amazon Transcribe 然後也會即時傳回文字記錄。

串流媒體可以包括預先錄製的媒體 (電影、音樂和播客) 和即時媒體 (實況新聞廣播)。的常見串流使用案例 Amazon Transcribe 包括運動賽事的即時隱藏式字幕，以及呼叫中心音訊的即時監控。

串流內容會以一系列連續資料封包或 Amazon Transcribe 即時轉錄的「區塊」形式提供。批次使用串流的優點包括應用程式中的即時語音轉文字功能，以及更快的轉錄時間。但是，在某些情況下，轉錄速度加快可能導致準確性有限。

Amazon Transcribe 提供下列串流選項：

若要轉錄中的串流音訊 AWS Management Console，請對著電腦麥克風說話。

如需 SDK 程式碼範例，請參閱 GitHub 上的AWS 範例儲存庫。

串流轉錄支援的音訊格式為：

建議使用無失真格式 (FLAC 或 PCM)。

並非所有語言都支援串流轉錄。請參閱支援語言表格中的「資料輸入」欄，了解詳細資訊。

若要檢視串流轉錄 Amazon Transcribe 的區域可用性，請參閱：Amazon Transcribe 端點和配額。

最佳實務

以下建議可提高串流轉錄效率：

如果可能，請使用 PCM 編碼的音訊。
確保您的串流盡可能即時取得。
延遲需視音訊塊的大小。如果您可以依據音訊類型 (例如 PCM) 指定塊大小，請將每塊設定為 50 ms 和 200 ms 間。您可以利用下列公式計算音訊區塊大小：
```
chunk_size_in_bytes = chunk_duration_in_millisecond / 1000 * audio_sample_rate * 2
```
使用統一的塊大小。
確保您正確指定音訊聲道的數量。
對於單聲道 PCM 音訊，每個樣本由兩個位元組組成，因此每個塊應由偶數位元組組成。
對於雙聲道 PCM 音訊，每個樣本由四個位元組組成，因此每個塊應該是 4 個位元組的倍數。
您的音訊串流不包含語音時，請編碼並傳送相同數量的靜音。例如，PCM 的靜音是零位元組的串流。
請務必為您的音訊指定正確的取樣率。如果可能，請以 16,000 Hz 的取樣率錄製；在品質和透過網路傳送的資料量間取得最佳平衡。請注意，多數高階麥克風的錄音速度為 44,100 Hz 或 48,000 Hz。

如同任何分散式系統， Amazon Transcribe 具有可偵測資源過度使用並據此做出反應的保護機制。觸發其中一個機制時，可能會發生LimitExceededException錯誤。此錯誤有三種不同的原因：

超過並行串流服務配額: 這是最常見的原因。當您超過並行串流服務配額時，就會發生這種情況。若要解決此錯誤，請使用指數退避重試。如果您持續達到此限制，請透過 Service Service Quotas配額。您也可以聯絡 AWS Support Center 尋求協助。如需重試策略的詳細資訊，請參閱 AWS SDKs和工具參考指南中的重試行為。
超過工作階段持續時間上限: 當串流超過允許的工作階段持續時間上限時，就會發生此錯誤。這是無法提高的硬性限制。若要繼續轉錄，請啟動新的串流工作階段。
並行串流數目增加過快: 這是罕見的原因。如果您太快增加並行串流的數量，例如在負載測試期間，就會發生這種情況。這是沒有可調整配額的系統層級保護機制。若要解決此錯誤，請使用指數退避重試，並逐漸增加並行串流的數量。如需重試策略的詳細資訊，請參閱 AWS SDKs和工具參考指南中的重試行為。您也可以造訪 AWS re：Post 或聯絡 AWS Premium Support。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

使用 HTTP 或 WebSockets 進行轉錄

串流和部分結果