Amazon Chime SDKライブ文字起こしの使用 - Amazon Chime SDK

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon Chime SDKライブ文字起こしの使用

Amazon Chime のSDKライブ文字起こしを使用して、会議のライブユーザー属性の文字起こしを生成します。Amazon Chime SDKライブ文字起こしはAmazon Transcribe および Amazon Transcribe Medical サービスと統合され、進行中の Amazon Chime SDK会議の文字起こしを生成します。

Amazon Chime SDKライブ文字起こしは、マルチスピーカーシナリオの精度を向上させるために、各ユーザーのオーディオを個別に処理します。Amazon Chime は、アクティブなトーカーアルゴリズムSDKを使用して上位 2 つのアクティブなトーカーを選択し、そのオーディオを 1 つのストリームを介して別のチャネルで Amazon Transcribe に送信します。会議参加者は、Amazon Chime SDK データメッセージを介してユーザー属性の文字起こしを受け取ります。文字起こしは、字幕の表示、会議の文字起こしの作成、文字起こしを使用したコンテンツ分析など、さまざまな方法で使用できます。

ライブ文字起こしでは、会議の文字起こしを行っている間、Amazon Transcribe への 1 つのストリームを使用します。Amazon Transcribe および Amazon Transcribe Medical の標準コストが適用されます。詳細については、「Amazon Transcribe の料金」を参照してください。使用量や請求に関するご質問は、 AWS アカウントマネージャーにお問い合わせください。

重要

デフォルトでは、Amazon Transcribe は、サービスAWS 利用規約 のセクション 50 で詳しく説明されているように、サービスによって処理されたオーディオコンテンツを使用して保存し、 AWS AI/ML サービスを開発および改善する場合があります。Amazon Transcribe の使用は、電子通信記録または傍受に関する連邦および州の法律または規制の対象となる場合があります。録音に関するすべての適用法を遵守することは、お客様とそのエンドユーザーの責任です。これには、録音セッションまたは通信のすべての参加者にセッションまたは通信が録音されていることを適切に通知し、必要なすべての同意を得ることを含みます。Organizations を使用して AWS AI サービスのオプトアウトポリシーを設定することで、オーディオコンテンツ AWS を使用して AI/ML AWS サービスを開発および改善することをオプトアウトできます。

システムアーキテクチャ

Amazon Chime は、Amazon Transcribe または Amazon Transcribe Amazon Transcribe Medical アカウントとサービス側の統合を介して、音声が AWS ネットワークを離れることなく、リアルタイムの会議文字起こしSDKを作成します。精度を向上させるため、ユーザーの音声は個別に処理されてから、会議の音声に融合されます。Amazon Chime は、アクティブなトーカーアルゴリズムSDKを使用して上位 2 つのアクティブなトーカーを選択し、そのオーディオを 1 つのストリームを介して別のチャネルで Amazon Transcribe または Amazon Transcribe Medical に送信します。レイテンシーを低減するため、ユーザー属性付きの文字起こしは、データメッセージを介してすべての会議参加者に直接送信されます。メディアパイプラインを使用して会議の音声をキャプチャする場合、会議の文字起こし情報もキャプチャされます。

会議の文字起こしのデータフローを示す図。

請求と使用状況

ライブ文字起こしでは、会議の文字起こしを行っている間、Amazon Transcribe または Amazon Transcribe Medical への 1 つのストリームを使用します。Amazon Transcribe および Amazon Transcribe Medical の標準コストが適用されます。詳細については、「Amazon Transcribe の料金」を参照してください。使用量や請求に関するご質問は、 AWS アカウントマネージャーにお問い合わせください。

文字起こしパラメータ

Amazon Transcribe と Amazon Transcribe Medical は、ストリーミング文字起こしを開始するときに、次のような多くのパラメータAPIsを提供します。 StartStreamTranscription および StartMedicalStreamTranscription。 Amazon Chime がパラメータの値をSDK事前に決定StartMeetingTranscriptionAPIしない限り、 で t ホースパラメータを使用できます。例えば、Amazon Chime が自動的にSDK設定するため、 MediaEncoding および MediaSampleRateHertzパラメータは使用できません。

Amazon Transcribe と Amazon Transcribe Medical はパラメータを検証します。これにより、新しいパラメータ値が利用可能になりしだい、すぐにそれらを使用できるようになります。例えば、Amazon Transcribe Medical が新しい言語のサポートを開始した場合、必要なのは、LanguageCode パラメータに新しい言語値を指定することだけです。