翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Chime SDKライブ文字起こしの使用
Amazon Chime のSDKライブ文字起こしを使用して、会議のライブユーザー属性の文字起こしを生成します。Amazon Chime SDKライブ文字起こしはAmazon Transcribe および Amazon Transcribe Medical サービスと統合され、進行中の Amazon Chime SDK会議の文字起こしを生成します。
Amazon Chime SDKライブ文字起こしは、マルチスピーカーシナリオの精度を向上させるために、各ユーザーのオーディオを個別に処理します。Amazon Chime は、アクティブなトーカーアルゴリズムSDKを使用して上位 2 つのアクティブなトーカーを選択し、そのオーディオを 1 つのストリームを介して別のチャネルで Amazon Transcribe に送信します。会議参加者は、Amazon Chime SDK データメッセージを介してユーザー属性の文字起こしを受け取ります。文字起こしは、字幕の表示、会議の文字起こしの作成、文字起こしを使用したコンテンツ分析など、さまざまな方法で使用できます。
ライブ文字起こしでは、会議の文字起こしを行っている間、Amazon Transcribe への 1 つのストリームを使用します。Amazon Transcribe および Amazon Transcribe Medical の標準コストが適用されます。詳細については、「Amazon Transcribe の料金
重要
デフォルトでは、Amazon Transcribe は、サービスAWS 利用規約
トピック
システムアーキテクチャ
Amazon Chime は、Amazon Transcribe または Amazon Transcribe Amazon Transcribe Medical アカウントとサービス側の統合を介して、音声が AWS ネットワークを離れることなく、リアルタイムの会議文字起こしSDKを作成します。精度を向上させるため、ユーザーの音声は個別に処理されてから、会議の音声に融合されます。Amazon Chime は、アクティブなトーカーアルゴリズムSDKを使用して上位 2 つのアクティブなトーカーを選択し、そのオーディオを 1 つのストリームを介して別のチャネルで Amazon Transcribe または Amazon Transcribe Medical に送信します。レイテンシーを低減するため、ユーザー属性付きの文字起こしは、データメッセージを介してすべての会議参加者に直接送信されます。メディアパイプラインを使用して会議の音声をキャプチャする場合、会議の文字起こし情報もキャプチャされます。
請求と使用状況
ライブ文字起こしでは、会議の文字起こしを行っている間、Amazon Transcribe または Amazon Transcribe Medical への 1 つのストリームを使用します。Amazon Transcribe および Amazon Transcribe Medical の標準コストが適用されます。詳細については、「Amazon Transcribe の料金
文字起こしパラメータ
Amazon Transcribe と Amazon Transcribe Medical は、ストリーミング文字起こしを開始するときに、次のような多くのパラメータAPIsを提供します。 StartStreamTranscription および StartMedicalStreamTranscription。 Amazon Chime がパラメータの値をSDK事前に決定StartMeetingTranscription
APIしない限り、 で t ホースパラメータを使用できます。例えば、Amazon Chime が自動的にSDK設定するため、 MediaEncoding
および MediaSampleRateHertz
パラメータは使用できません。
Amazon Transcribe と Amazon Transcribe Medical はパラメータを検証します。これにより、新しいパラメータ値が利用可能になりしだい、すぐにそれらを使用できるようになります。例えば、Amazon Transcribe Medical が新しい言語のサポートを開始した場合、必要なのは、LanguageCode
パラメータに新しい言語値を指定することだけです。