Usando a transcrição ao vivo do Amazon Chime SDK - Amazon Chime SDK

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usando a transcrição ao vivo do Amazon Chime SDK

Você usa a transcrição SDK ao vivo do Amazon Chime para gerar transcrições ao vivo atribuídas pelo usuário de suas reuniões. A transcrição SDK ao vivo do Amazon Chime se integra aos serviços Amazon Transcribe e Amazon Transcribe Medical para gerar transcrições das reuniões do Amazon Chime enquanto elas estão em andamento. SDK

A transcrição SDK ao vivo do Amazon Chime processa o áudio de cada usuário separadamente para melhorar a precisão em cenários com vários alto-falantes. O Amazon Chime SDK usa seu algoritmo de locutor ativo para selecionar os dois principais locutores ativos e, em seguida, envia o áudio para o Amazon Transcribe, em canais separados, por meio de um único stream. Os participantes da reunião recebem transcrições atribuídas pelo usuário por meio de mensagens de dados do Amazon Chime. SDK Você pode usar as transcrições de várias maneiras, como exibir legendas, criar transcrições de reuniões ou usar as transcrições para análise de conteúdo.

A transcrição ao vivo usa um stream para o Amazon Transcribe durante a transcrição da reunião. Aplicam-se os custos-padrão do Amazon Transcribe e do Amazon Transcribe Medical. Para obter mais informações, consulte os Preços do Amazon Transcribe. Em caso de dúvidas sobre uso ou cobrança, entre em contato com seu gerente de AWS conta.

Importante

Por padrão, o Amazon Transcribe pode usar e armazenar conteúdo de áudio processado pelo serviço para desenvolver e AWS melhorar os serviços de IA/ML, conforme descrito mais detalhadamente na seção 50 dos Termos de Serviço.AWS O uso do Amazon Transcribe pode estar sujeito às leis ou regulamentações federais e estaduais relacionadas à gravação ou interceptação de comunicações eletrônicas. É responsabilidade sua e de seus usuários finais cumprir todas as leis aplicáveis em relação à gravação, incluindo notificar adequadamente todos os participantes de uma sessão ou comunicação gravada de que a sessão ou comunicação está sendo gravada e obter todos os consentimentos necessários. Você pode optar por não AWS usar conteúdo de áudio para desenvolver e melhorar os serviços de AWS IA/ML configurando uma política de exclusão de serviços de IA usando o Organizations. AWS

Arquitetura do sistema

O Amazon Chime SDK cria transcrições de reuniões em tempo real, sem que o áudio saia da AWS rede, por meio de uma integração do lado do serviço com sua conta Amazon Transcribe ou Amazon Transcribe Medical. Para maior precisão, o áudio dos usuários é processado separadamente e depois misturado na reunião. O Amazon Chime SDK usa seu algoritmo de locutor ativo para selecionar os dois principais locutores ativos e, em seguida, envia o áudio para o Amazon Transcribe ou o Amazon Transcribe Medical em canais separados por meio de um único stream. Para reduzir a latência, as transcrições atribuídas pelo usuário são enviadas diretamente para cada participante da reunião por meio de mensagens de dados. Ao usar um canal de mídia para capturar o áudio da reunião, as informações de transcrição da reunião também são capturadas.

Um diagrama mostrando o fluxo de dados da transcrição da reunião.

Faturamento e uso

A transcrição ao vivo usa um stream para o Amazon Transcribe ou Amazon Transcribe Medical durante a transcrição da reunião. Aplicam-se os custos-padrão do Amazon Transcribe e do Amazon Transcribe Medical. Para obter mais informações, consulte os Preços do Amazon Transcribe. Em caso de dúvidas sobre uso ou cobrança, entre em contato com seu gerente de AWS conta.

Parâmetros de transcrição

O Amazon Transcribe e o Amazon Transcribe APIs Medical oferecem vários parâmetros ao iniciar a transcrição de streaming, como StartStreamTranscription e StartMedicalStreamTranscription. Você pode usar esses parâmetros no, a StartMeetingTranscription API menos que o Amazon Chime SDK predetermine o valor do parâmetro. Por exemplo, os MediaSampleRateHertz parâmetros MediaEncoding e não estão disponíveis porque o Amazon Chime os SDK define automaticamente.

O Amazon Transcribe e o Amazon Transcribe Medical validam os parâmetros, o que permite que você use novos valores de parâmetros assim que estiverem disponíveis. Por exemplo, se o Amazon Transcribe Medical lançar o suporte para um novo idioma, você só precisará especificar o valor do novo idioma no parâmetro LanguageCode.