As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usando a transcrição ao vivo do Amazon Chime SDK
Você usa a transcrição SDK ao vivo do Amazon Chime para gerar transcrições ao vivo atribuídas pelo usuário de suas reuniões. A transcrição SDK ao vivo do Amazon Chime se integra aos serviços Amazon Transcribe e Amazon Transcribe Medical para gerar transcrições das reuniões do Amazon Chime enquanto elas estão em andamento. SDK
A transcrição SDK ao vivo do Amazon Chime processa o áudio de cada usuário separadamente para melhorar a precisão em cenários com vários alto-falantes. O Amazon Chime SDK usa seu algoritmo de locutor ativo para selecionar os dois principais locutores ativos e, em seguida, envia o áudio para o Amazon Transcribe, em canais separados, por meio de um único stream. Os participantes da reunião recebem transcrições atribuídas pelo usuário por meio de mensagens de dados do Amazon Chime. SDK Você pode usar as transcrições de várias maneiras, como exibir legendas, criar transcrições de reuniões ou usar as transcrições para análise de conteúdo.
A transcrição ao vivo usa um stream para o Amazon Transcribe durante a transcrição da reunião. Aplicam-se os custos-padrão do Amazon Transcribe e do Amazon Transcribe Medical. Para obter mais informações, consulte os Preços do Amazon Transcribe
Importante
Por padrão, o Amazon Transcribe pode usar e armazenar conteúdo de áudio processado pelo serviço para desenvolver e AWS melhorar os serviços de IA/ML, conforme descrito mais detalhadamente na seção 50 dos Termos de Serviço.AWS
Tópicos
Arquitetura do sistema
O Amazon Chime SDK cria transcrições de reuniões em tempo real, sem que o áudio saia da AWS rede, por meio de uma integração do lado do serviço com sua conta Amazon Transcribe ou Amazon Transcribe Medical. Para maior precisão, o áudio dos usuários é processado separadamente e depois misturado na reunião. O Amazon Chime SDK usa seu algoritmo de locutor ativo para selecionar os dois principais locutores ativos e, em seguida, envia o áudio para o Amazon Transcribe ou o Amazon Transcribe Medical em canais separados por meio de um único stream. Para reduzir a latência, as transcrições atribuídas pelo usuário são enviadas diretamente para cada participante da reunião por meio de mensagens de dados. Ao usar um canal de mídia para capturar o áudio da reunião, as informações de transcrição da reunião também são capturadas.
Faturamento e uso
A transcrição ao vivo usa um stream para o Amazon Transcribe ou Amazon Transcribe Medical durante a transcrição da reunião. Aplicam-se os custos-padrão do Amazon Transcribe e do Amazon Transcribe Medical. Para obter mais informações, consulte os Preços do Amazon Transcribe
Parâmetros de transcrição
O Amazon Transcribe e o Amazon Transcribe APIs Medical oferecem vários parâmetros ao iniciar a transcrição de streaming, como StartStreamTranscription e StartMedicalStreamTranscription. Você pode usar esses parâmetros no, a StartMeetingTranscription
API menos que o Amazon Chime SDK predetermine o valor do parâmetro. Por exemplo, os MediaSampleRateHertz
parâmetros MediaEncoding
e não estão disponíveis porque o Amazon Chime os SDK define automaticamente.
O Amazon Transcribe e o Amazon Transcribe Medical validam os parâmetros, o que permite que você use novos valores de parâmetros assim que estiverem disponíveis. Por exemplo, se o Amazon Transcribe Medical lançar o suporte para um novo idioma, você só precisará especificar o valor do novo idioma no parâmetro LanguageCode
.