Speak

Modo de foco

Speak - SDK do Amazon Chime

Usar o Speak action Manuseio ACTION_SUCCESSFUL eventos Manuseio ACTION_FAILED eventos Fluxos de programas

Você pode reproduzir a fala em qualquer trecho de chamada fornecendo texto. Você pode usar texto sem formatação ou Speech Synthesis Markup Language (SSML). O SSML fornece mais controle sobre como o SDK do Amazon Chime gera fala adicionando pausas, enfatizando determinadas palavras ou alterando o estilo de fala.

O Amazon Chime SDK usa o serviço Amazon Polly para converter. text-to-speech O Amazon Polly permite que você escolha entre o mecanismo-padrão ou neural para melhorar a qualidade da fala. O Amazon Polly oferece suporte a mais de 20 idiomas e 60 vozes para personalizar a experiência do usuário do seu aplicativo. O SDK do Amazon Chime fornece atributos de fala gratuitamente, mas você paga pelo uso do Amazon Polly. Consulte a página de preços do Amazon Polly ou seu painel de cobrança para obter informações sobre preços.

Importante

O uso do Amazon Polly está sujeito aos Termos de Serviço da AWS, incluindo os termos específicos dos Serviços de Machine Learning e Inteligência Artificial.

Usar o Speak action

O exemplo a seguir mostra um uso típico da ação Speak.


{
    "SchemaVersion": "1.0",
    "Actions":[
        {
            "Type": "Speak",
            "Parameters": {
                "Text": "Hello, World!",        // required
                "CallId": "call-id-1",          // required
                "Engine": "neural",             // optional. Defaults to standard
                "LanguageCode": "en-US",        // optional
                "TextType": "text",             // optional
                "VoiceId": "Joanna"             // optional. Defaults to Joanna
            }
        }
    ]
}

CallId

Descrição – O CallId do participante no CallDetails da invocação da função do Lambda

Valores permitidos: um ID de chamada válido

Obrigatório – Sim

Valor-padrão: nenhum

Text

Descrição – Especifica o texto de entrada a ser sintetizado em fala. Se você especificar ssml como TextType, siga o formato SSML para o texto de entrada.

Valores permitidos: string

Obrigatório – Sim

Valor-padrão: nenhum

Engine

Descrição – Especifica o mecanismo – padrão ou neural – a ser usado ao processar texto para síntese de fala.

Valores permitidos: standard | neural

Obrigatório – Não

Valor-padrão: padrão

LanguageCode

Descrição – Especifica o código do idioma. Apenas necessário se estiver usando uma voz bilíngue. Se você usar uma voz bilíngue sem especificar um código de idioma, o idioma-padrão da voz bilíngue é usado.

Valores permitidos: Códigos de idioma do Amazon Polly

Obrigatório – Não

Valor-padrão: nenhum

TextType

Descrição – Especifica o tipo de texto de entrada, texto sem formatação ou SSML. Se um tipo de entrada não for especificado, o texto sem formatação será usado como padrão. Para obter mais informações sobre SSML, consulte Como gerar fala a partir de documentos SSML no Guia do desenvolvedor do Amazon Polly.

Valores permitidos: ssml | text

Obrigatório – Não

Valor-padrão: nenhum

VoiceId

Descrição – Especifica o ID da voz que você deseja usar.

Valores permitidos — Amazon Polly voice IDs

Obrigatório – Não

Valor-padrão: Joanna

Manuseio ACTION_SUCCESSFUL eventos

O exemplo a seguir mostra um evento ACTION_SUCCESSFUL típico para uma ação que sintetiza o texto "Hello World" em fala, em inglês, usando a voz Joanna do Amazon Polly.


{
    "SchemaVersion": "1.0",
    "Sequence": 3,
    "InvocationEventType": "ACTION_SUCCESSFUL",
    "ActionData": {
       "Type": "Speak",
       "Parameters": {
          "CallId": "call-id-1",          
          "Engine":  "neural",             
          "LanguageCode":  "en-US",        
          "Text": "Hello World",          
          "TextType":  "text",             
          "VoiceId":  "Joanna"        
       }
    },
    "CallDetails":{       
       ...
    }
}

Manuseio ACTION_FAILED eventos

O exemplo a seguir mostra um evento ACTION_FAILED típico para o mesmo evento usado no exemplo anterior.


{
    "SchemaVersion": "1.0",
    "Sequence":2,
    "InvocationEventType": "ACTION_FAILED",
    "ActionData":{
       "Type": "Speak",
       "Parameters": {
          "CallId": "call-id-1",          
          "Engine":  "neural",             
          "LanguageCode":  "en-US",        
          "Text": "Hello  World",          
          "TextType":  "text",             
          "VoiceId":  "Joanna"        
       },
       "ErrorType": "SystemException",
       "ErrorMessage": "System error while running  action"
    },
    "CallDetails":{       
       ...
    }
}

Gerenciamento de erros

Essa tabela lista e descreve as mensagens de erro geradas pela ação Speak.

Erro	Mensagem	Motivo
`AccessDenied`	A função vinculada ao serviço `AWSServiceRoleForAmazonChimeVoiceConnector` não está configurada corretamente.	A função vinculada ao serviço usada para fazer solicitações ao Amazon Polly não existe ou há permissões ausentes. Para resolver, consulte as etapas na seção Como usar a função vinculada ao serviço do conector de voz do SDK do Amazon Chime
`InvalidActionParameter`		Houve um erro ao validar os parâmetros da ação. Consulte a SynthesizeSpeech API no Amazon Polly Developer Guide para obter mais informações sobre parâmetros.
`ActionExecutionThrottled`	O Amazon Polly está controlando a utilização da solicitação para sintetizar a fala.	A solicitação para o Amazon Polly está retornando uma exceção de controle de utilização. Para obter mais informações sobre os limites de limitação do Amazon Polly, consulte https://docs.aws.amazon.com/polly/ latest/dg/limits .html #limits -throttle.
`MissingRequiredActionParameter`	`Text` é um parâmetro obrigatório.	Os parâmetros de ação devem ter um valor `Text`
`MissingRequiredActionParameter`	O `Text` é limitado a 1.000 caracteres	O texto excedeu o limite de caracteres.
`SystemException`	Erro do sistema ao executar a ação.	Ocorreu um erro do sistema na execução da ação.

Fluxos de programas

O diagrama a seguir mostra o fluxo do programa que ativa a ação Speak para um chamador. Neste exemplo, o chamador ouve um texto que

Diagrama mostrando o fluxo do programa para ativar a ação Speak para um chamador.

No diagrama

Usando um telefone virtual, o chamador insere um número registrado em um aplicativo de mídia SIP. O aplicativo usa o método INVITE SIP e envia uma resposta Trying (100) ao chamador. Isso indica que o servidor de próximo salto recebeu a solicitação de chamada. O aplicativo SIP usa INVITE para entrar em contato com o endpoint. Depois que a conexão é estabelecida, os aplicativos enviam uma resposta Ringing (180) ao chamador e o alerta é iniciado.

Em seguida, o aplicativo de mídia SIP envia um evento NEW_INBOUND_CALL para a função do Lambda, que responde com uma ação Speak que inclui o ID do chamador e o texto que você deseja converter em fala. O aplicativo SIP então envia uma resposta 200 (OK) para indicar que a chamada foi atendida. O protocolo também ativa a mídia.

Se a ação Speak for bem-sucedida e converter o texto em fala, ela retornará um eventoACTION_SUCCESSFUL para o aplicativo de mídia SIP, que retornará o próximo conjunto de ações. Se a ação falhar, o aplicativo de mídia SIP envia um evento ACTION_FAILED para a função do Lambda, que responde com um conjunto de ações Hangup. O aplicativo desliga o chamador e retorna um evento HANGUP para a função do Lambda, que não realiza nenhuma ação adicional.

O diagrama a seguir mostra o fluxo do programa que ativa a ação Speak para um receptor da chamada.

Diagrama mostrando o fluxo do programa para ativar a ação Speak para um receptor da chamada. Você pode fazer isso em qualquer chamada ancorada.

No diagrama

Um chamador insere um número registrado em um aplicativo de mídia SIP e o aplicativo responde conforme descrito no diagrama anterior. Quando a função do Lambda recebe o evento NEW_INBOUND_CALL, ela retorna a ação CallAndBridge para o aplicativo SIP. O aplicativo usa o método INVITE SIP e envia as respostas Trying (100) e Ringing (180) ao receptor da chamada.

Se o receptor da chamada atender, o aplicativo de mídia SIP receberá uma resposta 200 (OK) e enviará a mesma resposta ao chamador. Isso estabelece a mídia, e o aplicativo SIP envia um evento ACTION_SUCCESSFUL para a ação CallAndBridge para a função do Lambda. A função então retorna a ação Speak e os dados para o aplicativo SIP, que converte

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

SendDigits

SpeakAndGetDigits

Próximo tópico:

SpeakAndGetDigits

Tópico anterior:

SendDigits

Precisa de ajuda?

Nesta página

Esta página foi útil?

Fornecer feedback

Privacidade Termos do site Preferências de cookies

Selecione suas preferências de cookies

Personalizar preferências de cookies

Essenciais

Desempenho

Funcionais

Publicidade

Não foi possível salvar as preferências de cookie

Speak

Importante

Tópicos

Usar o Speak action

Manuseio ACTION_SUCCESSFUL eventos

Manuseio ACTION_FAILED eventos

Gerenciamento de erros

Fluxos de programas

No diagrama

No diagrama

Próximo tópico:

Tópico anterior:

Precisa de ajuda?

Nesta página

Esta página foi útil?

Diagrama mostrando o fluxo do programa para ativar a ação Speak para um chamador.

Diagrama mostrando o fluxo do programa para ativar a ação Speak para um receptor da chamada. Você pode fazer isso em qualquer chamada ancorada.