

# Invocações de modelos
<a name="model-invocations"></a>

A funcionalidade de observabilidade de IA generativa do CloudWatch permite monitorar a performance das invocações de modelos. É possível acompanhar métricas, como a contagem de invocações, o uso de tokens e os erros, usando visualizações prontas para uso. Para obter uma visibilidade detalhada sobre o conteúdo relacionado à invocação, como as entradas e as saídas, habilite o **registro em log de invocação do Bedrock** e envie os logs para o CloudWatch. Para saber mais, consulte [Set up a CloudWatch Logs destination](https://docs.aws.amazon.com/bedrock/latest/userguide/model-invocation-logging.html#setup-cloudwatch-logs-destination) e [Help protect sensitive log data with masking](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/mask-sensitive-log-data.html).

## Como habilitar a invocação de modelos no Amazon Bedrock
<a name="enabling-bedrock-invocation"></a>

**nota**  
É necessário habilitar o registro em log de invocação do modelo no Amazon Bedrock para visualizar as invocações.

Para habilitar o registro em log de invocações e modelo no Amazon Bedrock, siga estas etapas:

1. Abra o console do Amazon Bedrock em [https://console.aws.amazon.com/bedrock/](https://console.aws.amazon.com/bedrock/).

1. Escolha **Configurações**.

1. Em **Registro em log de invocação do modelo**, selecione **Registro em log de invocação do modelo**.

1. Escolha os tipos de dados obrigatórios a serem incluídos nos logs. Escolha enviar os logs apenas para o CloudWatch Logs ou para o Amazon S3 e o CloudWatch Logs se você já publicar no Amazon S3.

1. Nas configurações do CloudWatch Logs, crie um nome para o grupo de logs e selecione os perfis de serviços apropriados.

1. Escolha os tipos de dados obrigatórios a serem incluídos nos logs.

1. Escolha **Salvar configurações**.

   É possível visualizar os painéis configurados previamente de forma automática ao começar a usar as invocações do Amazon Bedrock. Após habilitar `Model Invocation logging`, você pode visualizar os painéis padrão e acessar a tabela de invocação localizada abaixo deles.

![\[observabilidade de IA generativa\]](http://docs.aws.amazon.com/pt_br/AmazonCloudWatch/latest/monitoring/images/GenAI.png)

+ **Contagem de invocação**: número de solicitações bem-sucedidas às operações de API [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html), [ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html), [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html) e [InvokeModelWithResponseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html).
+ **Latência de invocação**: tempo de latência das invocações.
+ **Contagem de tokens por modelo**: contagem de tokens por modelo, detalhada pelas contagens de tokens de entrada e de tokens de saída.
+ **Contagem diária de tokens por ModelID**: contagem total diária de tokens por ID do modelo.
+ **InputTokenCount e OutputTokenCount**: número total de tokens na entrada e na saída nesta conta, considerando os modelos selecionados.
+ **Solicitações agrupadas por tokens de entrada**: número de solicitações agrupadas em seis intervalos, conforme o número de tokens de entrada. Cada linha representa o número de solicitações que se enquadram em um intervalo específico.
+ **Controle de utilização para invocação**: número de invocações controladas pelo sistema devido ao controle de utilização. O número de controles de utilização observado dependerá das configurações de nova tentativa estabelecidas no SDK. Para obter mais informações, consulte o comportamento [Retry](https://docs.aws.amazon.com/sdkref/latest/guide/feature-retry-behavior.html) no Guia de referência dos SDKs e das ferramentas da AWS.
+ **Contagem de erros de invocação**: número de invocações que resultaram em erros do lado do servidor e do lado do cliente.

Para usar o painel de invocação de modelos, siga essas etapas.

1. Passe o cursor do mouse sobre qualquer gráfico de métricas para visualizar os detalhes da invocação. Você pode selecionar o ícone **Alarme** para configurar `Alarms` que monitorem a qualidade e a performance da aplicação.

1. No menu suspenso **ModelID**, você pode selecionar um ID de modelo para visualizar as métricas correspondentes.

1. Selecione **Visualizar em métricas do CloudWatch** para visualizar as métricas do painel no CloudWatch.

1. Selecione **Substituição de período** para ajustar o intervalo de tempo das métricas (por exemplo, um minuto, uma hora ou seis horas).

1. Em **Invocações**, escolha **ID da solicitação** para visualizar os detalhes da solicitação. É possível visualizar os detalhes de entrada e de saída da invocação de modelos no painel localizado à direita.

![\[Invocação de modelos: visualização por ID da solicitação\]](http://docs.aws.amazon.com/pt_br/AmazonCloudWatch/latest/monitoring/images/GenAI_Model_Invocation.png)


Na página **ID da solicitação**, no menu suspenso **Ações**, selecione **Visualizar no Logs Insights** para visualizar os logs no CloudWatch. Para obter mais informações, consulte [Analisar logs de dados com o CloudWatch Logs Insights](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html).