

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Inferência em tempo real
<a name="realtime-endpoints"></a>

 A inferência em tempo real é ideal para cargas de trabalho de inferência em que você tem requisitos em tempo real, interativos e de baixa latência. Você pode implantar seu modelo em serviços de hospedagem de SageMaker IA e obter um endpoint que pode ser usado para inferência. Esses endpoints são totalmente gerenciados e oferecem suporte ao escalonamento automático (consulte [Escalabilidade automática dos modelos de SageMaker IA da Amazon](endpoint-auto-scaling.md)). 

**Topics**
+ [Implantar modelos para inferência em tempo real](realtime-endpoints-deploy-models.md)
+ [Invocar modelos para inferência em tempo real](realtime-endpoints-test-endpoints.md)
+ [Endpoints](realtime-endpoints-manage.md)
+ [Opções de hospedagem](realtime-endpoints-options.md)
+ [Escalabilidade automática dos modelos de SageMaker IA da Amazon](endpoint-auto-scaling.md)
+ [volumes do armazenamento de instâncias](host-instance-storage.md)
+ [Validação de modelos em produção](model-validation.md)
+ [Explicabilidade on-line com Clarify SageMaker](clarify-online-explainability.md)
+ [Ajustar modelos com componentes de inferência do adaptador](realtime-endpoints-adapt.md)