Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Echtzeit-Inferenz
Echtzeit-Inferenz ist ideal für Inferenz-Workloads, bei denen interaktive Echtzeitanforderungen mit niedriger Latenz gestellt werden. Sie können Ihr Modell für SageMaker Hosting-Dienste bereitstellen und einen Endpunkt erhalten, der für Inferenzen verwendet werden kann. Diese Endgeräte werden vollständig verwaltet und unterstützen Autoscaling (siehe Automatisches Skalieren Amazon SageMaker Amazon-Modellen).
Themen
- Implementieren Sie Modelle für Inferenz in Echtzeit
- Rufen Sie Modelle für Inferenz in Echtzeit auf
- Verwalten Ihrer Endpunkte
- Hosting-Optionen
- Automatisches Skalieren Amazon SageMaker Amazon-Modellen
- Speichervolumen der Host-Instance
- Modelle in der Produktion sicher validieren
- Online-Erklärbarkeit mit SageMaker Clarify