Modellieren Sie Bereitstellungsoptionen in Amazon SageMaker AI

Fokusmodus

Modellieren Sie Bereitstellungsoptionen in Amazon SageMaker AI - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Nachdem Sie Ihr Machine-Learning-Modell trainiert haben, können Sie es mithilfe von Amazon SageMaker AI einsetzen, um Prognosen zu erhalten. Amazon SageMaker AI unterstützt je nach Anwendungsfall die folgenden Methoden zur Bereitstellung eines Modells:

Verwenden Sie SageMaker KI-Echtzeit-Hosting-Dienste für persistente Echtzeit-Endpunkte, die jeweils eine Vorhersage treffen. Siehe Echtzeit-Inferenz.
Workloads, bei denen es zwischen Datenverkehrsspitzen Leerlaufzeiten gibt und die Kaltstarts tolerieren können, verwenden Serverless Inference. Siehe Bereitstellen von Modellen mit Amazon SageMaker Serverless Inference.
Anfragen mit großen Nutzlasten von bis zu 1 GB, langen Verarbeitungszeiten und Latenzanforderungen nahezu in Echtzeit verwenden Amazon SageMaker Asynchronous Inference. Siehe Asynchrone Inferenz-Inferenz.
Verwenden SageMaker Sie die KI-Batch-Transformation, um Vorhersagen für einen gesamten Datensatz zu erhalten. Siehe Batch-Transformation für Inferenz mit Amazon AI SageMaker .

SageMaker KI bietet auch Funktionen zur Verwaltung von Ressourcen und zur Optimierung der Inferenzleistung bei der Bereitstellung von Modellen für maschinelles Lernen:

Informationen zur Verwaltung von Modellen auf Edge-Geräten, sodass Sie Modelle für maschinelles Lernen auf Flotten von Edge-Geräten optimieren, sichern, überwachen und verwalten können, finden Sie unter. Modellieren Sie die Bereitstellung am Netzwerkrand mit Edge Manager SageMaker Dies gilt für Edge-Geräte wie Smart-Kameras, Roboter, PCs und mobile Geräte.
Informationen zur Optimierung von Gluon-, Keras-, MXNet, PyTorch TensorFlow, TensorFlow -Lite- und ONNX-Modellen für Inferenz auf Android-, Linux- und Windows-Computern, die auf Prozessoren von Ambarella, ARM, Intel, Nvidia, NXP, Qualcomm, Texas Instruments und Xilinx basieren, finden Sie unter. Optimierung der Modellleistung mit SageMaker Neo

Weitere Informationen zu allen Bereitstellungsoptionen finden Sie unter Modelle für Inference einsetzen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Modelle für Inference einsetzen

Optionen für die Bereitstellung von Modellen und das Abrufen von Schlussfolgerungen

Wählen Sie Ihre Cookie-Einstellungen aus

Cookie-Einstellungen anpassen

Essenziell

Leistung

Funktional

Werbung

Cookie-Einstellungen konnten nicht gespeichert werden

Modellieren Sie Bereitstellungsoptionen in Amazon SageMaker AI

Related resources

Hat Ihnen diese Seite geholfen?

Related resources

Nächstes Thema:

Vorheriges Thema:

Brauchen Sie Hilfe?