Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Modellieren Sie Bereitstellungsoptionen in Amazon SageMaker AI
Nachdem Sie Ihr Machine-Learning-Modell trainiert haben, können Sie es mithilfe von Amazon SageMaker AI einsetzen, um Prognosen zu erhalten. Amazon SageMaker AI unterstützt je nach Anwendungsfall die folgenden Methoden zur Bereitstellung eines Modells:
-
Verwenden Sie SageMaker KI-Echtzeit-Hosting-Dienste für persistente Echtzeit-Endpunkte, die jeweils eine Vorhersage treffen. Siehe Echtzeit-Inferenz.
-
Workloads, bei denen es zwischen Datenverkehrsspitzen Leerlaufzeiten gibt und die Kaltstarts tolerieren können, verwenden Serverless Inference. Siehe Bereitstellen von Modellen mit Amazon SageMaker Serverless Inference.
-
Anfragen mit großen Nutzlasten von bis zu 1 GB, langen Verarbeitungszeiten und Latenzanforderungen nahezu in Echtzeit verwenden Amazon SageMaker Asynchronous Inference. Siehe Asynchrone Inferenz-Inferenz.
-
Verwenden SageMaker Sie die KI-Batch-Transformation, um Vorhersagen für einen gesamten Datensatz zu erhalten. Siehe Batch-Transformation für Inferenz mit Amazon AI SageMaker .
SageMaker KI bietet auch Funktionen zur Verwaltung von Ressourcen und zur Optimierung der Inferenzleistung bei der Bereitstellung von Modellen für maschinelles Lernen:
-
Informationen zur Verwaltung von Modellen auf Edge-Geräten, sodass Sie Modelle für maschinelles Lernen auf Flotten von Edge-Geräten optimieren, sichern, überwachen und verwalten können, finden Sie unter. Modellieren Sie die Bereitstellung am Netzwerkrand mit Edge Manager SageMaker Dies gilt für Edge-Geräte wie Smart-Kameras, Roboter, PCs und mobile Geräte.
-
Informationen zur Optimierung von Gluon, Keras,MXNet, PyTorch TensorFlow, TensorFlow -Lite und ONNX Modellen für Inferenz auf Android-, Linux- und Windows-Computern, die auf Prozessoren von Ambarella, Intel, Nvidia, QualcommARM, Texas Instruments und Xilinx basierenNXP, finden Sie unter. Optimierung der Modellleistung mit SageMaker Neo
Weitere Informationen zu allen Bereitstellungsoptionen finden Sie unter Modelle für Inference einsetzen.