Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Modellieren Sie Bereitstellungsoptionen in Amazon SageMaker
Nachdem Sie Ihr Modell für maschinelles Lernen trainiert haben, können Sie es mithilfe von Amazon bereitstellen SageMaker , um Prognosen zu erhalten. Amazon SageMaker unterstützt je nach Anwendungsfall die folgenden Methoden zur Bereitstellung eines Modells:
-
Verwenden SageMaker Sie Echtzeit-Hosting-Dienste für persistente Echtzeit-Endgeräte, die jeweils nur eine Vorhersage treffen. Siehe Echtzeit-Inferenz.
-
Für Workloads, bei denen es zwischen Datenverkehrsspitzen Leerlaufzeiten gibt und die Kaltstarts tolerieren können, sollten Sie Serverless Inference verwenden. Siehe Modelle mit Amazon SageMaker Serverless Inference bereitstellen.
-
Anfragen mit großen Nutzlasten von bis zu 1 GB, langen Verarbeitungszeiten und Latenzanforderungen nahezu in Echtzeit verwenden Amazon SageMaker Asynchronous Inference. Siehe Asynchrone Inferenz-Inferenz.
-
Verwenden Sie die Batch-Transformation, um Vorhersagen für einen gesamten Datensatz zu erhalten. SageMaker Siehe Batch-Transformation für Inferenz mit Amazon SageMaker.
SageMaker bietet außerdem Funktionen zur Verwaltung von Ressourcen und zur Optimierung der Inferenzleistung bei der Bereitstellung von Modellen für maschinelles Lernen:
-
Informationen zur Verwaltung von Modellen auf Edge-Geräten, sodass Sie Modelle für maschinelles Lernen auf Flotten von Edge-Geräten optimieren, sichern, überwachen und verwalten können, finden Sie unter. Modellieren Sie die Bereitstellung am Netzwerkrand mit Edge Manager SageMaker Dies gilt für Edge-Geräte wie Smart-Kameras, Roboter, PCs und mobile Geräte.
-
Informationen zur Optimierung von Gluon, Keras,MXNet, PyTorch TensorFlow, TensorFlow -Lite und ONNX Modellen für Inferenz auf Android-, Linux- und Windows-Computern, die auf Prozessoren von Ambarella, Intel, Nvidia, QualcommARM, Texas Instruments und Xilinx basierenNXP, finden Sie unter. Optimierung der Modellleistung mit SageMaker Neo
Weitere Informationen zu allen Bereitstellungsoptionen finden Sie unter Modelle für Inference einsetzen.