

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Stellen Sie Ihre Modelle auf einem Endpunkt bereit
<a name="canvas-deploy-model"></a>

In Amazon SageMaker Canvas können Sie Ihre Modelle auf einem Endpunkt bereitstellen, um Vorhersagen zu treffen. SageMaker AI stellt die ML-Infrastruktur bereit, mit der Sie Ihr Modell auf einem Endpunkt mit den von Ihnen ausgewählten Recheninstanzen hosten können. Anschließend können Sie den Endpunkt *aufrufen* (eine Prognoseanfrage senden) und anhand Ihres Modells eine Vorhersage in Echtzeit abrufen. Mit dieser Funktion können Sie Ihr Modell in der Produktion verwenden, um auf eingehende Anfragen zu antworten, und Sie können Ihr Modell in bestehende Anwendungen und Workflows integrieren.

Zu Beginn sollten Sie über ein Modell verfügen, das Sie bereitstellen möchten. Sie können von Ihnen erstellte benutzerdefinierte Modellversionen, Amazon SageMaker JumpStart Foundation-Modelle und fein abgestimmte JumpStart Foundation-Modelle bereitstellen. Für weitere Informationen zum Erstellen eines Modells in Canvas, siehe [So funktionieren benutzerdefinierte Modelle](canvas-build-model.md). Weitere Informationen zu JumpStart Foundation-Modellen in Canvas finden Sie unter[Generative KI-Grundmodelle in SageMaker Canvas](canvas-fm-chat.md).

Lesen Sie den folgenden Abschnitt **zur Rechteverwaltung** und beginnen Sie dann im Abschnitt Modell **bereitstellen** mit der Erstellung neuer Bereitstellungen.

## Berechtigungsverwaltung
<a name="canvas-deploy-model-prereqs"></a>

Standardmäßig sind Sie berechtigt, Modelle auf SageMaker AI Hosting-Endpunkten bereitzustellen. SageMaker AI gewährt diese Berechtigungen für alle neuen und vorhandenen Canvas-Benutzerprofile über die [AmazonSageMakerCanvasFullAccess](https://docs.aws.amazon.com/aws-managed-policy/latest/reference/AmazonSageMakerCanvasFullAccess.html)Richtlinie, die der AWS IAM-Ausführungsrolle für die SageMaker AI-Domäne zugeordnet ist, die Ihre Canvas-Anwendung hostet.

Wenn Ihr Canvas-Administrator eine neue Domäne oder ein neues Benutzerprofil einrichtet, aktiviert SageMaker KI bei der Einrichtung der Domain und bei der Befolgung der erforderlichen Anweisungen in der die [Voraussetzungen für die Einrichtung von Amazon SageMaker Canvas](canvas-getting-started.md#canvas-prerequisites) Berechtigungen für die Modellbereitstellung über die Option **Direkte Bereitstellung von Canvas-Modellen aktivieren**, die standardmäßig aktiviert ist.

Der Canvas-Administrator kann die Berechtigungen für die Modellbereitstellung auch auf Benutzerprofilebene verwalten. Wenn der Administrator beispielsweise bei der Einrichtung einer Domain nicht allen Benutzerprofilen Berechtigungen für die Modellbereitstellung gewähren möchte, kann er bestimmten Benutzern Berechtigungen gewähren, nachdem die Domain erstellt wurde.

Das folgende Verfahren zeigt, wie die Berechtigungen zur Modellbereitstellung für ein bestimmtes Benutzerprofil geändert werden:

1. Öffnen Sie die SageMaker AI-Konsole unter [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Wählen Sie im linken Navigationsbereich **Admin-Konfigurationen**.

1. Wählen Sie unter **Admin Konfigurationen** die Option **Domains** aus.

1. Wählen Sie aus der Liste der Domains die Domain des Benutzerprofils aus.

1. Wählen Sie auf der Seite mit den **Domaindetails** die Registerkarte **Benutzerprofile** aus.

1. Wählen Sie Ihr **Benutzerprofil** aus.

1. Wählen Sie auf der Seite mit dem Benutzerprofil die Registerkarte **App-Konfigurationen** aus.

1. Klicken Sie im Abschnitt **Canvas** auf **Bearbeiten**.

1. Deaktivieren Sie im Abschnitt **ML-Ops-Konfiguration** die Option **Direkte Bereitstellung von Canvas-Modellen aktivieren**, um Bereitstellungsberechtigungen zu aktivieren.

1. Wählen Sie **Absenden** aus, um die Änderungen an Ihren Domaineinstellungen zu speichern.

Das Benutzerprofil sollte keine Berechtigungen für die Modellbereitstellung haben.

Nachdem Sie die Berechtigungen für die Domain oder das Benutzerprofil erteilt haben, stellen Sie sicher, dass sich der Benutzer aus seiner Canvas-Anwendung abmeldet und erneut anmeldet, damit die Berechtigungsänderungen übernommen werden.

## Bereitstellen eines Modells
<a name="canvas-deploy-model-deploy"></a>

Um mit der Bereitstellung Ihres Modells zu beginnen, erstellen Sie eine neue Bereitstellung in Canvas und geben die Modellversion an, die Sie zusammen mit der ML-Infrastruktur bereitstellen möchten, z. B. den Typ und die Anzahl der Rechen-Instances, die Sie zum Hosten des Modells verwenden möchten.

Canvas schlägt basierend auf Ihrem Modelltyp einen Standardtyp und eine Standardanzahl von Instances vor. Weitere Informationen zu den verschiedenen SageMaker KI-Instance-Typen finden Sie auf der [ SageMaker Amazon-Preisseite](https://aws.amazon.com/sagemaker/pricing/). Solange Ihr Endpunkt aktiv ist, werden Ihnen Gebühren auf der Grundlage der Preise für SageMaker AI-Instances berechnet.

Bei der JumpStart Bereitstellung von Basismodellen haben Sie auch die Möglichkeit, die Länge der Bereitstellungszeit anzugeben. Sie können das Modell auf unbestimmte Zeit auf einem Endpunkt bereitstellen (d. h. der Endpunkt bleibt aktiv, bis Sie die Bereitstellung löschen). Oder, wenn Sie den Endpunkt nur für einen kurzen Zeitraum benötigen und die Kosten senken möchten, können Sie das Modell für einen bestimmten Zeitraum auf einem Endpunkt bereitstellen. Danach fährt SageMaker KI den Endpunkt für Sie herunter.

**Anmerkung**  
Wenn Sie ein Modell für einen bestimmten Zeitraum bereitstellen, bleiben Sie für die Dauer des Endpunkts in der Canvas-Anwendung angemeldet. Wenn Sie sich von der Anwendung abmelden oder sie löschen, kann Canvas den Endpunkt zum angegebenen Zeitpunkt nicht herunterfahren.

Nachdem Ihr Modell auf einem SageMaker [KI-Hosting-Echtzeit-Inferenzendpunkt](https://docs.aws.amazon.com/sagemaker/latest/dg/realtime-endpoints.html) bereitgestellt wurde, können Sie damit beginnen, Vorhersagen zu treffen, indem Sie den Endpunkt *aufrufen*.

Es gibt verschiedene Möglichkeiten, ein Modell von der Canvas-Anwendung aus bereitzustellen. Sie können mit einer der folgenden Methoden auf die Modellbereitstellungsoption zugreifen:
+ Wählen Sie auf der Seite **Meine Modelle** der Canvas-Anwendung das Modell aus, das Sie bereitstellen möchten. Anschließend wählen Sie auf der Seite **Versionen** des Modells das Symbol **Weitere Optionen** (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) neben einer Modellversion und **Bereitstellen** aus.
+ Wenn Sie sich auf der Detailseite für eine Modellversion auf der Registerkarte **Analysieren** befinden, wählen Sie die Option **Bereitstellen** aus.
+ Wenn Sie sich auf der Detailseite für eine Modellversion auf der Registerkarte **Prognose** befinden, wählen Sie oben auf der Seite das Symbol **Weitere Optionen** (![\[Vertical ellipsis icon representing a menu or more options.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/studio/canvas/more-options-icon.png)) und dann **Bereitstellen** aus.
+ Auf der Seite **ML Ops** der Canvas-Anwendung wählen Sie die Registerkarte **Bereitstellungen** und dann **Bereitstellung erstellen** aus.
+  JumpStart Fundamentmodelle und fein abgestimmte Fundamentmodelle finden Sie auf der **Ready-to-use Modellseite der Canvas-Anwendung**. Wählen Sie **Inhalt generieren, extrahieren und zusammenfassen**. Suchen Sie dann das JumpStart Foundation-Modell oder das fein abgestimmte Foundation-Modell, das Sie bereitstellen möchten. Wählen Sie das Modell aus und klicken Sie auf der Chat-Seite des Modells auf die Schaltfläche **Bereitstellen**.

Bei all diesen Methoden wird der Seitenbereich **Deploy-Modell** geöffnet, in dem Sie die Bereitstellungskonfiguration für Ihr Modell angeben. Um das Modell über diesen Bereich bereitzustellen, führen Sie die folgenden Schritte aus:

1. (Optional) Wenn Sie eine Bereitstellung auf der Seite **ML Ops** erstellen, haben Sie die Möglichkeit, **Modell und Version auszuwählen**. Verwenden Sie die Dropdown-Menüs, um das Modell und die Modellversion auszuwählen, die Sie bereitstellen möchten.

1. Geben Sie einen Namen in das Feld **Bereitstellungsname** ein.

1. (Nur für JumpStart Foundation-Modelle und fein abgestimmte Foundation-Modelle) Wählen Sie eine **Bereitstellungsdauer** aus. Wählen Sie **Unbegrenzt** aus, um den Endpunkt so lange aktiv zu lassen, bis Sie ihn herunterfahren, oder wählen Sie **Dauer festlegen** aus und geben Sie dann den Zeitraum ein, für den der Endpunkt aktiv bleiben soll.

1. Zum **Beispiel den Instanztyp** erkennt SageMaker KI einen Standard-Instanztyp und eine Standard-Instanznummer, die für Ihr Modell geeignet sind. Sie können jedoch den Instance-Typ ändern, den Sie für das Hosten Ihres Modells verwenden möchten.
**Anmerkung**  
Wenn das Instance-Kontingent für den ausgewählten Instance-Typ in Ihrem AWS Konto aufgebraucht ist, können Sie eine Erhöhung des Kontingents beantragen. Weitere Informationen zu den Standardkontingenten und dazu, wie Sie eine Erhöhung beantragen können, finden Sie unter [Amazon SageMaker AI-Endpunkte und Kontingente](https://docs.aws.amazon.com/general/latest/gr/sagemaker.html) im *AWS Allgemeinen Referenzhandbuch.*

1. Unter **Anzahl der Instances** können Sie die Anzahl der aktiven Instances festlegen, die für Ihren Endpunkt verwendet werden. SageMaker KI erkennt eine Standardnummer, die für Ihr Modell geeignet ist. Sie können diese Zahl jedoch ändern.

1. Wenn Sie bereit sind, Ihr Modell bereitzustellen, wählen Sie **Bereitstellen** aus.

Ihr Modell sollte jetzt auf einem Endpunkt bereitgestellt werden.