

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Eine Endpunktkonfiguration erstellen
<a name="serverless-endpoints-create-config"></a>

Wenn Sie ein Modell erstellt haben, erstellen Sie als nächstes eine Endpunktkonfiguration. Anschließend können Sie Ihr Modell mithilfe der Spezifikationen in Ihrer Endpunktkonfiguration bereitstellen. In der Konfiguration geben Sie an, ob Sie einen Echtzeit- oder einen Serverless-Endpunkt haben wollen. Um eine serverlose Endpunktkonfiguration zu erstellen, können Sie die [Amazon SageMaker AI-Konsole](https://console.aws.amazon.com/sagemaker/home), die [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API oder die AWS CLI verwenden. Die API- und Konsolenansätze werden in den folgenden Abschnitten beschrieben.

## So erstellen Sie eine Endpunktkonfiguration (mit Hilfe der API)
<a name="serverless-endpoints-create-config-api"></a>

Im folgenden Beispiel wird das [AWS SDK for Python (Boto3)](https://boto3.amazonaws.com/v1/documentation/api/latest/index.html) verwendet, um die [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API aufzurufen. Geben Sie die folgenden Werte an:
+ Wählen Sie für `EndpointConfigName` einen Namen für die Endpunktkonfiguration. Der Name sollte innerhalb einer Region in Ihrem Konto eindeutig sein.
+ (Optional) Verwenden Sie für `KmsKeyId` die Schlüssel-ID, den Schlüssel-ARN, den Aliasnamen oder den Alias-ARN für einen AWS KMS Schlüssel, den Sie verwenden möchten. SageMaker KI verwendet diesen Schlüssel, um Ihr Amazon ECR-Bild zu verschlüsseln.
+ Verwenden Sie für `ModelName` den Namen des Modells, das Sie bereitstellen möchten. Dieses Modell sollte dasselbe sein, das Sie im [Ein Modell erstellen](serverless-endpoints-create-model.md) Schritt verwendet haben.
+ Für `ServerlessConfig`:
  + Setzen Sie `MemorySizeInMB` auf `2048`. In diesem Beispiel legen wir die Speichergröße auf 2048 MB fest. Sie können für Ihre Speichergröße jedoch einen der folgenden Werte wählen: 1024 MB, 2048 MB, 3072 MB, 4096 MB, 5120 MB oder 6144 MB. 
  + Setzen Sie `MaxConcurrency` auf `20`. In diesem Beispiel haben wir die maximale Parallelität auf 20 festgelegt. Die maximale Anzahl gleichzeitiger Aufrufe, die Sie für einen Serverless-Endpunkt festlegen können, ist 200. Der Mindestwert, den Sie auswählen können, ist 1.
  + (Optional) Um bereitgestellte Gleichzeitigkeit zu verwenden, legen Sie `ProvisionedConcurrency` auf 10 fest. In diesem Beispiel haben wir die bereitgestellte Gleichzeitigkeit auf 10 gesetzt. Die `ProvisionedConcurrency` Zahl für einen Serverless-Endpunkt muss kleiner oder gleich der `MaxConcurrency` Zahl sein. Sie können das Feld leer lassen, wenn Sie einen Endpunkt für Serverless Inferenz auf Abruf verwenden möchten. Sie können Gleichzeitigkeit bereitstellen dynamisch skalieren. Weitere Informationen finden Sie unter [Automatische Skalierung der bereitgestellten Gleichzeitigkeit für einen Serverless Endpunkt](serverless-endpoints-autoscale.md).

```
response = client.create_endpoint_config(
   EndpointConfigName="<your-endpoint-configuration>",
   KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e",
   ProductionVariants=[
        {
            "ModelName": "<your-model-name>",
            "VariantName": "AllTraffic",
            "ServerlessConfig": {
                "MemorySizeInMB": 2048,
                "MaxConcurrency": 20,
                "ProvisionedConcurrency": 10,
            }
        } 
    ]
)
```

## So erstellen Sie eine Endpunktkonfiguration (mit Hilfe der Konsole)
<a name="serverless-endpoints-create-config-console"></a>

1. Melden Sie sich bei der [Amazon SageMaker AI-Konsole](https://console.aws.amazon.com/sagemaker/home) an.

1. Wählen Sie auf der Registerkarte Navigation **Inferenz** aus.

1. Wählen Sie als Nächstes **Endpunktkonfigurationen** aus.

1. Wählen Sie **Endpunktkonfiguration erstellen** aus.

1. Geben Sie unter **Name der Endpunktkonfiguration** einen Namen ein, der innerhalb Ihres Kontos in einer Region eindeutig ist.

1. Wählen Sie als **Typ des Endpunkts** die Option **Serverless** aus.  
![\[Screenshot der Option Endpunkttyp in der Konsole.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config.png)

1. Wählen Sie für **Produktionsvarianten** die Option **Modell hinzufügen** aus.

1. Wählen Sie unter **Modell hinzufügen** das Modell, das Sie verwenden möchten, von der Liste der Modelle aus und klicken Sie dann auf **Speichern**.

1. Wenn Sie Ihr Modell hinzugefügt haben, wählen Sie unter **Aktionen** die Option **Bearbeiten** aus.

1. Wählen Sie unter **Speichergröße** die gewünschte Speichergröße in GB aus.  
![\[Screenshot der Option „Speichergröße“ in der Konsole.\]](http://docs.aws.amazon.com/de_de/sagemaker/latest/dg/images/serverless-endpoints-endpoint-config-2.png)

1. Geben Sie für **Max. Gleichzeitigkeit** die gewünschte maximale Anzahl gleichzeitiger Aufrufe für den Endpunkt ein. Der Höchstwert, den Sie eingeben können, ist 200 und der Mindestwert ist 1.

1. (Optional) Um die bereitgestellte Gleichzeitigkeit zu verwenden, geben Sie die gewünschte Anzahl gleichzeitiger Aufrufe in das Feld **Einstellung für bereitgestellte Gleichzeitigkeit** ein. Die Anzahl der gleichzeitig bereitgestellten Aufrufe muss kleiner oder gleich der maximalen Anzahl gleichzeitiger Aufrufe sein.

1. Wählen Sie **Speichern**.

1. (Optional) Geben Sie unter **Tags** Schlüssel-Wert-Paare ein, wenn Sie Metadaten für Ihre Endpunktkonfiguration erstellen möchten.

1. Wählen Sie **Endpunktkonfiguration erstellen** aus.