Administración de los puntos de conexión de inferencia mediante el comando endpoints - Amazon Neptune

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Administración de los puntos de conexión de inferencia mediante el comando endpoints

El comando endpoints de Neptune ML se utiliza para crear un punto de conexión de inferencia, comprobar su estado, eliminarlo o enumerar los puntos de conexión de inferencia existentes.

Creación de un punto de conexión de inferencia mediante el comando endpoints de Neptune ML

Un comando endpoints de Neptune ML para crear un punto de conexión de inferencia a partir de un modelo creado por un trabajo de entrenamiento tiene el siguiente aspecto:

curl \ -X POST https://(your Neptune endpoint)/ml/endpoints -H 'Content-Type: application/json' \ -d '{ "id" : "(a unique ID for the new endpoint)", "mlModelTrainingJobId": "(the model-training job-id of a completed job)" }'

Un comando endpoints de Neptune ML para actualizar un punto de conexión de inferencia existente a partir de un modelo creado por un trabajo de entrenamiento tiene el siguiente aspecto:

curl \ -X POST https://(your Neptune endpoint)/ml/endpoints -H 'Content-Type: application/json' \ -d '{ "id" : "(a unique ID for the new endpoint)", "update" : "true", "mlModelTrainingJobId": "(the model-training job-id of a completed job)" }'

Un comando endpoints de Neptune ML para crear un punto de conexión de inferencia a partir de un trabajo de transformación de modelos tiene el siguiente aspecto:

curl \ -X POST https://(your Neptune endpoint)/ml/endpoints -H 'Content-Type: application/json' \ -d '{ "id" : "(a unique ID for the new endpoint)", "mlModelTransformJobId": "(the model-training job-id of a completed job)" }'

Un comando endpoints de Neptune ML para actualizar un punto de conexión de inferencia existente a partir de un trabajo de transformación de modelos tiene el siguiente aspecto:

curl \ -X POST https://(your Neptune endpoint)/ml/endpoints -H 'Content-Type: application/json' \ -d '{ "id" : "(a unique ID for the new endpoint)", "update" : "true", "mlModelTransformJobId": "(the model-training job-id of a completed job)" }'
Parámetros para la creación de puntos de conexión de inferencia endpoints
  • id: (opcional) un identificador único para el nuevo punto de conexión de inferencia.

    Tipo: cadena. Valor predeterminado: un nombre con marca temporal generado automáticamente.

  • mlModelTrainingJobId: el ID del trabajo de entrenamiento de modelos completado que ha creado el modelo al que apuntará el punto de conexión de inferencia.

    Tipo: cadena.

    Nota: Debe proporcionar el valor mlModelTrainingJobId o el valor mlModelTransformJobId.

  • mlModelTransformJobId: el ID de trabajo de un trabajo de transformación de modelos completado.

    Tipo: cadena.

    Nota: Debe proporcionar el valor mlModelTrainingJobId o el valor mlModelTransformJobId.

  • update: (opcional) si está presente, este parámetro indica que se trata de una solicitud de actualización.

    Tipo: booleano. Valor predeterminado: false

    Nota: Debe proporcionar el valor mlModelTrainingJobId o el valor mlModelTransformJobId.

  • neptuneIamRoleArn: (opcional) el ARN de un rol de IAM que proporciona a Neptune acceso a los recursos de SageMaker y Amazon S3.

    Tipo: cadena. Nota: Debe figurar en el grupo de parámetros del clúster de base de datos o se producirá un error.

  • modelName: (opcional) tipo de modelo para el entrenamiento. De forma predeterminada, el modelo de ML se basa automáticamente en el modelType utilizado en el procesamiento de datos, pero aquí puede especificar otro tipo de modelo.

    Tipo: cadena. Valor predeterminado: rgcn para gráficos heterogéneos y kge para gráficos de conocimientos. Valores válidos: para gráficos heterogéneos: rgcn. Para gráficos de conocimientos: kge, transe, distmult o rotate.

  • instanceType: (opcional) el tipo de instancia de ML que se utiliza para el mantenimiento en línea.

    Tipo: cadena. Valor predeterminado: ml.m5.xlarge.

    Nota: La selección de la instancia de ML para un punto de conexión de inferencia depende del tipo de tarea, del tamaño del gráfico y del presupuesto. Consulte Selección de una instancia para un punto de conexión de inferencia.

  • instanceCount: (opcional) el número mínimo de instancias de Amazon EC2 que se deben implementar en un punto de conexión para la predicción.

    Tipo: número entero. Valor predeterminado: 1.

  • volumeEncryptionKMSKey: (opcional) la clave de AWS Key Management Service (AWS KMS) que SageMaker utiliza para cifrar los datos del volumen de almacenamiento asociado con las instancias de computación de ML que ejecutan los puntos de conexión.

    Tipo: cadena. Valor predeterminado: ninguno.

Obtención del estado de un punto de conexión de inferencia mediante el comando endpoints de Neptune ML

Un ejemplo del comando endpoints de Neptune ML para el estado de un punto de conexión de instancia:

curl -s \ "https://(your Neptune endpoint)/ml/endpoints/(the inference endpoint ID)" \ | python -m json.tool
Parámetros para el estado del punto de conexión de instancia endpoints
  • id: (obligatorio) el identificador único del punto de conexión de inferencia.

    Tipo: cadena.

  • neptuneIamRoleArn: (opcional) el ARN de un rol de IAM que proporciona a Neptune acceso a los recursos de SageMaker y Amazon S3.

    Tipo: cadena. Nota: Debe figurar en el grupo de parámetros del clúster de base de datos o se producirá un error.

Eliminación de un punto de conexión de instancia mediante el comando endpoints de Neptune ML

Un ejemplo del comando endpoints de Neptune ML para eliminar un punto de conexión de instancia:

curl -s \ -X DELETE "https://(your Neptune endpoint)/ml/endpoints/(the inference endpoint ID)"

Otro ejemplo:

curl -s \ -X DELETE "https://(your Neptune endpoint)/ml/endpoints/(the inference endpoint ID)?clean=true"
Parámetros para la eliminación de puntos de conexión de inferencia endpoints
  • id: (obligatorio) el identificador único del punto de conexión de inferencia.

    Tipo: cadena.

  • neptuneIamRoleArn: (opcional) el ARN de un rol de IAM que proporciona a Neptune acceso a los recursos de SageMaker y Amazon S3.

    Tipo: cadena. Nota: Debe figurar en el grupo de parámetros del clúster de base de datos o se producirá un error.

  • clean: (opcional) indica que también se deben eliminar todos los artefactos relacionados con este punto de conexión.

    Tipo: booleano. Valor predeterminado: FALSE.

Enumeración de puntos de conexión de inferencia mediante el comando endpoints de Neptune ML

Un comando endpoints de Neptune ML para enumerar los puntos de conexión de inferencia tiene el siguiente aspecto:

curl -s "https://(your Neptune endpoint)/ml/endpoints" \ | python -m json.tool

Otro ejemplo:

curl -s "https://(your Neptune endpoint)/ml/endpoints?maxItems=3" \ | python -m json.tool
Parámetros para la enumeración de puntos de conexión de inferencia dataprocessing
  • maxItems: (opcional) el número máximo de elementos que devolver.

    Tipo: número entero. Valor predeterminado: 10. Valor máximo permitido: 1024.

  • neptuneIamRoleArn: (opcional) el ARN de un rol de IAM que proporciona a Neptune acceso a los recursos de SageMaker y Amazon S3.

    Tipo: cadena. Nota: Debe figurar en el grupo de parámetros del clúster de base de datos o se producirá un error.