Ofrezca a Amazon SageMaker Clarify Jobs acceso a los recursos de su Amazon VPC - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ofrezca a Amazon SageMaker Clarify Jobs acceso a los recursos de su Amazon VPC

Para controlar el acceso a tus datos y a los SageMaker trabajos de Clarify, te recomendamos que crees un Amazon privado VPC y lo configures de manera que no se pueda acceder a tus trabajos a través de la Internet pública. Para obtener información sobre cómo crear y configurar un Amazon VPC para procesar trabajos, consulte Dar acceso a los trabajos de SageMaker procesamiento a los recursos de su Amazon VPC.

En este documento se explica cómo añadir VPC configuraciones de Amazon adicionales que cumplan con los requisitos de los trabajos de SageMaker Clarify.

Configurar un trabajo SageMaker de Clarify para Amazon VPC Access

Debe especificar las subredes y los grupos de seguridad al configurar sus trabajos privados de Amazon VPC for SageMaker Clarify y permitir que el trabajo obtenga inferencias del SageMaker modelo al calcular las métricas de sesgo posteriores al entrenamiento y las contribuciones de funciones que ayudan a explicar las predicciones del modelo.

SageMaker Clarifique las VPC subredes y grupos de seguridad de Job Amazon

Las subredes y los grupos de seguridad de tu Amazon privado se VPC pueden asignar a SageMaker un trabajo de Clarify de varias maneras, según cómo lo crees.

  • SageMaker consola: proporciona esta información al crear el trabajo en el SageMakerpanel de control. En el menú Procesamiento, seleccione Trabajos de procesamiento y, a continuación, elija Crear trabajo de procesamiento. Seleccione la VPCopción en el panel Red y proporcione las subredes y los grupos de seguridad mediante las listas desplegables. Asegúrese de que la opción de aislamiento de redes incluida en este panel esté desactivada.

  • SageMaker API: Utilice el parámetro de NetworkConfig.VpcConfig solicitud del CreateProcessingJobAPI, como se muestra en el siguiente ejemplo:

    "NetworkConfig": { "VpcConfig": { "Subnets": [ "subnet-0123456789abcdef0", "subnet-0123456789abcdef1", "subnet-0123456789abcdef2" ], "SecurityGroupIds": [ "sg-0123456789abcdef0" ] } }
  • SageMaker Python SDK: utilice el NetworkConfig parámetro SageMakerClarifyProcessorAPIo ProcessorAPI, como se muestra en el siguiente ejemplo:

    from sagemaker.network import NetworkConfig network_config = NetworkConfig( subnets=[ "subnet-0123456789abcdef0", "subnet-0123456789abcdef1", "subnet-0123456789abcdef2", ], security_group_ids=[ "sg-0123456789abcdef0", ], )

SageMaker utiliza la información para crear interfaces de red y adjuntarlas al trabajo de SageMaker Clarify. Las interfaces de red proporcionan un SageMaker trabajo de Clarify con una conexión de red dentro de Amazon VPC que no está conectada a la Internet pública. También permiten que el trabajo SageMaker de Clarify se conecte a los recursos de tu Amazon privadoVPC.

nota

La opción de aislamiento de red del trabajo SageMaker de Clarify debe estar desactivada (de forma predeterminada, la opción está desactivada) para que el trabajo de SageMaker Clarify pueda comunicarse con el punto final oculto.

Configurar un modelo de Amazon VPC para inferencia

Para calcular las métricas de sesgo y la explicabilidad posteriores al entrenamiento, el trabajo de SageMaker Clarify debe obtener inferencias del SageMaker modelo especificado por el model_name parámetro de la configuración de análisis para el trabajo de procesamiento de Clarify. SageMaker Alternativamente, si usa el SageMakerClarifyProcessor API en SageMaker PythonSDK, el trabajo debe obtener lo model_name especificado por la ModelConfigclase. Para ello, el trabajo SageMaker Clarify crea un punto final efímero con el modelo, conocido como punto final de sombra, y, a continuación, aplica la VPC configuración de Amazon del modelo al punto final de sombra.

Para especificar subredes y grupos de seguridad en su Amazon privado VPC para el SageMaker modelo, utilice el parámetro de VpcConfig solicitud del CreateModelAPIo proporcione esta información cuando cree el modelo mediante el SageMaker panel de control de la consola. A continuación se muestra un ejemplo del parámetro VpcConfig incluido en su llamada a CreateModel:

"VpcConfig": { "Subnets": [ "subnet-0123456789abcdef0", "subnet-0123456789abcdef1", "subnet-0123456789abcdef2" ], "SecurityGroupIds": [ "sg-0123456789abcdef0" ] }

Puede especificar el número de instancias del punto final oculto que se van a lanzar con el initial_instance_count parámetro de la configuración de análisis para el trabajo de procesamiento de SageMaker Clarify. Alternativamente, si usa el SageMakerClarifyProcessor API en SageMaker PythonSDK, el trabajo debe obtener lo instance_count especificado por la ModelConfigclase.

nota

Incluso si solo solicita una instancia al crear el punto final oculto, necesitará al menos dos subredes del modelo ModelConfigen distintas zonas de disponibilidad. De lo contrario, la creación de punto de conexión de sobra produce el siguiente error:

ClientError: Error al alojar el punto final sagemaker-clarify-endpoint-XXX: error. Motivo: no se pueden localizar al menos 2 zonas de disponibilidad con el tipo de instancia solicitado YYY que se superpongan con SageMaker las subredes.

Si su modelo requiere archivos de modelo en Amazon S3, entonces el modelo que Amazon VPC necesita tener un VPC punto de conexión de Amazon S3. Para obtener más información sobre cómo crear y configurar un Amazon VPC para SageMaker modelos, consulteOfrezca a los endpoints SageMaker alojados acceso a los recursos de su Amazon VPC.

Configura tu Amazon privado VPC para SageMaker Clarify Jobs

En general, puedes seguir los pasos de Configure Your Private VPC for SageMaker Processing para configurar tus trabajos privados de Amazon VPC for SageMaker Clarify. Estos son algunos de los aspectos más destacados y los requisitos especiales de los trabajos SageMaker de Clarify.

Conéctate a recursos ajenos a Amazon VPC

Si configuras tu Amazon VPC para que no tenga acceso público a Internet, necesitarás alguna configuración adicional para que Clarify SageMaker Jobs pueda acceder a recursos y servicios ajenos a tu AmazonVPC. Por ejemplo, se requiere un VPC punto de conexión Amazon S3 porque un SageMaker trabajo de Clarify necesita cargar un conjunto de datos desde un bucket de S3 y guardar los resultados del análisis en un bucket de S3. Para obtener más información, consulte Create an Amazon S3 VPC Endpoint para ver la guía de creación. Además, si un trabajo SageMaker de Clarify necesita obtener conclusiones del punto final oculto, tendrá que llamar a varios AWS servicios más.

  • Cree un VPC punto final de SageMaker API servicio de Amazon: SageMaker el trabajo de Clarify debe llamar al SageMaker API servicio de Amazon para manipular el punto final oculto o describir un SageMaker modelo para la VPC validación de Amazon. Puedes seguir las instrucciones que se proporcionan en el AWS PrivateLink blog Cómo proteger todas las SageMaker API llamadas de Amazon con el fin de crear un SageMaker API VPC terminal de Amazon que permita SageMaker a Clarify realizar las llamadas de servicio. Tenga en cuenta que el nombre del SageMaker API servicio de Amazon escom.amazonaws.region.sagemaker.api, donde region es el nombre de la región en la que VPC reside tu Amazon.

  • Cree un Amazon SageMaker Runtime VPC Endpoint: SageMaker el trabajo de Clarify debe llamar al servicio Amazon SageMaker Runtime, que enruta las invocaciones al punto final oculto. Los pasos de configuración son similares a los del SageMaker API servicio de Amazon. Tenga en cuenta que el nombre del servicio Amazon SageMaker Runtime escom.amazonaws.region.sagemaker.runtime, donde region es el nombre de la región en la que VPC reside tu Amazon.

Configurar el grupo de VPC seguridad de Amazon

SageMaker Los trabajos de Clarify admiten el procesamiento distribuido cuando se especifican dos o más instancias de procesamiento de una de las siguientes maneras:

  • SageMaker consola: el recuento de instancias se especifica en la parte de configuración de recursos del panel de configuración del trabajo de la página Crear trabajo de procesamiento.

  • SageMaker API: InstanceCount Se especifica al crear el trabajo con CreateProcessingJobAPI.

  • SageMaker Python SDK: instance_count se especifica cuando se utiliza el SageMakerClarifyProcessorAPIo el procesadorAPI.

En el procesamiento distribuido, debe permitir la comunicación entre distintas instancias en el mismo trabajo de procesamiento. Para ello, configure una regla para el grupo de seguridad que permita conexiones entrantes entre miembros del mismo grupo de seguridad. Para obtener información, consulte Reglas del grupo de seguridad.