VPC의 Studio 노트북을 외부 리소스에 연결 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

VPC의 Studio 노트북을 외부 리소스에 연결

다음 주제에서는 VPC의 Studio 노트북를 외부 리소스에 연결하는 방법에 대한 정보를 제공합니다.

인터넷과의 기본 통신

기본적으로 SageMaker Studio는 SageMaker AI에서 관리하는 VPC를 통해 인터넷과 통신할 수 있는 네트워크 인터페이스를 제공합니다. Amazon S3 및 CloudWatch 와 같은 AWS 서비스에 대한 트래픽은 인터넷 게이트웨이를 통과합니다. SageMaker API 및 SageMaker AI 런타임에 액세스하는 트래픽도 인터넷 게이트웨이를 통과합니다. 도메인과 Amazon EFS 볼륨 간의 트래픽은 Studio에서 온보딩하거나 CreateDomain API를 직접 호출할 때 식별한 VPC를 통과합니다. 다음 다이어그램은 기본 구성을 보여줍니다.

직접 인터넷 액세스 사용을 나타내는 SageMaker Studio VPC 다이어그램.

인터넷과의 VPC only통신

SageMaker AI가 Studio 노트북에 인터넷 액세스를 제공하지 못하도록 하려면 VPC only 네트워크 액세스 유형을 지정하여 인터넷 액세스를 비활성화합니다. Studio에 온보딩하거나 CreateDomain API를 직접 호출할 때 이 네트워크 액세스 유형을 지정합니다. 이렇게 하면 다음과 같은 경우가 아니면 Studio 노트북을 실행할 수 없습니다.

  • VPC에 SageMaker API 및 런타임에 대한 인터페이스 엔드포인트 또는 인터넷 액세스가 가능한 NAT 게이트웨이가 있는 경우

  • 보안 그룹이 아웃바운드 연결을 허용하는 경우

다음 다이어그램은 VPC 전용 모드 사용 구성을 보여줍니다.

VPC 전용 모드의 사용을 보여주는 SageMaker Studio VPC 다이어그램.

VPC only 모드 사용 요구 사항

VpcOnly를 선택했다면, 다음 단계를 따르세요.

  1. 프라이빗 서브넷만 사용해야 합니다. VpcOnly 모드에서는 퍼블릭 서브넷을 사용할 수 없습니다.

  2. 서브넷에 필요한 수의 IP 주소가 있는지 확인하세요. 사용자당 필요한 예상 IP 주소 수는 사용 사례에 따라 달라질 수 있습니다. 사용자당 2~4개의 IP 주소를 사용하는 것이 좋습니다. Studio 도메인의 총 IP 주소 용량은 도메인 생성 시 제공된 각 서브넷에 사용 가능한 IP 주소의 합계입니다. IP 주소 사용량이 제공하는 서브넷 수가 지원하는 용량을 초과하지 않는지 확인하세요. 또한 여러 가용 영역에 분산된 서브넷을 사용하면 IP 주소 가용성을 높이는 데 도움이 될 수 있습니다. 자세한 내용은 IPv4의 경우 VPC 및 서브넷 크기 조정을 참조하세요.

    참고

    사용자 인스턴스가 실행되는 공유 하드웨어의 기본 테넌시 VPC 만을 사용하여 서브넷을 구성할 수 있습니다. VPC의 테넌시 속성에 대한 자세한 내용은 전용 인스턴스를 참조하세요.

  3. 주의

    VpcOnly 모드를 사용하는 경우 도메인의 네트워킹 구성을 부분적으로 소유하게 됩니다. 보안 그룹 규칙이 제공하는 인바운드 및 아웃바운드 액세스에 최소 권한을 적용하는 보안 모범 사례를 사용하는 것이 좋습니다. 인바운드 규칙 구성이 지나치게 허용되면 VPC에 액세스할 수 있는 사용자가 인증 없이 다른 사용자 프로필의 애플리케이션과 상호 작용할 수 있습니다.

    다음 트래픽을 허용하는 인바운드 및 아웃바운드 규칙을 사용하여 하나 이상의 보안 그룹을 설정합니다.

    각 사용자 프로필에 대해 고유한 보안 그룹을 만들고 동일한 보안 그룹의 인바운드 액세스를 추가하세요. 사용자 프로필에 도메인 수준 보안 그룹을 재사용하지 않는 것이 좋습니다. 도메인 수준 보안 그룹이 자체로의 인바운드 액세스를 허용하면 도메인의 모든 애플리케이션이 도메인의 다른 모든 애플리케이션에 액세스할 수 있게 됩니다.

  4. 인터넷 액세스를 허용하려면 인터넷 게이트웨이 등을 통해 인터넷에 액세스할 수 있는 NAT 게이트웨이를 사용해야 합니다.

  5. 인터넷 액세스를 제거하려면 인터페이스 VPC 엔드포인트(PrivateLink)를 생성하여 Studio가 해당 서비스 이름으로 다음 서비스에 액세스할 수 있도록 합니다.AWS PrivateLink 또한 VPC의 보안 그룹을 이러한 엔드포인트와 연결해야 합니다.

    • SageMaker API : com.amazonaws.region.sagemaker.api

    • SageMaker AI 런타임: com.amazonaws.region.sagemaker.runtime. 이는 Studio 노트북을 실행하고 모델을 훈련 및 호스팅하는 데 필요합니다.

    • Amazon S3: com.amazonaws.region.s3.

    • SageMaker 프로젝트를 사용하려면: com.amazonaws.region.servicecatalog.

    • 필요한 기타 AWS 서비스.

    SageMaker Python SDK를 사용하여 원격 훈련 작업을 실행하는 경우 다음과 같은 Amazon VPC 엔드포인트도 생성해야 합니다.

    • AWS Security Token Service: com.amazonaws.region.sts

    • Amazon CloudWatch: com.amazonaws.region.logs. 이는 SageMaker Python SDK가 원격 훈련 작업 상태를 가져오도록 허용하는 데 필요합니다 Amazon CloudWatch.

참고

VPC 모드에서 작업하는 고객의 경우 회사 방화벽으로 인해 SageMaker Studio 또는 JupyterServer와 KernelGateway 간의 연결 문제가 발생할 수 있습니다. 방화벽 뒤에서 SageMaker Studio를 사용할 때 이러한 문제 중 하나가 발생하는 경우 다음 사항을 확인하세요.

  • Studio URL이 네트워크 허용 목록에 있는지 확인하세요.

  • WebSocket 연결이 차단되지 않았는지 확인하세요. Jupyter는 내부적으로 WebSocket을 사용합니다. KernelGateway 애플리케이션이 서비스 중인 경우 JupyterServer가 KernelGateway에 연결하지 못할 수 있습니다. 시스템 터미널을 열 때도 이 문제가 나타날 것입니다.