네트워킹 구성 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

네트워킹 구성

이 섹션에서는 관리자가 Studio 또는 Studio Classic과 Amazon EMR 클러스터 간의 통신을 허용하도록 네트워크를 구성하는 방법에 대한 정보를 제공합니다.

네트워킹 지침은 스튜디오와 EMR Amazon이 사설 Amazon Virtual Private Cloud (VPC) 내에 배포되었는지 아니면 인터넷을 통해 통신하는지에 따라 달라집니다.

기본적으로 Studio 또는 Studio Classic은 인터넷 액세스가 VPC 가능한 AWS 관리형 환경에서 실행됩니다. 인터넷 연결을 사용하면 Studio 및 Studio Classic은 인터넷을 통해 Amazon S3 버킷과 같은 AWS 리소스에 액세스합니다. 하지만 데이터 및 작업 컨테이너에 대한 액세스를 제어하기 위한 보안 요구 사항이 있는 경우 인터넷을 통해 데이터와 컨테이너에 액세스할 수 EMR 없도록 Studio 또는 Studio Classic과 Amazon을 구성하는 것이 좋습니다. 리소스에 대한 액세스를 제어하거나 공용 인터넷 액세스 없이 Studio 또는 Studio Classic을 실행하려면 Amazon SageMaker 도메인에 온보딩할 때 VPC only 네트워크 액세스 유형을 지정하면 됩니다. 이 시나리오에서 Studio와 Studio Classic은 모두 프라이빗 VPC엔드포인트를 통해 다른 AWS 서비스와의 연결을 설정합니다. Studio 또는 Studio Classic을 VPC only 모드로 구성하는 방법에 대한 자세한 내용은 SageMaker Studio 또는 Studio Classic 노트북을 VPC a에서 외부 리소스에 연결을 참조하십시오. .

처음 두 섹션에서는 공용 인터넷 액세스 VPCs 없이 Studio 또는 Studio Classic과 Amazon EMR 클러스터 간의 통신을 보장하는 방법을 설명합니다. 마지막 섹션에서는 인터넷 연결을 EMR 사용하여 Studio 또는 Studio Classic과 Amazon 간의 통신을 보장하는 방법에 대해 설명합니다. 인터넷에 EMR 접속하지 않고 스튜디오 또는 스튜디오 클래식과 Amazon을 연결하기 전에 Amazon 심플 스토리지 서비스 (데이터 스토리지), Amazon (로깅 및 모니터링) 및 Amazon SageMaker Runtime CloudWatch (세분화된 역할 기반 액세스 제어 ()) 에 대한 엔드포인트를 설정해야 합니다. RBAC

스튜디오 또는 스튜디오 클래식과 Amazon EMR 클러스터를 연결하려면:

스튜디오와 EMR 아마존은 분리되어 있습니다 VPCs

스튜디오 또는 스튜디오 클래식을 별도로 배포할 EMR 때 스튜디오나 스튜디오 클래식과 Amazon 간에 통신할 수 있도록 하려면VPCs:

  1. 먼저 VPC 피어링 연결을 VPCs 통해 연결합니다.

  2. 각 서브넷의 라우팅 테이블을 VPC 업데이트하여 Studio 또는 Studio Classic 서브넷과 Amazon EMR 서브넷 간에 네트워크 트래픽을 양방향으로 라우팅하십시오.

  3. 인바운드 및 아웃바운드 트래픽을 허용하도록 보안 그룹을 구성합니다.

Studio 또는 Studio Classic과 EMR Amazon을 연결하는 단계는 리소스를 단일 AWS 계정 (단일 계정 사용 사례) 으로 배포하든, 여러 계정에 배포하든 ( AWS 계정 간 사용 사례) 동일합니다.

  1. VPC피어링

    VPC피어링 연결을 생성하여 둘 VPCs (스튜디오 또는 스튜디오 클래식과 AmazonEMR) 간의 네트워킹을 용이하게 하십시오.

    1. 스튜디오 또는 스튜디오 클래식 계정의 VPC 대시보드에서 피어링 연결을 선택한 다음 피어링 연결 생성을 선택합니다.

    2. 스튜디오 또는 스튜디오 클래식을 VPC EMR VPC Amazon과 페어링하기 위한 요청을 생성하십시오. 다른 AWS 계정에서 피어링을 요청할 때는 VPC피어링할 다른 계정 선택에서 다른 계정을 선택합니다.

      교차 계정 피어링의 경우 관리자는 Amazon EMR 계정의 요청을 수락해야 합니다.

      프라이빗 서브넷을 피어링할 때는 피어링 연결 수준에서 프라이빗 IP DNS 확인을 활성화해야 합니다VPC.

  2. 라우팅 테이블

    스튜디오 또는 스튜디오 클래식 서브넷과 Amazon EMR 서브넷 간에 네트워크 트래픽을 양방향으로 전송합니다.

    피어링 연결을 설정한 후 관리자 (계정 간 액세스의 경우 각 계정의 관리자) 는 프라이빗 서브넷 라우팅 테이블에 경로를 추가하여 Studio 또는 Studio Classic과 클러스터 서브넷 간에 트래픽을 라우팅할 수 있습니다. 대시보드에서 각 VPC라우팅 테이블 섹션으로 이동하여 이러한 경로를 정의할 수 있습니다. VPC

    Studio VPC 서브넷의 라우팅 테이블을 보여주는 다음 그림은 피어링 연결을 통해 Studio 계정에서 Amazon EMR VPC IP 범위 (여기2.0.1.0/24) 로 향하는 아웃바운드 경로의 예를 보여줍니다.

    아웃바운드 경로를 보여 주는 Studio VPC 서브넷의 라우팅 테이블.

    다음 Amazon EMR VPC 서브넷 라우팅 테이블 그림은 피어링 연결을 통해 Amazon에서 Studio VPC IP 범위 (여기10.0.20.0/24) EMR VPC 로 돌아가는 경로의 예를 보여줍니다.

    반환 경로를 보여주는 Amazon EMR VPC 서브넷의 라우팅 테이블.
  3. 보안 그룹

    마지막으로 Studio 또는 Studio Classic 도메인의 보안 그룹은 아웃바운드 트래픽을 허용해야 하며 Amazon EMR 기본 노드의 보안 그룹은 Studio 또는 Studio Classic 인스턴스 보안 그룹의 Apache Livy, Hive 또는 Presto TCP 포트 (각각 899810000, 및8889) 의 인바운드 트래픽을 허용해야 합니다. Apache Livy는 인터페이스를 EMR 통해 Amazon과 상호 작용할 수 있게 해주는 서비스입니다REST.

다음 다이어그램은 Studio JupyterLab Classic 노트북이 Service Catalog의 AWS CloudFormation 템플릿에서 Amazon EMR 클러스터를 프로비저닝한 다음 동일한 AWS 계정 내의 Amazon EMR 클러스터에 연결할 수 있도록 하는 Amazon VPC 설정의 예를 보여줍니다. 다이어그램은 인터넷에 액세스할 수 VPCs 없을 때 Amazon S3 또는 Amazon CloudWatch 같은 다양한 AWS 서비스에 직접 연결하는 데 필요한 엔드포인트를 추가로 보여줍니다. 또는 NAT게이트웨이를 사용하여 여러 개의 VPCs 프라이빗 서브넷에 있는 인스턴스가 인터넷에 액세스할 때 인터넷 게이트웨이가 제공하는 단일 퍼블릭 IP 주소를 공유할 수 있도록 해야 합니다.

Amazon VPC 설치 아키텍처 예시.

스튜디오와 EMR 아마존은 같은 위치에 있습니다 VPC

Studio 또는 Studio Classic과 Amazon EMR 클러스터가 서로 다른 서브넷에 있는 경우 각 프라이빗 서브넷 라우팅 테이블에 경로를 추가하여 Studio 또는 Studio Classic과 클러스터 서브넷 간에 트래픽을 라우팅합니다. VPC대시보드에서 각 라우팅 테이블 섹션으로 이동하여 이러한 경로를 정의할 수 있습니다. VPC Studio 또는 Studio Classic과 Amazon EMR 클러스터를 동일한 VPC 서브넷에 배포한 경우 스튜디오 또는 Studio Classic과 클러스터 간에 트래픽을 라우팅할 필요가 없습니다.

라우팅 테이블을 업데이트해야 하는지 여부에 관계없이 Studio 또는 Studio Classic 도메인의 보안 그룹은 아웃바운드 트래픽을 허용해야 하며 Amazon EMR 기본 노드의 보안 그룹은 Studio 또는 Studio Classic 인스턴스 보안 그룹의 Apache Livy, Hive 또는 Presto TCP 포트 (각각 899810000, 및8889) 에서 들어오는 인바운드 트래픽을 허용해야 합니다. Apache Livy는 인터페이스를 통해 Amazon EMR 클러스터와 상호 작용할 수 있게 해주는 서비스입니다REST.

스튜디오와 Amazon은 공용 인터넷을 통해 EMR 통신합니다.

기본적으로 Studio 및 Studio Classic은 SageMaker 도메인과 VPC 연결된 인터넷 게이트웨이를 통해 인터넷과 통신할 수 있는 네트워크 인터페이스를 제공합니다. 퍼블릭 인터넷을 EMR 통해 Amazon에 연결하기로 선택한 경우 Amazon EMR 클러스터는 인터넷 게이트웨이로부터 Apache Livy, Hive 또는 Presto TCP 포트 (각각 899810000, 및8889) 의 인바운드 트래픽을 수락해야 합니다. Apache Livy는 인터페이스를 통해 Amazon EMR 클러스터와 상호 작용할 수 있게 해주는 서비스입니다REST.

인바운드 트래픽을 허용하는 모든 포트는 잠재적인 보안 취약성을 나타낸다는 점에 유의하세요. 취약점들을 최소한으로 줄일 수 있도록 사용자 지정 보안 그룹을 신중하게 검토하세요. 자세한 내용은 보안 그룹에서 네트워크 트래픽 제어를 참조하세요.

또는 EMRAmazon에서 Kerberos를 활성화하고, 클러스터를 프라이빗 서브넷에 설정하고, Network Load Balancer NLB () 를 사용하여 클러스터에 액세스하여 보안 그룹을 통해 액세스가 제어되는 특정 포트만 노출하는 방법에 블로그 및 백서 대한 자세한 안내는 을 참조하십시오.

참고

퍼블릭 인터넷을 통해 Apache Livy 엔드포인트에 연결할 때는 Studio 또는 Studio Classic과 Amazon EMR 클러스터 간의 통신을 사용하여 보호하는 것이 좋습니다. TLS

Apache Livy를 HTTPS 사용하여 설정하는 방법에 대한 자세한 내용은 Apache Livy를 사용한 활성화를 HTTPS 참조하십시오. 전송 암호화가 활성화된 Amazon EMR 클러스터를 설정하는 방법에 대한 자세한 내용은 Amazon EMR 암호화로 전송 데이터를 암호화하기 위한 인증서 제공을 참조하십시오. 또한 에서 Amazon EMR 클러스터에 연결 HTTPS 지정한 대로 인증서 키에 액세스할 수 있도록 Studio 또는 Studio Classic을 구성해야 합니다.