대화형 세션을 사용하여 데이터를 준비하세요. AWS Glue - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

대화형 세션을 사용하여 데이터를 준비하세요. AWS Glue

AWS Glue 대화형 세션은 데이터 과학자와 데이터 엔지니어가 데이터 준비 및 분석 애플리케이션을 신속하게 구축, 테스트 및 실행하는 데 사용할 수 있는 온디맨드 서버리스 Apache Spark 런타임 환경입니다.

Studio 또는 Studio Classic에서 JupyterLab 노트북을 시작하여 AWS Glue 대화형 세션을 시작할 수 있습니다. 노트북을 시작할 때 내장 Glue PySpark and Ray 또는 Glue Spark 커널을 선택하십시오. 그러면 대화형 서버리스 Spark 세션이 자동으로 시작됩니다. 컴퓨팅 클러스터 또는 인프라를 프로비저닝하거나 관리할 필요가 없습니다. 초기화한 후에는 Studio 또는 Studio Classic 노트북에서 Spark를 사용하여 데이터를 탐색하고, 복잡한 쿼리를 실행하고, 대화형 방식으로 데이터를 분석하고 준비할 수 있습니다. AWS Glue Data Catalog그런 다음 준비된 데이터를 사용하여 내부에 특별히 구축된 ML 도구를 사용하여 모델을 구축, 교육, 조정 및 배포할 수 있습니다. SageMaker

Studio 또는 Studio Classic에서 AWS Glue 대화형 세션을 시작하기 전에 적절한 역할과 정책을 설정해야 합니다. 또한 Amazon S3 스토리지 버킷과 같은 추가 리소스에 대한 액세스 권한을 제공해야 할 수도 있습니다. 필수 IAM 정책에 대한 자세한 내용은 을 참조하십시오스튜디오 또는 스튜디오 클래식의 AWS Glue 인터랙티브 세션에 대한 권한.

Studio 및 Studio Classic은 AWS Glue 대화형 세션의 기본 구성을 제공하지만 Jupyter magic AWS Glue명령의 전체 카탈로그를 사용하여 환경을 추가로 사용자 지정할 수 있습니다. 대화형 세션에서 사용할 수 있는 기본 및 추가 Jupyter 매직에 대한 자세한 내용은 을 AWS Glue 참조하십시오. 스튜디오 또는 스튜디오 클래식에서 AWS Glue 대화형 세션을 구성하세요.

  • AWS Glue 대화형 세션을 시작하는 Studio Classic 사용자는 다음 이미지와 커널 중에서 선택할 수 있습니다.

    • 이미지:, SparkAnalytics 1.0 SparkAnalytics 2.0

    • 커널: Glue Python [PySpark and Ray]Glue Spark

  • Studio 사용자의 경우 기본 SageMaker 배포 이미지를 사용하고 하나 Glue Python [PySpark and Ray] 또는 Glue Spark 커널을 선택합니다.