스튜디오 노트북 만들기 - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink는 이전에 Amazon Kinesis Data Analytics for Apache Flink로 알려졌습니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스튜디오 노트북 만들기

Studio Notebook에는 스트리밍 데이터에서 SQL 실행되고 분석 결과를 반환하는 Python 또는 Scala로 작성된 쿼리 또는 프로그램이 포함되어 있습니다. 콘솔이나 를 사용하여 애플리케이션을 만들고 데이터 원본의 CLI 데이터를 분석하기 위한 쿼리를 제공합니다.

애플리케이션은 다음과 같은 구성 요소로 이루어집니다.

  • Amazon MSK 클러스터, Kinesis 데이터 스트림 또는 Amazon S3 버킷과 같은 데이터 소스.

  • AWS Glue 데이터베이스. 이 데이터베이스에는 데이터 소스, 대상 스키마 및 엔드포인트를 저장하는 테이블이 포함되어 있습니다. 자세한 내용을 알아보려면 다음과 같이 작업하십시오. AWS Glue 섹션을 참조하세요.

  • 애플리케이션 코드. 코드는 분석 쿼리 또는 프로그램을 구현합니다.

  • 애플리케이션 설정 및 런타임 속성. 애플리케이션 설정과 런타임 속성에 대한 자세한 내용은 Apache Flink 애플리케이션 개발자 안내서에서 다음 항목을 참조하세요.

    • 애플리케이션 병렬성 및 크기 조정: 애플리케이션의 병렬성 설정을 사용하여 애플리케이션이 동시에 실행할 수 있는 쿼리 수를 제어할 수 있습니다. 또한 다음과 같은 상황에서 쿼리에 실행 경로가 여러 개 있는 경우 향상된 병렬 처리 기능을 활용할 수 있습니다.

      • Kinesis 데이터 스트림의 여러 샤드를 처리하는 경우

      • KeyBy 연산자를 사용하여 데이터를 분할하는 경우.

      • 여러 윈도우 연산자를 사용하는 경우

      애플리케이션 스케일링에 대한 자세한 내용은 Apache Flink용 Managed Service for Apache Flink의 애플리케이션 스케일링을 참조하세요.

    • 로깅 및 모니터링: 애플리케이션 로깅 및 모니터링에 대한 자세한 내용은 Apache Flink용 Amazon Managed Service for Apache Flink의 로깅 및 모니터링을 참조하세요.

    • 애플리케이션은 내결함성을 위해 체크포인트와 세이브포인트를 사용합니다. Studio 노트북에서는 체크포인트와 세이브포인트가 기본적으로 활성화되지 않습니다.

AWS Management Console 또는 를 사용하여 Studio 노트북을 만들 수 AWS CLI있습니다.

콘솔에서 애플리케이션을 생성할 때 사용할 수 있는 옵션은 다음과 같습니다.

  • Amazon MSK 콘솔에서 클러스터를 선택한 다음 '실시간 데이터 처리'를 선택합니다.

  • Kinesis Data Streams 콘솔에서 데이터 스트림을 선택한 다음 애플리케이션 탭에서 실시간 데이터 처리를 선택합니다.

  • Apache Flink용 관리형 서비스 콘솔에서 Studio 탭을 선택한 다음 Studio 노트북 생성을 선택합니다.

자습서는 Event Detection with Managed Service for Apache Flink를 참조하세요.

고급 Studio 노트북 솔루션의 예는 Apache Flink Studio용 Amazon Managed Service for Apache Flink의 Apache Flink를 참조하세요.