스트리밍 데이터에 대한 대화형 분석 수행 - Managed Service for Apache Flink

Amazon Managed Service for Apache Flink는 이전에 Amazon Kinesis Data Analytics for Apache Flink로 알려졌습니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스트리밍 데이터에 대한 대화형 분석 수행

Apache Zeppelin으로 구동되는 서버리스 노트북을 사용하여 스트리밍 데이터와 상호 작용합니다. 노트북에는 여러 개의 노트가 있을 수 있으며, 각 노트에는 코드를 작성할 수 있는 하나 이상의 단락이 있을 수 있습니다.

다음 예제 SQL 쿼리는 데이터 소스에서 데이터를 검색하는 방법을 보여줍니다.

%flink.ssql(type=update) select * from stock;

Flink 스트리밍 SQL 쿼리의 자세한 예는 Apache Flink 설명서의 Managed Service for Apache Flink의 Studio 노트북 예제 및 자습서 다음 및 쿼리를 참조하세요.

Studio 노트북에서 Flink SQL 쿼리를 사용하여 스트리밍 데이터를 쿼리할 수 있습니다. Python (Table API) 및 Scala (Table and Datastream APIs) 를 사용하여 스트리밍 데이터를 대화형 방식으로 쿼리하는 프로그램을 작성할 수도 있습니다. 쿼리 또는 프로그램의 결과를 보고, 몇 초 만에 업데이트한 다음, 다시 실행하여 업데이트된 결과를 볼 수 있습니다.

플링크 인터프리터

인터프리터를 사용하여 Managed Service for Apache Flink에서 애플리케이션을 실행하는 데 사용할 언어를 지정합니다. Managed Service for Apache Flink와 함께 다음 인터프리터를 사용할 수 있습니다.

명칭 Class 설명
%flink FlinkInterpreter Creates ExecutionEnvironment/StreamExecutionEnvironment/BatchTableEnvironment/StreamTableEnvironment and provides a Scala environment
%flink.pyflink PyFlinkInterpreter Provides a python environment
%flink.ipyflink IPyFlinkInterpreter Provides an ipython environment
%flink.ssql FlinkStreamSqlInterpreter Provides a stream sql environment
%flink.bsql FlinkBatchSqlInterpreter Provides a batch sql environment

Flink 인터프리터에 대한 자세한 내용은 Apache Zeppelin용 Flink 인터프리터를 참조하세요.

%flink.pyflink 또는 %flink.ipyflink를 인터프리터로 사용하는 경우 노트북에서 결과를 시각화하려면 ZeppelinContext를 사용해야 합니다.

PyFlink 관련 예제에 대한 자세한 내용은 Apache Flink Studio 및 Python용 관리형 서비스를 사용하여 대화형 방식으로 데이터 스트림을 쿼리하는 내용을 참조하세요.

Apache Flink 테이블 환경 변수

Apache Zeppelin은 환경 변수를 사용하여 테이블 환경 리소스에 액세스할 수 있습니다.

다음 변수를 사용하여 Scala 테이블 환경 리소스에 액세스할 수 있습니다.

변수 리소스
senvStreamExecutionEnvironment
stenv블링크 플래너를 위한 StreamTableEnvironment

다음 변수를 사용하여 Python 테이블 환경 리소스에 액세스합니다.

변수 리소스
s_envStreamExecutionEnvironment
st_env블링크 플래너를 위한 StreamTableEnvironment

테이블 환경 사용에 대한 자세한 내용은 Apache Flink 설명서의 개념 및 일반 API를 참조하세요.