기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
이 섹션을 통해 QuickSight에서 Databricks로 연결하는 방법을 알아보십시오.
Databricks에 연결하기
-
먼저 새 데이터 세트를 생성합니다. 왼쪽 탐색 창에서 데이터 세트를 선택한 다음 새 데이터 세트를 선택합니다.
-
Databricks 데이터 소스 카드를 선택합니다.
-
데이터 소스 이름의 경우 Databricks 데이터 소스 연결(예:
Databricks CS
)의 설명이 포함된 이름을 입력합니다. Databricks에 연결하여 많은 데이터 세트를 생성할 수 있으므로 이름은 단순하게 유지하는 것이 좋습니다.다음 스크린샷은 Databricks의 연결 화면을 보여줍니다.
-
연결 유형에서 사용 중인 네트워크 유형을 선택합니다.
퍼블릭 네트워크 - 데이터를 공개적으로 공유하는 경우.
VPC - 데이터가 VPC 내에 있는 경우.
참고
VPC를 사용 중인데 목록에 없는 경우 관리자에게 문의하세요.
-
데이터베이스 서버의 경우 Databricks 연결 세부 정보에 지정된 작업 공간의 호스트 이름을 입력합니다.
-
HTTP 경로의 경우 Databricks 연결 세부 정보에 지정된 스파크 인스턴스의 부분 URL을 입력합니다.
-
포트에는 Databricks 연결 세부 정보에 지정된 포트를 입력합니다.
-
사용자 이름 및 비밀번호에 연결 보안 인증 정보를 입력합니다.
-
연결이 제대로 작동하는지 확인하려면 연결 검증을 클릭합니다.
-
완료하고 데이터 소스를 만들려면 데이터 소스 만들기를 클릭합니다.
Databricks용 새 QuickSight 데이터 세트 추가
Databricks 데이터에 대한 기존 데이터 소스 연결이 있으면 분석에 사용할 Databricks 데이터 세트를 생성할 수 있습니다.
Databricks를 사용하여 데이터 세트 생성하기
-
왼쪽에서 데이터 세트를 선택한 다음 아래로 스크롤하여 Databricks 연결을 위한 데이터 소스 카드를 찾습니다. 데이터 소스가 여러 개 있는 경우 페이지 상단의 검색 창을 사용하여 이름이 일부 일치하는 데이터 소스를 찾을 수 있습니다.
-
Databricks 데이터 소스 카드를 선택한 다음 데이터 세트 생성을 선택합니다. 다음과 같은 팝업이 표시됩니다.
-
연결하려는 테이블을 지정하려면 먼저 사용할 카탈로그와 스키마를 선택합니다. 그런 다음 테이블에서 사용할 테이블을 선택합니다. 자체 SQL 문을 사용하려면 사용자 지정 SQL 사용을 선택합니다.
-
편집/미리 보기를 선택합니다.
-
(선택 사항) 데이터를 더 많이 추가하려면 다음 단계를 사용합니다.
-
오른쪽 상단에서 데이터 추가를 선택합니다.
-
다른 데이터에 연결하려면 데이터 소스 전환을 선택하고 다른 데이터 세트를 선택합니다.
-
UI 프롬프트에 따라 데이터 추가를 완료합니다.
-
동일한 데이터 세트에 새 데이터를 추가한 후 이 조인 구성(빨간색 점 2개)을 선택합니다. 각 추가 테이블에 대해 조인을 설정합니다.
-
계산된 필드를 추가하고자 하는 경우 계산된 필드 추가를 선택합니다.
-
SageMaker AI에서 모델을 추가하려면 Augment with SageMaker를 선택합니다. 이 옵션은 QuickSight 엔터프라이즈 에디션에서만 사용할 수 있습니다.
-
생략할 필드의 확인란을 선택 취소하십시오.
-
변경하고자 하는 데이터 유형을 업데이트하세요.
-
-
마치면 저장을 선택하여 데이터 세트를 저장하고 닫습니다.