기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
참고
Amazon QuickSight에서 ML 기반 기능을 사용하는 분석 및 대시보드를 작성하는 데는 기계 학습(ML)에 대한 기술적 경험이 필요하지 않습니다.
Amazon SageMaker AI 기계 학습 모델을 사용하여 Amazon QuickSight Enterprise 에디션 데이터를 보강할 수 있습니다. Amazon SageMaker Amazon QuickSight에서 지원되는 데이터 소스에서 가져와서 SPICE에 저장한 데이터에 대한 추론을 실행할 수 있습니다. 지원되는 데이터 소스의 전체 목록은 지원되는 데이터 소스 단원을 참조하세요.
Amazon QuickSight를 SageMaker AI 모델과 함께 사용하면 데이터 이동을 관리하고 코드를 작성하는 데 드는 시간을 절약할 수 있습니다. 결과는 모델을 평가하는 데 유용하며, 결과에 만족하는 경우 의사 결정자와 공유하는 데도 유용합니다. 모델이 구축된 후에 바로 시작할 수 있습니다. 이렇게 하면 데이터 과학자가 사전에 구축한 모델을 구현하여 데이터 세트에 데이터 과학을 적용할 수 있습니다. 그런 다음 이러한 분석 정보를 예측 대시보드에서 공유할 수 있습니다. Amazon QuickSight 서버리스 접근 방식을 사용하면 프로세스가 원활하게 확장되므로 추론 또는 쿼리 용량에 대해 걱정할 필요가 없습니다.
Amazon QuickSight는 회귀 및 분류 알고리즘을 사용하는 SageMaker AI 모델을 지원합니다. 이 기능을 적용하여 거의 모든 비즈니스 사용 사례에 대한 예측을 얻을 수 있습니다. 몇 가지 예로는 고객 이탈 및 직원 퇴직 가능성 예측, 잠재 고객 점수 산정, 신용 위험 평가 등이 있습니다. Amazon QuickSight를 사용하여 예측을 제공하려면 입력 및 출력 모두에 대한 SageMaker AI 모델 데이터가 테이블 형식이어야 합니다. 다중 클래스 또는 다중 레이블 분류 사용 사례에서 각 출력 열에는 단일 값이 포함되어야 합니다. Amazon QuickSight는 단일 열 내의 여러 값을 지원하지 않습니다.
주제
SageMaker AI 통합 작동 방식
일반적으로 이 프로세스는 다음과 같이 작동합니다.
-
Amazon QuickSight 관리자는 Amazon QuickSight가 SageMaker AI에 액세스할 수 있는 권한을 추가합니다. 이렇게 하려면 QuickSight 관리 페이지에서 보안 및 권한 설정을 엽니다. AWS 서비스에 대한 QuickSight 액세스로 이동하여 SageMaker AI를 추가합니다.
이러한 권한을 추가하면 Amazon QuickSight가 AWS 계정의 모든 SageMaker AI 모델을 나열할 수 있는 액세스 권한을 제공하는 AWS Identity and Access Management (IAM) 역할에 추가됩니다. 또한 접두사가 인 이름이 있는 SageMaker AI 작업을 실행할 수 있는 권한을 제공합니다
quicksight-auto-generated-
. -
추론 파이프라인이 있는 SageMaker AI 모델에 연결하는 것이 좋습니다. 데이터 사전 처리를 자동으로 수행하기 때문입니다. 자세한 내용은 SageMaker AI 개발자 안내서의 추론 파이프라인 배포를 참조하세요. SageMaker
-
함께 사용할 데이터와 사전 훈련된 모델을 식별하면 모델 소유자가 스키마 파일을 생성하여 제공합니다. 이 JSON 파일은 SageMaker AI와의 계약입니다. 모델에 필요한 필드, 데이터 형식, 열 순서, 출력 및 설정에 대한 메타데이터를 제공합니다. 선택적 설정 구성 요소는 작업에 사용할 컴퓨팅 인스턴스의 크기와 개수를 지정합니다.
모델을 구축한 데이터 과학자인 경우, 다음에서 설명하는 형식을 사용하여 이 스키마 파일을 생성합니다. 모델 사용자는 모델 소유자로부터 스키마 파일을 가져옵니다.
-
먼저 Amazon QuickSight에서 예측을 수행할 데이터가 포함된 새 데이터 세트를 생성합니다. 파일을 업로드하는 경우 업로드 설정 화면에서 SageMaker AI 모델을 추가할 수 있습니다. 그렇지 않으면 데이터 준비 페이지에서 모델을 추가합니다.
계속하기 전에 데이터 세트와 모델 간의 매핑을 확인합니다.
-
데이터를 데이터 세트로 가져오면 출력 필드에 SageMaker AI에서 반환된 데이터가 포함됩니다. 이러한 필드는 사용 지침에서 설명하는 지침에 따라 다른 필드를 사용하는 것과 같은 방식으로 사용할 수 있습니다.
SageMaker AI 통합을 실행하면 Amazon QuickSight는 추론 파이프라인을 사용하여 배치 변환 작업을 실행하도록 SageMaker AI에 요청을 전달합니다. Amazon QuickSight는 AWS 계정에 필요한 인스턴스의 프로비저닝 및 배포를 시작합니다. 처리가 완료되면 이러한 인스턴스가 종료됩니다. 컴퓨팅 용량은 모델을 처리할 때만 비용이 발생합니다.
이를 쉽게 식별할 수 있도록 Amazon QuickSight는 접두사 로 모든 SageMaker AI 작업의 이름을 지정합니다
quicksight-auto-generated-
. -
추론의 출력은 SPICE에 저장되고 데이터 세트에 추가됩니다. 추론이 완료되는 즉시 데이터 세트를 통해 예측 데이터를 사용하여 시각화 및 대시보드를 생성할 수 있습니다.
-
데이터 세트를 저장할 때마다 데이터 새로 고침이 시작됩니다. SPICE 데이터 세트를 새로 고쳐 수동으로 데이터 새로 고침 프로세스를 시작하거나 일정 간격으로 새로 고침이 실행되도록 예약할 수 있습니다. 각 데이터 새로 고침 중에 시스템은 SageMaker AI 배치 변환을 자동으로 호출하여 출력 필드를 새 데이터로 업데이트합니다.
Amazon QuickSight SPICE 수집 API 작업을 사용하여 데이터 새로 고침 프로세스를 제어할 수 있습니다. 이러한 API 작업을 사용하는 방법에 대한 자세한 내용은 Amazon QuickSight API 참조를 확인하세요.
발생 비용(통합 자체에 대한 추가 비용 없음)
통합 기능을 사용하는 것 자체로는 추가 요금이 발생하지 않습니다. 비용에는 다음이 포함됩니다.
-
모델이 실행 중일 때만 발생하는 SageMaker AI를 통한 모델 배포 비용입니다. 생성 또는 편집한 후 데이터 세트를 저장하거나 데이터를 새로 고치면 데이터 수집 프로세스가 시작됩니다. 이 프로세스에는 데이터 세트에 추론된 필드가 있는 경우 SageMaker AI를 호출하는 작업이 포함됩니다. QuickSight 구독이 있는 동일한 AWS 계정에서 비용이 발생합니다.
-
다음과 같은 QuickSight 구독 비용
-
QuickSight의 인 메모리 계산 엔진(SPICE)에 데이터를 저장하는 비용. SPICE에 새 데이터를 추가하는 경우, 데이터를 수용하기에 충분한 SPICE 용량을 구입해야 할 수 있습니다.
-
데이터 세트를 빌드하는 작성자 또는 관리자를 위한 QuickSight 구독
-
최종 사용자(독자)가 대화형 대시보드에 액세스하는 데 부과되는 세션당 요금
-
사용 지침
Amazon QuickSight에서는 이 Enterprise Edition 기능에 다음 사용 지침이 적용됩니다.
-
모델의 처리는 SPICE에서 이루어집니다. 따라서 SPICE에 저장된 데이터 세트에만 적용할 수 있습니다. 이 프로세스는 현재 데이터 세트당 최대 5억 개의 행을 지원합니다.
-
QuickSight 관리자 또는 작성자만 ML 모델로 데이터 세트를 보강할 수 있습니다. 독자는 대시보드에 포함된 경우에만 결과를 볼 수 있습니다.
-
각 데이터 세트에 오직 하나의 ML 모델을 사용할 수 있습니다.
-
출력 필드는 새 필드를 계산하는 데 사용할 수 없습니다.
-
데이터 세트는 모델과 통합된 필드별로 필터링할 수 없습니다. 즉, 데이터 세트 필드가 현재 ML 모델에 매핑되어 있으면 해당 필드를 필터링 할 수 없습니다.
SageMaker AI에서는 Amazon QuickSight에서 사용하는 사전 훈련된 모델에 다음 사용 지침이 적용됩니다.
-
모델을 생성할 때 해당 IAM 역할에 대한 Amazon 리소스 이름(ARN)과 모델을 연결합니다. SageMaker AI 모델의 IAM 역할은 Amazon QuickSight가 사용하는 Amazon S3 버킷에 액세스할 수 있어야 합니다.
-
모델이 입력 및 출력 모두에 대해 .csv 파일을 지원하는지 확인합니다. 데이터가 표 형식인지 확인합니다.
-
입력 및 출력 필드 목록을 포함하여 모델에 대한 메타데이터가 들어 있는 스키마 파일을 제공합니다. 현재는 이 스키마 파일을 수동으로 생성해야 합니다.
-
추론을 완료하는 데 걸리는 시간을 고려합니다. 이 시간은 여러 가지 요인에 따라 달라집니다. 여기에는 모델의 복잡성, 데이터 양, 정의된 컴퓨팅 용량 등이 포함됩니다. 추론을 완료하는 데는 몇 분에서 몇 시간이 걸릴 수 있습니다. Amazon QuickSight에서는 모든 데이터 수집 및 추론 작업이 최대 10시간으로 제한됩니다. 추론에 소요되는 시간을 줄이기 위해 인스턴스 크기 또는 인스턴스 수를 늘리는 것이 좋습니다.
-
현재는 실시간 데이터가 아닌 SageMaker AI와의 통합에 배치 변환만 사용할 수 있습니다. SageMaker AI 엔드포인트는 사용할 수 없습니다.
스키마 파일 정의
SageMaker AI 모델을 Amazon QuickSight 데이터와 함께 사용하기 전에 Amazon QuickSight가 모델을 처리하는 데 필요한 메타데이터가 포함된 JSON 스키마 파일을 생성합니다. Amazon QuickSight 작성자 또는 관리자가 데이터 세트를 구성할 때 스키마 파일을 업로드합니다.
스키마 필드는 다음과 같이 정의됩니다. 다음 설명에 달리 명시되지 않은 한 모든 필드가 필요합니다. 속성은 대소문자를 구분합니다.
- inputContentType
-
이 SageMaker AI 모델이 입력 데이터에 대해 기대하는 콘텐츠 유형입니다.
"text/csv"
값만 지원됩니다. QuickSight에서는 입력 파일에 추가되는 헤더 이름을 포함하지 않습니다. - outputContentType
-
사용하려는 SageMaker AI 모델에서 생성되는 출력의 콘텐츠 유형입니다.
"text/csv"
값만 지원됩니다. - 입력
-
모델에서 입력 데이터에 필요한 기능 목록입니다. QuickSight는 입력 데이터를 정확히 동일한 순서로 생성합니다. 이 목록에는 다음 속성이 포함됩니다.
-
name - 열의 이름입니다. 가능하면 QuickSight 데이터 세트에 있는 해당 열의 이름과 동일하게 설정합니다. 이 속성은 100자로 제한됩니다.
-
type - 이 열의 데이터 형식입니다. 이 속성은
"INTEGER"
,"STRING"
및"DECIMAL"
값을 갖습니다. -
nullable - (선택 사항) 필드의 null 허용 여부입니다. 기본값은
true
입니다.nullable
를 로 설정하면false
QuickSight는 SageMaker AI를 호출하기 전에이 값을 포함하지 않는 행을 삭제합니다. 이렇게 하면 SageMaker AI가 누락된 필수 데이터에서 실패하는 것을 방지하는 데 도움이 됩니다.
-
- output
-
SageMaker AI 모델이 생성하는 출력 열 목록입니다. QuickSight에서는 이러한 필드가 정확히 동일한 순서로 필요합니다. 이 목록에는 다음 속성이 포함됩니다.
-
name - 이 이름은 QuickSight에서 생성된 해당 새 열의 기본 이름이 됩니다. QuickSight에서 여기에 지정된 이름을 재정의할 수 있습니다. 이 속성은 100자로 제한됩니다.
-
type - 이 열의 데이터 형식입니다. 이 속성은
"INTEGER"
,"STRING"
및"DECIMAL"
값을 갖습니다.
-
- instanceTypes
-
SageMaker AI가 변환 작업을 실행하기 위해 프로비저닝할 수 있는 ML 인스턴스 유형의 목록입니다. 이 목록은 QuickSight 사용자가 선택할 수 있도록 제공됩니다. 이 목록은 SageMaker AI에서 지원하는 유형으로 제한됩니다. 지원되는 유형에 대한 자세한 내용은 SageMaker AI 개발자 안내서의 TransformResources를 참조하세요. SageMaker
- defaultInstanceType
-
(선택 사항) QuickSight의 SageMaker AI 마법사에 기본 옵션으로 표시되는 인스턴스 유형입니다.
instanceTypes
에 이 인스턴스 유형을 포함합니다. - instanceCount
-
(선택 사항) 인스턴스 수는 SageMaker AI가 변환 작업을 실행하기 위해 프로비저닝할 선택한 인스턴스 수를 정의합니다. 값은 양의 정수여야 합니다.
- description
-
이 필드는 SageMaker AI 모델을 소유한 사람이 QuickSight에서이 모델을 사용하는 사람과 통신할 수 있는 공간을 제공합니다. 이 모델을 성공적으로 사용하기 위한 팁을 이 필드에 제공합니다. 예를 들어, 이 필드에는 데이터 세트의 크기에 따라
instanceTypes
의 목록에서 효과적인 인스턴스 유형을 선택하는 방법에 대한 정보가 포함될 수 있습니다. 이 필드는 1,000자로 제한됩니다. - version
-
스키마의 버전(예: "
1.0"
)입니다.
다음 예에서는 스키마 파일의 JSON 구조를 보여줍니다.
{
"inputContentType": "CSV",
"outputContentType": "CSV",
"input": [
{
"name": "buying",
"type": "STRING"
},
{
"name": "maint",
"type": "STRING"
},
{
"name": "doors",
"type": "INTEGER"
},
{
"name": "persons",
"type": "INTEGER"
},
{
"name": "lug_boot",
"type": "STRING"
},
{
"name": "safety",
"type": "STRING"
}
],
"output": [
{
"name": "Acceptability",
"type": "STRING"
}
],
"description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB",
"version": "1.0",
"instanceCount": 1,
"instanceTypes": [
"ml.m4.xlarge",
"ml.m4.4xlarge"
],
"defaultInstanceType": "ml.m4.xlarge"
}
스키마 파일의 구조는 SageMaker AI에서 제공하는 예제에서 사용되는 모델 유형과 관련이 있습니다.
QuickSight 데이터 세트에 SageMaker AI 모델 추가
다음 절차를 사용하여 데이터 세트에 사전 훈련된 SageMaker AI 모델을 추가하여 분석 및 대시보드에서 예측 데이터를 사용할 수 있습니다.
시작하기 전에 다음 항목을 준비합니다.
-
데이터 세트를 빌드하는 데 사용할 데이터
-
데이터 세트를 보강하는 데 사용할 SageMaker AI 모델의 이름입니다.
-
모델의 스키마. 이 스키마에는 필드 이름 매핑과 데이터 형식이 포함됩니다. 사용할 인스턴스 유형 및 인스턴스 수에 대한 권장 설정도 포함되어 있는 것이 좋습니다.
SageMaker AI로 Amazon QuickSight 데이터 세트를 강화하려면
-
데이터 세트를 선택한 다음 새 데이터 세트를 선택하여, 시작 페이지에서 새 데이터 세트를 생성합니다.
또한 기존 데이터 세트를 편집할 수도 있습니다.
-
데이터 준비 화면에서 SageMaker를 사용한 증강을 선택합니다.
-
모델 선택에서 다음 설정을 선택합니다.
-
모델 - 필드를 추론하는 데 사용할 SageMaker AI 모델을 선택합니다.
-
이름 - 모델을 설명하는 이름을 입력합니다.
-
스키마 - 모델에 제공된 JSON 스키마 파일을 업로드합니다.
-
고급 설정 - QuickSight에서는 데이터 세트를 기반으로 선택된 기본값을 사용하는 것이 좋습니다. 필요할 경우 특정 런타임 설정을 사용하여 작업 속도와 비용의 균형을 조정할 수 있습니다. 이렇게 하려면 인스턴스 유형에 SageMaker AI ML 인스턴스 유형을 입력하고 개수에 인스턴스 수를 입력합니다.
다음을 선택하여 계속 진행합니다.
-
-
입력 검토에서 데이터 세트에 매핑된 필드를 검토합니다. QuickSight는 스키마의 필드를 데이터 세트의 필드에 자동으로 매핑하려고 시도합니다. 매핑을 조정해야 하는 경우 여기에서 변경할 수 있습니다.
다음을 선택하여 계속 진행합니다.
-
출력 검토에서 데이터 세트에 추가된 필드를 봅니다.
데이터 저장 및 준비를 선택하여 선택 사항을 확인합니다.
-
데이터를 새로 고치려면 데이터 세트를 선택하여 세부 정보를 확인합니다. 그런 다음 지금 새로 고침을 선택하여 수동으로 데이터를 새로 고치거나 새로 고침 예약을 선택하여 정기적인 새로 고침 간격을 설정합니다. 각 데이터 새로 고침 중에 시스템은 SageMaker AI 배치 변환 작업을 자동으로 실행하여 출력 필드를 새 데이터로 업데이트합니다.