기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
아마존 SageMaker 모델과 아마존 통합 QuickSight
참고
Amazon의 ML 기반 기능을 사용하는 분석 및 대시보드를 작성하기 위해 기계 학습 (ML) 관련 기술 경험이 없어도 됩니다. QuickSight
Amazon SageMaker 기계 학습 모델을 사용하여 Amazon QuickSight 엔터프라이즈 에디션 데이터를 보강할 수 있습니다. QuickSightAmazon에서 지원하는 모든 데이터 소스에서 SPICE 가져온 데이터에 대해 추론을 실행할 수 있습니다. 지원되는 데이터 소스의 전체 목록은 지원되는 데이터 소스 단원을 참조하세요.
Amazon을 SageMaker 모델과 QuickSight 함께 사용하면 데이터 이동 관리 및 코드 작성에 소요되는 시간을 절약할 수 있습니다. 결과는 모델을 평가하는 데 유용하며, 결과에 만족하는 경우 의사 결정자와 공유하는 데도 유용합니다. 모델이 구축된 후에 바로 시작할 수 있습니다. 이렇게 하면 데이터 과학자가 사전에 구축한 모델을 구현하여 데이터 세트에 데이터 과학을 적용할 수 있습니다. 그런 다음 이러한 분석 정보를 예측 대시보드에서 공유할 수 있습니다. Amazon QuickSight 서버리스 접근 방식을 사용하면 프로세스가 원활하게 확장되므로 추론 또는 쿼리 용량에 대해 걱정할 필요가 없습니다.
QuickSight Amazon은 회귀 및 분류 알고리즘을 사용하는 SageMaker 모델을 지원합니다. 이 기능을 적용하여 거의 모든 비즈니스 사용 사례에 대한 예측을 얻을 수 있습니다. 몇 가지 예로는 고객 이탈 및 직원 퇴직 가능성 예측, 잠재 고객 점수 산정, 신용 위험 평가 등이 있습니다. QuickSight Amazon을 사용하여 예측을 제공하려면 입력과 출력 모두에 대한 SageMaker 모델 데이터가 표 형식이어야 합니다. 다중 클래스 또는 다중 레이블 분류 사용 사례에서 각 출력 열에는 단일 값이 포함되어야 합니다. QuickSight Amazon은 단일 열 내의 여러 값을 지원하지 않습니다.
주제
SageMaker 통합 작동 방식
일반적으로 이 프로세스는 다음과 같이 작동합니다.
-
Amazon QuickSight 관리자가 Amazon이 액세스할 QuickSight 수 있는 권한을 추가합니다 SageMaker. 이렇게 하려면 관리 QuickSight 페이지에서 보안 및 권한 설정을 여십시오. AWS서비스 QuickSight 액세스로 이동하여 추가하십시오 SageMaker.
이러한 권한을 추가하면 AWS 계정 내 모든 SageMaker 모델을 나열할 수 있는 액세스 권한을 제공하는 AWS Identity and Access Management (IAM) 역할에 QuickSight Amazon이 추가됩니다. 또한 이름 앞에 접두사가 붙은 SageMaker 작업을 실행할 수 있는 권한도 제공합니다.
quicksight-auto-generated-
-
데이터 사전 처리가 자동으로 수행되므로 추론 파이프라인이 있는 SageMaker 모델에 연결하는 것이 좋습니다. 자세한 내용은 개발자 안내서의 추론 파이프라인 배포를 SageMaker 참조하십시오.
-
함께 사용할 데이터와 사전 훈련된 모델을 식별하면 모델 소유자가 스키마 파일을 생성하여 제공합니다. 이 JSON 파일은 계약서입니다. SageMaker 모델에 필요한 필드, 데이터 형식, 열 순서, 출력 및 설정에 대한 메타데이터를 제공합니다. 선택적 설정 구성 요소는 작업에 사용할 컴퓨팅 인스턴스의 크기와 개수를 지정합니다.
모델을 구축한 데이터 과학자인 경우, 다음에서 설명하는 형식을 사용하여 이 스키마 파일을 생성합니다. 모델 사용자는 모델 소유자로부터 스키마 파일을 가져옵니다.
-
QuickSightAmazon에서는 먼저 예측하려는 데이터로 새 데이터 세트를 만듭니다. 파일을 업로드하는 경우 업로드 설정 화면에서 SageMaker 모델을 추가할 수 있습니다. 그렇지 않으면 데이터 준비 페이지에서 모델을 추가합니다.
계속하기 전에 데이터 세트와 모델 간의 매핑을 확인합니다.
-
데이터를 데이터세트로 가져온 후 출력 필드에는 에서 반환된 데이터가 포함됩니다. SageMaker 이러한 필드는 사용 지침에서 설명하는 지침에 따라 다른 필드를 사용하는 것과 같은 방식으로 사용할 수 있습니다.
SageMaker 통합을 실행하면 Amazon은 추론 파이프라인을 사용하여 일괄 변환 작업을 SageMaker 실행하라는 요청을 QuickSight 전달합니다. QuickSight Amazon은 AWS 계정에 필요한 인스턴스의 프로비저닝 및 배포를 시작합니다. 처리가 완료되면 이러한 인스턴스가 종료됩니다. 컴퓨팅 용량은 모델을 처리할 때만 비용이 발생합니다.
쉽게 식별할 수 있도록 Amazon은 모든 SageMaker 작업의 QuickSight 이름을 접두사로
quicksight-auto-generated-
지정합니다. -
추론의 출력은 SPICE에 저장되고 데이터 세트에 추가됩니다. 추론이 완료되는 즉시 데이터 세트를 통해 예측 데이터를 사용하여 시각화 및 대시보드를 생성할 수 있습니다.
-
데이터 세트를 저장할 때마다 데이터 새로 고침이 시작됩니다. SPICE 데이터 세트를 새로 고쳐 수동으로 데이터 새로 고침 프로세스를 시작하거나 일정 간격으로 새로 고침이 실행되도록 예약할 수 있습니다. 데이터를 새로 고칠 때마다 시스템은 자동으로 SageMaker batch transform을 호출하여 출력 필드를 새 데이터로 업데이트합니다.
Amazon QuickSight SPICE 통합 API 작업을 사용하여 데이터 새로 고침 프로세스를 제어할 수 있습니다. 이러한 API 작업을 사용하는 방법에 대한 자세한 내용은 Amazon QuickSight API 참조를 참조하십시오.
발생 비용(통합 자체에 대한 추가 비용 없음)
통합 기능을 사용하는 것 자체로는 추가 요금이 발생하지 않습니다. 비용에는 다음이 포함됩니다.
-
모델 배포 비용. 이 비용은 모델이 실행 중일 때만 발생합니다. SageMaker 생성 또는 편집한 후 데이터 세트를 저장하거나 데이터를 새로 고치면 데이터 수집 프로세스가 시작됩니다. 이 프로세스에는 데이터세트에 유추된 SageMaker 필드가 있는 경우 호출이 포함됩니다. 구독하는 계정과 동일한 AWS 계정에서 비용이 발생합니다. QuickSight
-
QuickSight 구독 비용은 다음과 같습니다.
-
인메모리 계산 엔진의 데이터를 QuickSight (SPICE) 에 저장하는 데 드는 비용. SPICE에 새 데이터를 추가하는 경우, 데이터를 수용하기에 충분한 SPICE 용량을 구입해야 할 수 있습니다.
-
QuickSight 데이터세트를 작성하는 작성자 또는 관리자를 위한 구독.
-
P 시청자 (독자) 가 대화형 대시보드에 액세스할 경우 ay-per-session 요금이 부과됩니다.
-
사용 지침
QuickSightAmazon에서는 이 엔터프라이즈 에디션 기능에 다음과 같은 사용 지침이 적용됩니다.
-
모델의 처리는 SPICE에서 이루어집니다. 따라서 SPICE에 저장된 데이터 세트에만 적용할 수 있습니다. 이 프로세스는 현재 데이터 세트당 최대 5억 개의 행을 지원합니다.
-
QuickSight 관리자 또는 작성자만 ML 모델로 데이터세트를 보강할 수 있습니다. 독자는 대시보드에 포함된 경우에만 결과를 볼 수 있습니다.
-
각 데이터 세트에 오직 하나의 ML 모델을 사용할 수 있습니다.
-
출력 필드는 새 필드를 계산하는 데 사용할 수 없습니다.
-
데이터 세트는 모델과 통합된 필드별로 필터링할 수 없습니다. 즉, 데이터 세트 필드가 현재 ML 모델에 매핑되어 있으면 해당 필드를 필터링 할 수 없습니다.
SageMaker에서는 QuickSight Amazon에서 사용하는 사전 학습된 모델에 다음 사용 지침이 적용됩니다.
-
모델을 생성할 때 해당 IAM 역할에 대한 Amazon 리소스 이름(ARN)과 모델을 연결합니다. SageMaker 모델의 IAM 역할은 Amazon이 QuickSight 사용하는 Amazon S3 버킷에 액세스할 수 있어야 합니다.
-
모델이 입력 및 출력 모두에 대해 .csv 파일을 지원하는지 확인합니다. 데이터가 표 형식인지 확인합니다.
-
입력 및 출력 필드 목록을 포함하여 모델에 대한 메타데이터가 들어 있는 스키마 파일을 제공합니다. 현재는 이 스키마 파일을 수동으로 생성해야 합니다.
-
추론을 완료하는 데 걸리는 시간을 고려합니다. 이 시간은 여러 가지 요인에 따라 달라집니다. 여기에는 모델의 복잡성, 데이터 양, 정의된 컴퓨팅 용량 등이 포함됩니다. 추론을 완료하는 데는 몇 분에서 몇 시간이 걸릴 수 있습니다. QuickSight Amazon은 모든 데이터 수집 및 추론 작업을 최대 10시간으로 제한합니다. 추론에 소요되는 시간을 줄이기 위해 인스턴스 크기 또는 인스턴스 수를 늘리는 것이 좋습니다.
-
현재는 실시간 데이터가 아닌 통합에는 일괄 변환만 사용할 수 있습니다. SageMaker SageMaker 엔드포인트는 사용할 수 없습니다.
스키마 파일 정의
Amazon QuickSight 데이터가 포함된 SageMaker 모델을 사용하기 전에 Amazon에서 모델을 처리하는 데 QuickSight 필요한 메타데이터가 포함된 JSON 스키마 파일을 생성하십시오. Amazon QuickSight 작성자 또는 관리자는 데이터세트를 구성할 때 스키마 파일을 업로드합니다.
스키마 필드는 다음과 같이 정의됩니다. 다음 설명에 달리 명시되지 않은 한 모든 필드가 필요합니다. 속성은 대소문자를 구분합니다.
- inputContentType
-
이 SageMaker 모델이 입력 데이터에 대해 기대하는 콘텐츠 유형.
"text/csv"
값만 지원됩니다. QuickSight 입력 파일에 추가한 헤더 이름은 포함되지 않습니다. - outputContentType
-
사용하려는 SageMaker 모델에서 생성된 출력물의 콘텐츠 유형입니다.
"text/csv"
값만 지원됩니다. - 입력
-
모델에서 입력 데이터에 필요한 기능 목록입니다. QuickSight 입력 데이터를 정확히 같은 순서로 생성합니다. 이 목록에는 다음 속성이 포함됩니다.
-
name - 열의 이름입니다. 가능하면 이 이름을 QuickSight 데이터셋의 해당 열 이름과 동일하게 만드세요. 이 속성은 100자로 제한됩니다.
-
type - 이 열의 데이터 형식입니다. 이 속성은
"INTEGER"
,"STRING"
및"DECIMAL"
값을 갖습니다. -
nullable - (선택 사항) 필드의 null 허용 여부입니다. 기본 값은
true
입니다.nullable
로 설정하면 SageMaker 호출하기false
전에 이 값이 포함되지 않은 행을 QuickSight 삭제합니다. 이렇게 하면 필수 데이터가 누락되어 오류가 발생하는 SageMaker 것을 방지할 수 있습니다.
-
- output
-
SageMaker 모델이 생성하는 출력 열 목록. QuickSight이 필드의 순서가 정확히 같을 것으로 예상됩니다. 이 목록에는 다음 속성이 포함됩니다.
-
이름 — 이 이름은 에서 생성되는 해당 새 열의 기본 이름이 QuickSight 됩니다. 여기에 지정된 이름을 재정의할 수 있습니다. QuickSight 이 속성은 100자로 제한됩니다.
-
type - 이 열의 데이터 형식입니다. 이 속성은
"INTEGER"
,"STRING"
및"DECIMAL"
값을 갖습니다.
-
- instanceTypes
-
변환 작업을 실행하기 위해 SageMaker 프로비저닝할 수 있는 ML 인스턴스 유형의 목록입니다. 목록은 QuickSight 사용자가 선택할 수 있도록 제공됩니다. 이 목록은 에서 지원하는 유형으로 제한됩니다 SageMaker. 지원되는 유형에 대한 자세한 내용은 SageMaker개발자 안내서를 참조하십시오 TransformResources.
- defaultInstanceType
-
(선택 사항) SageMaker 마법사에서 기본 옵션으로 표시되는 인스턴스 QuickSight 유형입니다.
instanceTypes
에 이 인스턴스 유형을 포함합니다. - instanceCount
-
(선택 사항) 인스턴스 수는 변환 작업을 SageMaker 실행하기 위해 프로비저닝하기 위해 선택한 인스턴스 수를 정의합니다. 값은 양의 정수여야 합니다.
- description
-
이 필드는 모델을 소유한 사람이 에서 QuickSight 이 SageMaker 모델을 사용하는 사람과 소통할 수 있는 공간을 제공합니다. 이 모델을 성공적으로 사용하기 위한 팁을 이 필드에 제공합니다. 예를 들어, 이 필드에는 데이터 세트의 크기에 따라
instanceTypes
의 목록에서 효과적인 인스턴스 유형을 선택하는 방법에 대한 정보가 포함될 수 있습니다. 이 필드는 1,000자로 제한됩니다. - version
-
스키마의 버전(예: "
1.0"
)입니다.
다음 예에서는 스키마 파일의 JSON 구조를 보여줍니다.
{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }
스키마 파일의 구조는 에서 제공한 SageMaker 예제에 사용된 모델의 종류와 관련이 있습니다.
QuickSight 데이터세트에 SageMaker 모델 추가
다음 절차에 따라 사전 훈련된 SageMaker 모델을 데이터세트에 추가하여 분석 및 대시보드에서 예측 데이터를 사용할 수 있습니다.
시작하기 전에 다음 항목을 준비합니다.
-
데이터 세트를 빌드하는 데 사용할 데이터
-
데이터세트를 보강하는 데 사용하려는 SageMaker 모델의 이름.
-
모델의 스키마. 이 스키마에는 필드 이름 매핑과 데이터 형식이 포함됩니다. 사용할 인스턴스 유형 및 인스턴스 수에 대한 권장 설정도 포함되어 있는 것이 좋습니다.
Amazon QuickSight 데이터 세트를 보강하려면 SageMaker
-
데이터 세트를 선택한 다음 새 데이터 세트를 선택하여, 시작 페이지에서 새 데이터 세트를 생성합니다.
또한 기존 데이터 세트를 편집할 수도 있습니다.
-
데이터 준비 화면에서 Augment SageMaker with를 선택합니다.
-
모델 선택에서 다음 설정을 선택합니다.
-
모델 — 필드를 유추하는 데 사용할 SageMaker 모델을 선택합니다.
-
이름 - 모델을 설명하는 이름을 입력합니다.
-
스키마 - 모델에 제공된 JSON 스키마 파일을 업로드합니다.
-
고급 설정 - QuickSight 데이터셋을 기반으로 선택한 기본값을 권장합니다. 필요할 경우 특정 런타임 설정을 사용하여 작업 속도와 비용의 균형을 조정할 수 있습니다. 이렇게 하려면 인스턴스 유형에는 SageMaker ML 인스턴스 유형을, Count에는 인스턴스 수를 입력합니다.
다음을 선택하여 계속 진행합니다.
-
-
리뷰 입력의 경우 데이터세트에 매핑된 필드를 검토하세요. QuickSight 스키마의 필드를 데이터세트의 필드에 자동으로 매핑하려고 시도합니다. 매핑을 조정해야 하는 경우 여기에서 변경할 수 있습니다.
다음을 선택하여 계속 진행합니다.
-
출력 검토에서 데이터 세트에 추가된 필드를 봅니다.
데이터 저장 및 준비를 선택하여 선택 사항을 확인합니다.
-
데이터를 새로 고치려면 데이터 세트를 선택하여 세부 정보를 확인합니다. 그런 다음 지금 새로 고침을 선택하여 수동으로 데이터를 새로 고치거나 새로 고침 예약을 선택하여 정기적인 새로 고침 간격을 설정합니다. 데이터를 새로 고칠 때마다 시스템이 자동으로 SageMaker 배치 변환 작업을 실행하여 출력 필드를 새 데이터로 업데이트합니다.