Amazon SageMaker AI 모델과 Amazon 통합 QuickSight - Amazon QuickSight

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker AI 모델과 Amazon 통합 QuickSight

참고

Amazon에서 ML 기반 기능을 사용하는 분석 및 대시보드를 작성하기 위해 기계 학습(ML)에 대한 기술 경험이 필요하지 않습니다 QuickSight.

Amazon SageMaker AI 기계 학습 모델을 사용하여 Amazon QuickSight Enterprise 에디션 데이터를 보강할 수 있습니다. 에 저장된 데이터에 대해 추론을 실행할 수 있습니다.SPICE Amazon에서 지원하는 모든 데이터 소스에서 가져온 것입니다 QuickSight. 지원되는 데이터 소스의 전체 목록은 지원되는 데이터 소스 단원을 참조하세요.

Amazon을 SageMaker AI 모델 QuickSight 과 함께 사용하면 데이터 이동을 관리하고 코드를 작성하는 데 드는 시간을 절약할 수 있습니다. 결과는 모델을 평가하는 데 유용하며, 결과에 만족하는 경우 의사 결정자와 공유하는 데도 유용합니다. 모델이 구축된 후에 바로 시작할 수 있습니다. 이렇게 하면 데이터 과학자가 사전에 구축한 모델을 구현하여 데이터 세트에 데이터 과학을 적용할 수 있습니다. 그런 다음 이러한 분석 정보를 예측 대시보드에서 공유할 수 있습니다. Amazon QuickSight 서버리스 접근 방식을 사용하면 프로세스가 원활하게 확장되므로 추론 또는 쿼리 용량에 대해 걱정할 필요가 없습니다.

Amazon은 회귀 및 분류 알고리즘을 사용하는 SageMaker AI 모델을 QuickSight 지원합니다. 이 기능을 적용하여 거의 모든 비즈니스 사용 사례에 대한 예측을 얻을 수 있습니다. 몇 가지 예로는 고객 이탈 및 직원 퇴직 가능성 예측, 잠재 고객 점수 산정, 신용 위험 평가 등이 있습니다. Amazon QuickSight 을 사용하여 예측을 제공하려면 입력 및 출력 모두에 대한 SageMaker AI 모델 데이터가 테이블 형식이어야 합니다. 다중 클래스 또는 다중 레이블 분류 사용 사례에서 각 출력 열에는 단일 값이 포함되어야 합니다. Amazon QuickSight 은 단일 열 내에서 여러 값을 지원하지 않습니다.

SageMaker AI 통합 작동 방식

일반적으로 이 프로세스는 다음과 같이 작동합니다.

  1. Amazon QuickSight 관리자는 Amazon이 SageMaker AI에 액세스할 QuickSight 수 있는 권한을 추가합니다. 이렇게 하려면 관리 QuickSight 페이지에서 보안 및 권한 설정을 엽니다. QuickSight AWS 서비스에 대한 액세스로 이동하여 SageMaker AI를 추가합니다.

    이러한 권한을 추가하면 AWS 계정의 모든 SageMaker AI 모델을 나열할 수 있는 액세스 권한을 제공하는 AWS Identity and Access Management (IAM) 역할에 Amazon이 QuickSight 추가됩니다. 또한 접두사가 인 이름이 있는 SageMaker AI 작업을 실행할 수 있는 권한을 제공합니다quicksight-auto-generated-.

  2. 추론 파이프라인이 있는 SageMaker AI 모델에 연결하는 것이 좋습니다. 데이터 사전 처리를 자동으로 수행하기 때문입니다. 자세한 내용은 AI 개발자 안내서의 추론 파이프라인 배포를 참조하세요. SageMaker

  3. 함께 사용할 데이터와 사전 훈련된 모델을 식별하면 모델 소유자가 스키마 파일을 생성하여 제공합니다. 이 JSON 파일은 SageMaker AI와의 계약입니다. 모델에 필요한 필드, 데이터 형식, 열 순서, 출력 및 설정에 대한 메타데이터를 제공합니다. 선택적 설정 구성 요소는 작업에 사용할 컴퓨팅 인스턴스의 크기와 개수를 지정합니다.

    모델을 구축한 데이터 과학자인 경우, 다음에서 설명하는 형식을 사용하여 이 스키마 파일을 생성합니다. 모델 사용자는 모델 소유자로부터 스키마 파일을 가져옵니다.

  4. Amazon에서는 예측하려는 데이터로 새 데이터 세트를 생성하는 것으로 QuickSight시작합니다. 파일을 업로드하는 경우 업로드 설정 화면에서 SageMaker AI 모델을 추가할 수 있습니다. 그렇지 않으면 데이터 준비 페이지에서 모델을 추가합니다.

    계속하기 전에 데이터 세트와 모델 간의 매핑을 확인합니다.

  5. 데이터를 데이터 세트로 가져오면 출력 필드에 SageMaker AI에서 반환된 데이터가 포함됩니다. 이러한 필드는 사용 지침에서 설명하는 지침에 따라 다른 필드를 사용하는 것과 같은 방식으로 사용할 수 있습니다.

    SageMaker AI 통합을 실행하면 Amazon은 추론 파이프라인을 사용하여 배치 변환 작업을 실행하라는 요청을 SageMaker AI에 QuickSight 전달합니다. Amazon은 AWS 계정에 필요한 인스턴스의 프로비저닝 및 배포를 QuickSight 시작합니다. 처리가 완료되면 이러한 인스턴스가 종료됩니다. 컴퓨팅 용량은 모델을 처리할 때만 비용이 발생합니다.

    이를 쉽게 식별할 수 있도록 Amazon은 접두사 로 모든 SageMaker AI 작업의 QuickSight 이름을 지정합니다quicksight-auto-generated-.

  6. 추론의 출력은에 저장됩니다.SPICE 및가 데이터 세트에 추가되었습니다. 추론이 완료되는 즉시 데이터 세트를 통해 예측 데이터를 사용하여 시각화 및 대시보드를 생성할 수 있습니다.

  7. 데이터 세트를 저장할 때마다 데이터 새로 고침이 시작됩니다. 를 새로 고쳐 수동으로 데이터 새로 고침 프로세스를 시작할 수 있습니다.SPICE 데이터 세트 또는 정기적으로 실행되도록 예약할 수 있습니다. 각 데이터 새로 고침 중에 시스템은 SageMaker AI 배치 변환을 자동으로 호출하여 출력 필드를 새 데이터로 업데이트합니다.

    Amazon을 사용할 수 있습니다. QuickSight SPICE 데이터 새로 고침 프로세스를 제어하는 수집 API 작업입니다. 이러한 API 작업 사용에 대한 자세한 내용은 Amazon QuickSight API 참조를 참조하세요.

발생 비용(통합 자체에 대한 추가 비용 없음)

통합 기능을 사용하는 것 자체로는 추가 요금이 발생하지 않습니다. 비용에는 다음이 포함됩니다.

  • 모델이 실행 중일 때만 발생하는 SageMaker AI를 통한 모델 배포 비용입니다. 생성 또는 편집한 후 데이터 세트를 저장하거나 데이터를 새로 고치면 데이터 수집 프로세스가 시작됩니다. 이 프로세스에는 데이터 세트에 추론된 필드가 있는 경우 SageMaker AI 호출이 포함됩니다. QuickSight 구독이 있는 계정과 동일한 AWS 계정에서 비용이 발생합니다.

  • QuickSight 구독 비용은 다음과 같습니다.

    • 의 인 메모리 계산 엔진에 데이터를 저장하는 비용 QuickSight (SPICE). 에 새 데이터를 추가하는 경우 SPICE, 충분히 구매해야 할 수 있습니다.SPICE 수용 가능한 용량입니다.

    • QuickSight 데이터 세트를 빌드하는 작성자 또는 관리자의 구독입니다.

    • Pay-per-session 최종 사용자(읽기 사용자)가 대화형 대시보드에 액세스하기 위한 요금입니다.

사용 지침

Amazon에서는 QuickSight다음 사용 지침이이 Enterprise Edition 기능에 적용됩니다.

  • 모델 처리는에서 이루어집니다.SPICE따라서 에 저장된 데이터 세트에만 적용할 수 있습니다.SPICE. 이 프로세스는 현재 데이터 세트당 최대 5억 개의 행을 지원합니다.

  • QuickSight 관리자 또는 작성자만 ML 모델을 사용하여 데이터 세트를 보강할 수 있습니다. 독자는 대시보드에 포함된 경우에만 결과를 볼 수 있습니다.

  • 각 데이터 세트에 오직 하나의 ML 모델을 사용할 수 있습니다.

  • 출력 필드는 새 필드를 계산하는 데 사용할 수 없습니다.

  • 데이터 세트는 모델과 통합된 필드별로 필터링할 수 없습니다. 즉, 데이터 세트 필드가 현재 ML 모델에 매핑되어 있으면 해당 필드를 필터링 할 수 없습니다.

SageMaker AI에서는 Amazon에서 사용하는 사전 훈련된 모델에 다음 사용 지침이 적용됩니다. QuickSight

  • 모델을 생성할 때 모델을 적절한 IAM 역할의 Amazon 리소스 이름(ARN)과 연결합니다. SageMaker AI 모델의 IAM 역할은 Amazon이 QuickSight 사용하는 Amazon S3 버킷에 액세스할 수 있어야 합니다.

  • 모델이 입력 및 출력 모두에 대해 .csv 파일을 지원하는지 확인합니다. 데이터가 표 형식인지 확인합니다.

  • 입력 및 출력 필드 목록을 포함하여 모델에 대한 메타데이터가 들어 있는 스키마 파일을 제공합니다. 현재는 이 스키마 파일을 수동으로 생성해야 합니다.

  • 추론을 완료하는 데 걸리는 시간을 고려합니다. 이 시간은 여러 가지 요인에 따라 달라집니다. 여기에는 모델의 복잡성, 데이터 양, 정의된 컴퓨팅 용량 등이 포함됩니다. 추론을 완료하는 데는 몇 분에서 몇 시간이 걸릴 수 있습니다. Amazon은 모든 데이터 수집 및 추론 작업을 최대 10시간으로 QuickSight 제한합니다. 추론에 소요되는 시간을 줄이기 위해 인스턴스 크기 또는 인스턴스 수를 늘리는 것이 좋습니다.

  • 현재는 실시간 데이터가 아닌 SageMaker AI와의 통합에 배치 변환만 사용할 수 있습니다. SageMaker AI 엔드포인트는 사용할 수 없습니다.

스키마 파일 정의

Amazon QuickSight 데이터와 함께 SageMaker AI 모델을 사용하기 전에 Amazon이 모델을 처리하는 데 QuickSight 필요한 메타데이터가 포함된 JSON 스키마 파일을 생성합니다. Amazon QuickSight 작성자 또는 관리자는 데이터 세트를 구성할 때 스키마 파일을 업로드합니다.

스키마 필드는 다음과 같이 정의됩니다. 다음 설명에 달리 명시되지 않은 한 모든 필드가 필요합니다. 속성은 대소문자를 구분합니다.

inputContentType

이 SageMaker AI 모델이 입력 데이터에 대해 기대하는 콘텐츠 유형입니다. 이에 대해 지원되는 유일한 값은 입니다"text/csv". 에는 입력 파일에 추가하는 헤더 이름이 포함되지 QuickSight 않습니다.

outputContentType

사용하려는 SageMaker AI 모델에서 생성되는 출력의 콘텐츠 유형입니다. "text/csv" 값만 지원됩니다.

입력

모델이 입력 데이터에서 기대하는 기능 목록입니다.는 정확히 동일한 순서로 입력 데이터를 QuickSight 생성합니다. 이 목록에는 다음 속성이 포함됩니다.

  • name - 열의 이름입니다. 가능하면 데이터 QuickSight 세트의 해당 열 이름과 동일하게 설정합니다. 이 속성은 100자로 제한됩니다.

  • type - 이 열의 데이터 형식입니다. 이 속성은 "INTEGER", "STRING""DECIMAL" 값을 갖습니다.

  • nullable - (선택 사항) 필드의 null 허용 여부입니다. 기본값은 true입니다. 를 nullable로 설정하면 SageMaker AI를 호출하기 전에이 값을 포함하지 않는 행을 false QuickSight 삭제합니다. 이렇게 하면 누락된 필수 데이터에서 SageMaker AI가 실패하는 것을 방지할 수 있습니다.

output

SageMaker AI 모델이 생성하는 출력 열의 목록입니다. QuickSight는 이러한 필드를 정확히 동일한 순서로 예상합니다. 이 목록에는 다음 속성이 포함됩니다.

  • name -이 이름은에서 생성된 해당 새 열의 기본 이름이 됩니다 QuickSight. 에서 여기에 지정된 이름을 재정의할 수 있습니다 QuickSight. 이 속성은 100자로 제한됩니다.

  • type - 이 열의 데이터 형식입니다. 이 속성은 "INTEGER", "STRING""DECIMAL" 값을 갖습니다.

instanceTypes

SageMaker AI가 변환 작업을 실행하기 위해 프로비저닝할 수 있는 ML 인스턴스 유형의 목록입니다. 목록은 선택할 수 있도록 QuickSight 사용자에게 제공됩니다. 이 목록은 SageMaker AI에서 지원하는 유형으로 제한됩니다. 지원되는 유형에 대한 자세한 내용은 AI 개발자 안내서TransformResources의 섹션을 참조하세요. SageMaker

defaultInstanceType

(선택 사항)의 SageMaker AI 마법사에서 기본 옵션으로 표시되는 인스턴스 유형입니다 QuickSight. instanceTypes에 이 인스턴스 유형을 포함합니다.

instanceCount

(선택 사항) 인스턴스 수는 SageMaker AI가 변환 작업을 실행하기 위해 프로비저닝할 선택한 인스턴스 수를 정의합니다. 값은 양의 정수여야 합니다.

description

이 필드는 SageMaker AI 모델을 소유한 사람이이 모델을 사용하는 사람과 통신할 수 있는 공간을 제공합니다 QuickSight. 이 모델을 성공적으로 사용하기 위한 팁을 이 필드에 제공합니다. 예를 들어, 이 필드에는 데이터 세트의 크기에 따라 instanceTypes의 목록에서 효과적인 인스턴스 유형을 선택하는 방법에 대한 정보가 포함될 수 있습니다. 이 필드는 1,000자로 제한됩니다.

version

스키마의 버전(예: "1.0")입니다.

다음 예제는 스키마 파일JSON에서의 구조를 보여줍니다.

{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }

스키마 파일의 구조는 SageMaker AI에서 제공하는 예제에서 사용되는 모델 유형과 관련이 있습니다.

QuickSight 데이터 세트에 SageMaker AI 모델 추가

다음 절차를 사용하여 데이터 세트에 사전 훈련된 SageMaker AI 모델을 추가하여 분석 및 대시보드에서 예측 데이터를 사용할 수 있습니다.

시작하기 전에 다음 항목을 준비합니다.

  • 데이터 세트를 빌드하는 데 사용할 데이터

  • 데이터 세트를 보강하는 데 사용할 SageMaker AI 모델의 이름입니다.

  • 모델의 스키마. 이 스키마에는 필드 이름 매핑과 데이터 형식이 포함됩니다. 사용할 인스턴스 유형 및 인스턴스 수에 대한 권장 설정도 포함되어 있는 것이 좋습니다.

SageMaker AI로 Amazon QuickSight 데이터 세트를 강화하려면
  1. 데이터 세트를 선택한 다음 새 데이터 세트를 선택하여, 시작 페이지에서 새 데이터 세트를 생성합니다.

    또한 기존 데이터 세트를 편집할 수도 있습니다.

  2. 데이터 준비 화면에서 로 보강 SageMaker을 선택합니다.

  3. 모델 선택에서 다음 설정을 선택합니다.

    • 모델 - 필드를 추론하는 데 사용할 SageMaker AI 모델을 선택합니다.

    • 이름 - 모델을 설명하는 이름을 입력합니다.

    • 스키마 JSON - 모델에 제공된 스키마 파일을 업로드합니다.

    • 고급 설정 - QuickSight는 데이터 세트를 기반으로 선택한 기본값을 권장합니다. 필요할 경우 특정 런타임 설정을 사용하여 작업 속도와 비용의 균형을 조정할 수 있습니다. 이렇게 하려면 인스턴스 유형에 SageMaker AI ML 인스턴스 유형을 입력하고 개수에 인스턴스 수를 입력합니다.

    다음을 선택하여 계속 진행합니다.

  4. 입력 검토의 경우 dataset. QuickSight attempts에 매핑된 필드를 검토하여 스키마의 필드를 데이터 세트의 필드에 자동으로 매핑합니다. 매핑을 조정해야 하는 경우 여기에서 변경할 수 있습니다.

    다음을 선택하여 계속 진행합니다.

  5. 출력 검토에서 데이터 세트에 추가된 필드를 봅니다.

    데이터 저장 및 준비를 선택하여 선택 사항을 확인합니다.

  6. 데이터를 새로 고치려면 데이터 세트를 선택하여 세부 정보를 확인합니다. 그런 다음 지금 새로 고침을 선택하여 수동으로 데이터를 새로 고치거나 새로 고침 예약을 선택하여 정기적인 새로 고침 간격을 설정합니다. 각 데이터 새로 고침 중에 시스템은 SageMaker AI 배치 변환 작업을 자동으로 실행하여 출력 필드를 새 데이터로 업데이트합니다.