시각화 및 데이터 인사이트 생성 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

시각화 및 데이터 인사이트 생성

데이터를 Data Wrangler로 가져온 후 이를 사용하여 시각화 및 데이터 인사이트를 생성할 수 있습니다.

  • 시각화: Data Wrangler는 히스토그램, 스캐터 차트 등 다양한 유형의 그래프를 생성할 수 있습니다. 예를 들어, 히스토그램을 생성하여 데이터의 특이값을 식별할 수 있습니다.

  • 데이터 인사이트: Personalize의 데이터 품질 및 인사이트 보고서를 사용하여 데이터 인사이트와 열 및 행 통계를 통해 데이터에 대해 학습할 수 있습니다. 이 보고서를 통해 데이터에 유형 문제가 있는지 알 수 있습니다. 또한 데이터를 개선하기 위해 어떤 조치를 취할 수 있는지 학습할 수 있습니다. 이러한 조치는 모델 교육 요구 사항과 같은 Personalize 리소스 요구 사항을 충족하는 데 도움을 줄 수 있거나 추천을 개선할 수 있습니다.

시각화와 인사이트를 통해 데이터에 대해 학습하게 되면 이 정보를 사용하여 추가 변환을 적용하여 데이터를 개선할 수 있습니다. 또는 데이터 준비를 완료한 경우 데이터를 처리하고 Personalize로 가져올 수도 있습니다. 데이터 변환에 대한 자세한 내용은 데이터 변환단원을 참조하세요. 데이터 처리 및 가져오기에 대한 자세한 내용은 데이터를 처리하고 Personalize로 가져오기단원을 참조하세요.

시각화 생성

Data Wrangler를 사용하여 히스토그램, 스캐터 차트 등 다양한 유형의 그래프를 생성할 수 있습니다. 예를 들어, 히스토그램을 생성하여 데이터의 특이값을 식별할 수 있습니다. 데이터 시각화를 생성하려면 흐름에 분석 단계를 추가하고 분석 유형에서 생성하려는 시각화를 선택합니다.

Data Wrangler에서 시각화를 생성하는 방법에 대한 자세한 내용은 Amazon 개발자 안내서의 분석 및 시각화를 참조하십시오. SageMaker

데이터 인사이트 생성

Data Wrangler를 사용하여 데이터세트 유형에 맞는 Personalize용 데이터 품질 및 인사이트 보고서를 생성할 수 있습니다. 보고서를 생성하기 전에 Personalize 요구 사항을 충족하도록 데이터를 변환하는 것이 좋습니다. 이렇게 하면 보다 관련성이 높은 인사이트를 얻을 수 있습니다. 자세한 내용은 데이터 변환단원을 참조하세요.

보고서 콘텐츠

Personalize용 데이터 품질 및 인사이트 보고서에는 다음 단원이 포함됩니다.

  • 요약: 보고서 요약에는 데이터세트 통계와 우선순위가 높은 경고가 포함됩니다.

    • 데이터세트 통계: 여기에는 Personalize의 특정 통계(예: 상호작용 데이터의 고유 사용자의 수) 및 일반 통계(예: 누락된 값 또는 특이값의 수)가 포함됩니다.

    • 우선 순위가 높은 경고: 교육 또는 추천에 가장 큰 영향을 미치는 Personalize의 특정 인사이트입니다. 각 경고에는 문제를 해결하기 위해 취할 수 있는 권장 조치가 포함되어 있습니다.

  • 중복된 행 및 불완전한 행: 이들 단원에는 누락된 값이 있는 행과 데이터에서 중복된 행에 대한 정보가 포함되어 있습니다.

  • 특성 요약: 이 단원에는 각 열의 데이터 유형, 유효하지 않거나 누락된 데이터 정보, 경고 개수가 포함되어 있습니다.

  • 특성 세부 정보: 이 단원에는 각 데이터 열에 대한 세부 정보가 포함된 하위 단원이 포함되어 있습니다. 각 하위 단원에는 범주형 값의 수, 누락값 정보와 같은 열에 대한 통계가 포함되어 있습니다. 그리고 각 하위 단원에는 데이터 열에 대한 Personalize의 특정 인사이트와 권장 조치가 포함되어 있습니다. 예를 들어, 한 열에 30개 이상의 범주가 있다는 인사이트가 표시될 수 있습니다.

데이터 유형 문제

보고서는 데이터 유형이 올바르지 않은 열을 식별하고 필수 유형을 지정합니다. 이러한 특성과 관련된 인사이트를 얻으려면 열의 데이터 유형을 변환하고 보고서를 다시 생성해야 합니다. 유형을 전환하려면 Data Wrangler 변환 유형으로 파스 값을 사용할 수 있습니다.

Personalize 인사이트

Personalize 인사이트에는 조사 결과와 제안된 조치가 포함됩니다. 이 조치는 선택 사항입니다. 예를 들어, 보고서에는 범주형 데이터 열에 대한 범주의 수와 관련된 인사이트와 조치가 포함될 수 있습니다. 열이 범주형이라고 생각하지 않으면 이 통계를 무시하고 어떤 조치도 취하지 않아도 됩니다.

사소한 표현의 차이를 제외하고, Personalize의 특정 인사이트는 Personalize로 데이터를 분석할 때 생성할 수 있는 단일 데이터세트 인사이트와 동일합니다. 예를 들어, Data Wrangler의 인사이트 보고서에는 “항목 상호 작용 데이터 세트에 상호 작용이 2번 이상 있는 순 사용자가 X명뿐입니다."와 같은 인사이트가 포함되어 있습니다. 하지만 “항목 데이터 세트에 있는 항목 중 X%에 항목 상호 작용 데이터 세트에서 상호 작용이 없음"과 같은 인사이트는 포함되지 않습니다.

가능한 Personalize의 특정 인사이트 목록은 데이터 인사이트에서 여러 데이터세트를 참조하지 않는 인사이트를 참조하세요.

보고서 예

Personalize 보고서의 모양과 느낌은 Data Wrangler의 일반 인사이트 보고서와 동일합니다. 일반 인사이트 보고서의 예는 Amazon SageMaker 개발자 안내서의 데이터 및 데이터 품질에 대한 인사이트 얻기를 참조하십시오. 다음 예제는 항목 상호 작용 데이터 세트에 대한 보고서의 요약 섹션을 보여줍니다. 여기에는 데이터 세트 통계와 우선순위가 높을 수 있는 몇 가지 항목 상호 작용 데이터 세트 경고가 포함됩니다.

항목 상호 작용 데이터세트에 대한 보고서의 요약 섹션을 설명합니다.

다음 예시는 항목 상호작용 데이터세트의 EVENT _ TYPE 열에 대한 기능 세부정보 섹션이 보고서에 어떻게 표시되는지 보여줍니다.

항목 상호작용 데이터세트의 EVENT _ TYPE 열에 대한 기능 세부정보 섹션을 보여줍니다.

보고서 생성

Personalize용 데이터 품질 및 인사이트 보고서를 생성하려면 변환에 대한 데이터 인사이트 얻기를 선택하고 분석을 생성합니다.

Personalize용 데이터 품질 및 인사이트 보고서를 생성하려면
  1. 분석 중인 변환에 대해 + 옵션을 선택합니다. 변환을 추가하지 않은 경우, 데이터 유형 변환에 대해 +를 선택합니다. Data Wrangler는 이 변환을 흐름에 자동으로 추가합니다.

  2. 데이터 인사이트 얻기를 선택합니다. 분석 생성 패널이 표시됩니다.

  3. 분석 유형의 경우 Personalize용 데이터 품질 및 인사이트 보고서를 선택합니다.

  4. 데이터세트 유형의 경우 분석 중인 Personalize 데이터세트의 유형을 선택합니다.

  5. 원하는 대로 전체 데이터에 대해 실행을 선택합니다. 기본 설정으로 Data Wrangler는 데이터 샘플에 대한 인사이트만 생성합니다.

  6. 생성(Create)을 선택합니다. 분석이 완료되면 보고서가 표시됩니다.